开源大模型崛起:Llama 3.1 、DeepSeek-R1 最新进展
Meta 发布 Llama 3.1 系列,最大参数规模达 405B,在多项开源基准中超越 GPT-4。这也是开源大模型首次在强化指令跨越商业强模型。
DeepSeek-R1 则在推理能力上表现出色,在数学、编程和逻辑推理领域接近 o1,且训练成本仅为商业模型的万分之一。
开源浪潮不仅降低了大模型的使用门槛,也在开发者层面加速了基于大模型的应用繁荣。
Meta 发布 Llama 3.1 系列,最大参数规模达 405B,在多项开源基准中超越 GPT-4。这也是开源大模型首次在强化指令跨越商业强模型。
DeepSeek-R1 则在推理能力上表现出色,在数学、编程和逻辑推理领域接近 o1,且训练成本仅为商业模型的万分之一。
开源浪潮不仅降低了大模型的使用门槛,也在开发者层面加速了基于大模型的应用繁荣。