Meta 发布 Llama 3.1 系列,最大参数规模达 405B,在多项开源基准中超越 GPT-4。这也是开源大模型首次在强化指令跨越商业强模型。

DeepSeek-R1 则在推理能力上表现出色,在数学、编程和逻辑推理领域接近 o1,且训练成本仅为商业模型的万分之一。

开源浪潮不仅降低了大模型的使用门槛,也在开发者层面加速了基于大模型的应用繁荣。