果壳AI工具导航

DeepSeek-R1深度解析：推理能力接近o1但成本仅1/30（Semianalysis）

AI资讯

DeepSeek-R1深度解析：推理能力接近o1但成本仅1/30（Semianalysis）

海外评测编译 2026年04月28日 38 阅读

DeepSeek-R1 671B MoE模型：推理基准接近o1水平，训练成本仅$5.5M(vs o1估计$150M+)。

核心技术

MoE架构——671B参数仅37B活跃/token，推理成本低
GRPO训练——无需额外Critic模型的强化学习
蒸馏小模型——32B蒸馏版超越同级密集模型

开源(MIT许可)，本地部署(8xA100可运行)。性价比最高的推理模型。

编译来源：Semianalysis (2026)