全面测试国产主流AI大模型:

测试维度

  • 中文理解能力
  • 知识问答准确性
  • 创意写作能力
  • 代码生成能力
  • 逻辑推理能力

测试结果

通义千问、文心一言、Kimi、智谱清言、讯飞星火等各有优势。

总结建议

  • 日常对话:Kimi、豆包
  • 中文创作:文心一言、通义千问
  • 代码开发:通义千问
  • 长文档处理:Kimi