中国在 GPT/LLM 大模型上是否已经实现了弯道超车?

发布时间:
2024-10-19 19:40
阅读量:
1

这个问题真是一言难尽啊!

还是谈一下现状吧。中国的大模型公司与美国的大模型公司其实在数量上可能中国更多一些吧。

美国的

  • OpenAI:No.1,毫无疑问!
  • Google:尽管落了,但是依然是全球第二的实力吧?
  • Meta:开源全靠它家的Llama系列。
  • Microsoft:大家都知道,持有了大部分OpenAI的股份。但是自己的研发实力也是全球顶级的!
  • Anthropic:OpenAI的一半员工干的。
  • StabilityAI:尽管它家LLM不咋地,但是生图厉害啊!
  • EleutherAI:一个以开源开放为目标的非营利机构。
  • EontextualAI: Meta前员工干的。
  • Nvidia:我一直觉得它家都是现在与最后的赢家!

中国的

  • 百度:最早的号称半个年到一个年就能赶上ChatGPT/GPT4。
  • 阿里:Qwen系列已经到了开源领域榜单No.1了,实测效果不错。
  • 字节:豆包是最先搞的一个类似GPT-4o的,好像比它还早一点儿。可以说字节是国内最有实力的吧,它有能力,有数据,有算力。
  • 智谱:最新一笔拿了白袍的钱,好像不差钱,但是差人吧,感觉团队里的人不够多。
  • MiniMax:传闻是国内最早做AGI的,但是真到落地的时候发现没有比后干这事的强在那儿。
  • 第四范式:听过不太了解。
  • 幻方:这个神奇的公司靠做量化搞出了最早的一波价格杀,而且性能居然非常不错。也是开源里最好的一个代码生成大模型。
  • 零一万物:做为李开复主导下的企业给出的答卷还是很不错的。
  • kimi:全球首个把产品干到200万token以上的,效果还很稳定。

===新增加的===

腾讯元宝挺好的

相信你看完这个列表,就能得到结论了吧。

我们除了干到了开源第一,还干到 Token价格全球第一。但是并没有干到所有评测榜单第一。

中国想实现弯道超车,这事可能暂时不太行,未来可能也不太行。

但是,搞一套自己能用的,现在成,未来也一定能成。

我一直在想,弯道超车这事是真的假的,怎么那么多人靠这个来麻痹自己?努力就好了,怎么想歪路?你以为是垂直下落你找个最速路径?不用找距离最近那个?

在技术这件事上,一定要牢记一点:程序员的争论只有通过代码实现。Talking is cheap, show me your code.

同样也适用于大模型这件事上。

但是如果换一个角度想,你可能会看到一个更开阔的世界!

那就是不要管中国是第几,你都要成为会用大模型的那波人。

因为这个时代已经变了,不再是人与人比,而是人与人+Al比,你只是一个人,而对方是一个人加一个超+的技能组合。

所以我一直在强调程序员终身学习的重要性,中国是否实现弯道超车这个话题太大,更重要的是个人机遇,自己要成为会 AI 的那波人,避免被淘汰。AI 这个东西很系统,掌握他最快的方式就是了解底层原理和紧跟当下AI 应用场景,非常建议大家去听听知乎知学堂的 AI大模型公开课,里面有大模型的底层原理与技术,很先进很实用。入口我直接给大家找过来了,直接听就可以⬇️


公开课是孙志岗老师研发的,他之前独立开发的AI大模型评测软件ChatALL.ai,几次登上Github的全球热榜第一,实力不用多说,趁着现在还免费,建议IT人都去看看,如果了解Python 的话收获会更大!

还是那句话,时间不等人,但是你可以抢在时光前面。作为最先嗅到技术变化的程序员,大家千万不要错失先机。

END