米哈游9.10备案生成式人工智能Glossa,对此有何见解?

发布时间:
2024-09-14 14:46
阅读量:
2

去年刚看到米哈游在多智能体(Multi-agent)的综述,以为接下来一年会有井喷式的论文扔出来,没想到米哈游即使是科研部门也还是产品先行。。。emm,都是好事。

如果其他答主的猜测属实,这次推出的很可能是语音大模型。在去年上半年百模大战到下半年风向骤冷全面toB的状态下,语音确实是让我觉得眼前一亮的角度。赶紧搜了一波,也没有看到多模态和长文本级别的海量竞争对手。可以说米哈游选了条好赛道,极有可能一公布直接拿下n个语音数据集上的SOTA,甚至一两年内大家想到语音大模型都会是米哈游。

说实话无论是MultiAgent还是多模态大模型,尤其是图像-视频-文本,都让人有一种“这就是米哈游该做的”以及“米哈游肯定能做好”的感觉,这就是他们所宣传的“内容生产”带来的优势吧。在这点上,其他游戏公司的训练集和米哈游有了数量级的差距,好比快手在视频数量上的碾压程度,米哈游的文本和配音外加成吨二创(不知道他们会不会用)让我想不到他们有几个可以一战的对手。

说实话是有一直在关注米哈游尤其是鹿鸣的。只不过事事不巧,大概是没什么缘分。博后期间大模型方面也算是长序列,RAG,视觉-语言多模态,并行训练,推理加速,scaling law+优化理论玩了个遍,没想到它的方向还是能和我完美绕开 可能也是一种宿命吧。

不过无论如何,这大概率又是国产模型的一个里程碑。快放出来让我们(的h100)测测吧。

END