如何看待赵明周鸿祎直播展示用荣耀Magic 7「一句话点咖啡」,这样的AI是什么水平?

发布时间:
2024-10-19 20:04
阅读量:
5

这场直播还是颇多干货内容,除了一开始的麦克风噪音乱入比较尴尬。之后围绕AI技术现状和发展的讨论,听了之后还是获益匪浅。直播过程中周总一直绕不开“女助理”,他是真懂流量的。

好,接下来是说正事的分割线。

AI特别是AI Agent(智能体)是今年智能终端领域最引人注目的新技术,各家手机厂商都在快速跟进。其实AI大模型的风去年就开始兴起,但今年的产品形象更加清晰一点。AI对于智能终端行业来说,有三个重要的意义:

第一是对行业的引领。智能手机的产品概念脱胎于PC,但是在AI的应用探索上已经超越了PC。现在PC的软硬件厂商也都在积极探索AI化,可这个行业的技术结构太过集中在少数厂商手里,竞争不充分,则技术成长是肉眼可见的缓慢。

第二是对市场的积极推动。众所周知,全球智能手机市场都呈现换机周期延长,大盘下行的走势。AI及AI Agent的兴起,有助于刺激消费者的购买欲,带动新一轮的换机热潮。直播中红衣大哥也讲到了,智能手机是AI目前最理想的载体。在一众移动终端中,PC和平板太大,手表和眼镜无法承载高算力硬件基础。环顾四周之后,真是历史选择了智能手机。

第三是改写智能手机的行业布局。智能手机的上半场,国外品牌因为技术先发优势,行业技术走向和消费者认知被他们拿捏得死死的。AI大模型在手机端的发展,类似于新能源和智能驾驶帮助国产汽车弯道超车。在AI研发和应用方面,国外科技巨头相对于国内品牌的差距,远不如智能手机第一个阶段那么远,中国品牌在这一局的赢面很大。AI Agent会是手机行业重构洗牌的重要推动力,且波及的范围会是全球市场。

今天直播中有两个基于AI Agent的应用名场面——荣耀CEO赵明一句话点咖啡,视频通话识别AI换脸。

一句话点咖啡这个,真心是一个行云流水的快。和我们目前在手机外卖App上的点餐操作相比,至少节省了4~5次的触屏动作,以及3~5分钟左右的时间消耗。而且我要划一个重点,这不是针对“点咖啡”这一个单一行为所编写的规则代码,这是AI Agent自己“理解——思考——选择——执行”的规划流程。

从“规则”到“规划”,一字之差的背后是跨技术世代的巨大差别。此前的一些语音交互指令,是程序员编写了一整套完整的规则。你对着智能手机说“打开空调”,触发系统内的这个规则,就会开空调。早期的语音智能,你说“帮我开空调”、“开空调”都不算数,系统他听不懂,错一个字,甚至方言都不行。

之后进化到了模糊指令,只要相关的意思都可以触发系统,但如果你要求智能化系统帮你开客厅的灯,如果没有预先设置这个自动化的指令,那也是无法启动的。这一个技术逻辑在自动化驾驶上面更明显,车辆的视觉智驾系统学习了雪糕筒正正经经站着的样子,就能识别到哪是路障,得避开。可一旦雪糕筒累了躺在地上,视觉智驾就蒙了,那到底是啥?然后一脑门子就扑上去了。

而今天明哥在现场展示的语音点咖啡,是这样的一个逻辑链路:

语音被系统识别获取——系统根据以往使用习惯,确定是在外卖App还是品牌的小程序里启动点单——系统在底层搜索“某某品牌某某品类咖啡”并进入外卖App的该搜索页面——系统通过读屏找到品类并触发口味、冷热、数量等选择——确定地址收货人等信息后,付款下单,等待送货上门。

在这一个流程中,AI Agent除了要具备执行指令者购买意图的思考逻辑以及多步推理能力,还有一个就是支付环境的综合性安全能力,而安全是比自动化更重要的核心能力。一旦发生AI Agent点单或是支付发生盗刷等事件,那AI大模型估计要在热搜上霸榜很久。这就像智能驾驶一旦有点小剐蹭,就立马有人说车还是要人自己开最安全。

所以明哥在发出这个指令时,他手里荣耀手机的人脸识别、声纹识别,定位等可以佐证用户真实身份的信息系统,都没有闲着,否则最后一步的支付就很难完成。

所以这就跳转到了直播中展示的第二段名场面——“AI换脸检测”,这是非常经典的“用魔法打败魔法”。

随着AI技术的兴起,一些犯罪分子也在利用AI换脸来进行盗取、诈骗个人钱物以及数字资产的犯罪行为。就比如直播中展示的视频换脸,模拟用户声音,两者一叠加,小孩和老人真是很容易被欺骗。不过犯罪分子虽然是魔高一尺,荣耀手机的MagicOS 9系统却是道高一丈,很快就识别出来这是个人工捏的假脸。

虽然明哥没有过多讲解这个功能的技术原理(毕竟23号的MagicOS 9发布会还是要留点内容),但这个功能的重要性和必要性我们在前面就提到了。AI大模型加速了技术的迭代进化,就必然是泥沙俱下,免不了有相关的负面事件发生。

而这一类的事件发生越多,大众用户对自动化、智能化功能的恐惧心就越重。今年“3·15”,央视曝光了AI换脸诈骗,5月中国互联网协会公众号也发文提示“AI换脸”新骗局。上网搜索“AI诈骗”,与之相关的社会新闻密密麻麻。与之前的电话、短信诈骗相比,AI诈骗的隐蔽性更高,受骗者的警惕性更低,也更容易造成更大的损失。

从这个角度来理解,“AI换脸检测”不是一个单纯的商业导向的功能开发,其本身具有更深远的社会责任。目前基于电话号码大数据的反诈系统,在应对AI换声、AI换脸等视频、音频高科技诈骗方式时追踪难度更高。所以通过手机自带的识别反诈系统,在精准性、即时性和可靠性等方面,都要优于通过安装反诈App来预防犯罪。荣耀对预防和阻止AI诈骗犯罪的功能开发,对行业的引领性和启发都发挥了关键性作用。

科技企业不仅是要盈利,也要肩负起企业公民的担当,这一点,给荣耀点赞。

直播中周鸿祎的一些观点我是很认可的:全球每年投入数千亿美金到AI大模型的研发中来,不是为了就只是写个小作文,搞个换脸这些娱乐属性的应用。AI大模型的广阔应用最终肯定还是扎根到提高生产效率、推动技术加速等大事上。

回到手机行业来,AI大模型虽然不至于要去干经天纬地的大事业,但肯定也是一样要撕掉能写小作文的标签,为用户提供更多元、更深度、更便捷的产品服务体验。

在直播中,明哥还展示了用语音指令来快速分享文件给微信好友。过去我们需要多个搜索查找才能完成的步骤,现在不过就是三言两语几十秒的事情。这已经是技术革命的前奏了,完全可以期待更大的变革洪流在不远的将来就会来到。

“一句话点咖啡”是一个抛砖引玉的开端,更重要的是通过这个小小的技术创新,可以启发和带动更多的工作和生活场景都接入到AI Agent的功能体系中来,最终解放用户的碎片化时间占用,实现生产力的再度提升。就像红衣大哥说的:“荣耀这是把助理装进了手机里”。

智能手机改变了大众消费者的工作和生活,也把我们的工作和生活过度捆绑在了其中。所以AI大模型的出现,并不是要我们去远离智能手机,反过来是要“榨干”智能手机,提升他为我们主动服务的能力,成为懂我们的理想生产工具。

我们试想一下,如果你要给几十上百位客户邮寄新年礼物,过去的做法是逐一复制地址,再粘贴到快递App内,这一个工作没有个一两天是干不完的。而现在有了AI Agent的加持,我们只需要对手机说:“打开客户礼物文档,按照名单内的收件人邮寄礼物”。AI Agent就能读取文档,再自己去填单,一气呵成,比人工精准和高效多了。

再依照直播嘉宾的设想,将来办公室里来客人了,明哥只需要拿着手机拍个几秒钟的视频,把贵宾的脸录下来,然后给系统说:“给客人点杯饮料。”系统通过人脸识别,很快就检索到来宾是谁,上次来做客喝了什么,顺带给出一个点单推荐:某总,推荐三款咖啡,冰美式、生椰拿铁、生椰拿铁。某总,推荐凤凰单枞,金骏眉,青柑普洱……

明哥再和客人简单确认一下,就可以点单或通知秘书准备了。

这对于用户来说,就可以把有限的脑内带宽给节约出来,不去纠结在这些日常琐碎的选择困难症上,专注于到如何交流工作,探索业务等更重要的话题中。

本月下旬,荣耀即将发布MagicOS 9和Magic 7,这次的一软一硬两个新品,都将聚焦在基于AI Agent新能力的技术重构上。荣耀从Magic 6开始,在AI的新功能开发和应用上,就有颇多亮点。在直播一开始,明哥就提到了一组很少在发布会会了解到的数据:2023年的研发投入是100多亿人民币,在整个销售收入中占比高达11%。仅仅是Magic V3这一个产品的研发投入,就是10亿人民币。

网上有句鸡汤文:男人对你的爱有多深,就看他对你花了多少钱。我们套用一下这句话:一个企业对技术有多重视,就看他在研发上投入了多少钱。从这一点看,荣耀对技术驱动的偏执和重视程度,颇有老东家的气质。

关于AI应用和基于AI为技术底座的未来智能硬件,直播中还有两个颇有启发性的观点值得分享:

AI大模型将不再是单纯的堆参数,而是走向若干个聚焦单项能力的垂直化分布。所以这对于手机厂商的应用开发提出了新的挑战,如何在大而全的框架下实现小而美。未来的技术版图中,应用开发者或许将转型,孵化出某一个单项领域大模型的开发者。比如有专门做人像美化的大模型,专门做办公流程自动化的大模型。这对于厂商和开发者,都意味着一个新赛道的很大可能性。

第二个是基于不同场景的智能终端走出单一形态,实现多样化裂变。眼镜、手表、车机、耳机都将在现有单一功能的基础上,置入新的附加功能。而手机,会在未来的AI大变革中继续担当算力中心的重要角色。不过对于厂商来说,多形态产品的开发能力将会是非常重要的技术护城河,所以谁的生态布局越早完成,做得越好,谁就是智能手机下半场的大赢家。

而荣耀,显然正在这一轮AI大变局的前夜积蓄力量,等待爆发的机会点到来。

END