现在距离AI理解思维活动,到底有多近?这次路透社认为,「Strawberry」的理论先驱,应该是两年前,斯坦福大学团队发表的 STaR 技术。STaR 的开发者之一、斯坦福大学教授 Noah Goodman 接受路透社采访,表示他跟「Strawberry」没关系,但如果真的追平人类的推理能力,那是让人既兴奋、又恐惧的事。Noah GoodmanSTaR 的特点是:具备特定条件下的推理能力。先拿一个已经训练过的模型,再准备一个小的数据集(里面包括推理步骤),喂进去训练。有了这些,再让模型去生成解决问题的推理过程。如果出来是正确的、符合答案的,那么这次推理就判定为有效。接着不断微调不断微调,不断让它自我学习。最后测试的结果是,这样的方式的确能够提升模型在数学运算方面的表现。换句话说,特定条件和训练方式下,的确可以让模型效仿推理过程,从而实现具备一定的推理能力。这样辛苦地挖掘和塑造 AI 的推理能力,对日常使用而言有什么意义?路透社的线人说,OpenAI 特别希望能够达成「CUA」,computer-using agent。模型能够根据文档和其他材料提供的信息,自主采取行动。而这是 OpenAI 所提出的「五阶评级」中的第三阶:代行者,能够采取行动的系统。
图片来自:彭博社
现在的对话 chatbot 只是第一阶,「Strawberry」据称已经接近第二阶。可以想见,推理能力是第三阶段的必要前提。只有具备了推理能力,通过各种信息,推演出用户意图,才有可能丝滑地完成服务调度,采取行动。以鸿蒙的 Harmony Intelligence 为例,这是鸿蒙首次将 AI 能力融入系统。除了提供了基于生成式 AI 的图像、声音修复技术,还有惊艳的「控件 AI 化」,各种第三方应用可以调用系统空间处理请求,打破应用与应用之间的壁垒。再比如,很快也要亮相的 Apple Intelligence,也是旨在为用户创造更一体化、无缝衔接的体验。在 APPSO 之前的报道中,我们就提到了 AI 不应该只作为一种服务,而是要能糅合进操作系统里,共同存在。这恰恰也是来自于 OpenAI 创始人之一,Andrej Karpathy 的设想。这就是 AI 推理能力备受瞩目的原因之一,只要你拥有一台智能手机,就不妨畅想一种可能的未来,「 AI 作为智能手机新的操作系统,而大模型就是智能操作系统的核心」。