AI应用从“蓝领+”到“白领+”的技术变迁
转自:中国科学报
近日,清华大学惠妍讲席教授、衔远科技创始人兼首席科学家周伯文在一场分享活动中就时下ChatGPT火爆的现象发言称,从产业闭环的角度来讲,人工智能(AI)应用场景从过去“蓝领+重复劳动”(如质检、客服等),变成了“白领+知识创新”的应用领域。他认为,这毫无疑问将带来更大的价值空间,同时带来更多“飞轮效应”。
什么是飞轮效应?周伯文解释道,就是AI能够帮助白领和知识工作者更好地去理解、洞察并形成新的知识,而新的知识会帮助设计出更好的AI,更好的AI又能产生更多新知识,如此往复。
这一变化的背后,对应的是协同交互智能与多模态学习领域的进化。
AI或更善于承担人类的“认知负担”
周伯文提到,2002 年诺贝经济学奖得主丹尼尔·卡尼曼的一本畅销书《思考,快与慢》(Thinking Fast And Slow)提出人有两类思考方式:第一类是“直觉无意识”的思考方式,第二类思考方式则有语言、算法、计算、逻辑在其中发挥更重要作用。
“过去几年,人工智能更多用在协助人们只需付出‘直觉无意识’思考的工作场景中,但未来甚至现在正在发生的是,AI其实更善于且更适合从人机协同的角度去承担更多需要人类付出第二类思考方式的工作。”
他解释说,这是因为对人而言,第一种思考方式是一个“低脑耗、低认知负担”的任务,人们自身实现起来更高效;而第二类思考方式显然给人的认知负担更重。
周伯文指出,以往,AI技术的进展使其只能帮助人们完成第一类工作,但现在的趋势是,AI 越来越向有能力协助人们完成需要第二类思考方式的工作靠拢。
对于这些变化,他判断AI的新一轮创新必将带来生产力格局的演变:“几年前,大家讲人工智能落地应用场景,更多地聚焦在诸如智能质检、客服这些领域。但现在我们看到,AI的创新场景越来越复杂,开始涉及艺术内容创造、药物发现和新知识发现。”
撰写文案、脚本甚至科学论文,均属此类。近期,媒体接连报道了国内外教授发现有学生利用ChatGPT做作业、写论文的事例,并坦承ChatGPT的完成度和质量都相当高。
当前AI难以完成“知识—计算—推理”闭环
其实,在ChatGPT之前,Facebook也曾发布过一个利用AI协助撰写科学论文的AI系统“Galactica”。周伯文注意到,Galactica也能写出非常通畅的论文,但一些基本事实和引用文献却可能是错误的。比如引用文章的作者名字是真的,但其简介却半真半假。
周伯文谈到,发布Galactica的目的不是让大家用它去独立完成论文和科研,而是希望AI可以更好地帮助人,所以人必须在闭环里面。他认为:“这恰恰从另一角度强调了人的协同和交互是非常重要的基础条件。”
“目前的AI并没有能力完成这种完整的知识、计算、推理的闭环,所以必须需要人的参与。”周伯文说,无论是Galactica还是ChatGPT,它们都需要人和环境的协同来创造场景——这些价值场景原来并没有,但现在变成了可能:“只是,这种‘可能’一旦脱离人的协同和交互,这些AI系统就无法实现目标。”
“在这一趋势下,AI应该怎样协同和交互,是一个需要去思考的前沿问题。”周伯文强调,当下谈论的AI的协同和交互,与原来的“交互智能”是截然不同的东西。
“历史上的交互,更多是给定一个训练好的系统,把交互作为一个任务去完成,比如IBM沃森机器人、微软小冰、苹果Siri、京东智能客服;而今天讲的协同和交互,是把交互作为一种学习手段,把协同作为AI和人的分工,更好地完成人机协同融合,去洞察、形成新知识并完成任务。”周伯文说。
“这是整个交互智能的历史视角。”他介绍说,驱动这一进展的是技术视角的变化,包括但不局限于从早期的规则模板到框架基准(Frame-based)的任务型对话,再到统计语言模型、超大规模预训练模型的产生。
下一代AI亟需加强“组合能力”
从“蓝领+”到“白领+”,包括ChatGPT出色的表现,凸显了大规模预训练语言模型的突破。很自然地,下一个问题是,按照这种范式继续走下去,AI能不能实现高价值应用场景和对知识、计算与推理的有效融合?
“基础模型可能是未来交互智能的基石,我个人认为它是一个比大模型更重要的词。”周伯文说道,很重要的一点在于,基础模型并不是最终形态,要去解决碰到的这些问题,还需要更好地具象化。
因此他提出,知识、计算和推理的有效组合是接下来“非常需要去研究的方向”。这种组合很重要的一点就是,人的协同和交互能够推动这些基础模型的升级。
目前,AI在计算方面进展很大,但在知识和推理及模块的有效组合之间还存在很大的瓶颈。周伯文认为,将人和环境的协同与交互加进来,“能够帮助去弥补AI在这些方面的一些瓶颈”。
“下一代人工智能亟需加强知识(包括暗知识)、计算、推理的组合能力。”周博文说道:“这种组合能力非常重要,但我认为AI与人、环境的高效交互+协同是组合这些能力的核心。”
周伯文从两方面作出这样的判断。一是AI与人、环境的协同和交互是高价值创造的必备条件,如果没有AI和人的协同,AI也无法独立完成这些高价值场景;二是这种协同和交互也是提升AI在知识、计算、推理及组合能力的有效路径。
“对于AI而言,多模态理解与生成是协同和交互的重要基石。”周伯文说,过去两年间,不同模态之间的表征学习趋于统一,这是一个非常好的基础条件。
向AI展示一张冲浪运动员正在单板冲浪的照片,问它“图中人物依靠身体的哪部分能最高效地维持平衡?”AI 能够给出答案“手臂”。这个过程就呈现出“常识知识”和“视觉理解”结合的多模态理解和生成。类似这种接近人类第二种思考方式的任务挑战,需要 AI 更多地迭代和演进。