穿越奇点 | 实现通用智能，人类欠缺什么？业内人士：路径已存在，但还缺三种“资源”

时间： 2024-03-02 03:16 浏览量：505

封面新闻记者欧阳宏宇

ChatGPT的热潮还未退去，Sora又惊艳登场。从大语言模型到文生视频大模型，这一轮技术跃迁对AI行业的意义是什么？距离实现AGI奇点，又还存在哪些资源瓶颈？

近日，多位通用人工智能领域的从业者在接受记者采访时表示，聚焦于在AIGC领域，Sora最关键的突破是在较长时间窗口中，保持了生成内容的一致性；这也意味着，接下来这几年就会有某种程度的通用人工智能出现。不过，产业还需要克服来自通用模型架构、高质量数据以及能源三方面资源匮乏的挑战。

Sora带来阶跃式技术提升

是实现通用智能必要过程

将简短的文本描述输入模型，Sora很快就能转化成长达1分钟的高清视频，且视频质量更加真实立体，场景复杂、角色多元，画质卓越、连续稳定。不过，这还远不是人工智能的终点。

在月之暗面（Moonshot AI)联合创始人周昕宇看来，Sora在视频生成领域实现了阶跃式的提升，但这一产品所运用的扩散模型，还不能泛化到AGI全场景的通用的模型架构。

月之暗面（Moonshot AI）创始人杨植麟

据OpenAI透露，Sora是通过学习海量视频，变成了能实现视频生成、扩展的“物理世界模拟器”。而这种“大力出奇迹”的规模法则，对于通用人工智能也存在极大意义。

“Sora让大家看到了，规模效应不只在文字模态上成立，在视频模态上也成立。”周昕宇认为，Sora在较长的时间窗口内保持生成内容的一致性的能力，对于理解和模拟复杂动态场景至关重要，因为它不仅涉及到图像的逼真度，还涉及到动作和场景的连贯性。“通过扩展视频生成模型可以建立通用物理世界模拟器，这是实现通用人工智能的必要过程。”

但也有不少专家认为，在AI大模型发展的路径中，从文本到音视频等多模态是必然的趋势。这意味着在AIGC赛道上，多模态大模型的训练规律并不一定适用于大语言模型。对此，周昕宇谈到，由于建模文字效率低，Sora的扩散模型可能不是一个通用的模型架构。“也就是说，行业可能无法用 Sora 的技术来训练一个GPT-4水准的文字模型。”

不过，“可以确定的是，AI能带来实打实的生产力提升”。月之暗面（Moonshot AI）创始人杨植麟认为，现在用一个软件，其实对应1000个程序员的智能；以后用的应用背后可能对应100万个人的智能，而且每天都在迭代。

通用智能将迎来大发展

在某些领域超过人类

无论何种技术，贴近产业才有未来。不过，通用人工智能要真正在全行业实现产业化，仍然需要关键“原料”的支撑。

周昕宇分析称，实现通用人工智能目前还存在三个主要瓶颈。一是缺少能将文本、图像、视频等不同模态数据，转化为统一形式的通用模型架构。“以视频为例，熵过高的数据虽然可以分别做生成和理解，但通用性和泛化性会受到影响。”

二是高质量的文本数据有限，很快会不满足于训练需求。“音视频数据虽然储量巨大，但整体数据质量不高，同时受模型架构、大小等制约，无法完全有效利用。”周昕宇预测，下一步，AI需要用巨大的算力生成“合成数据”。

三是人类还面临“能源挑战”。周昕宇这样算了一笔账，实现通用人工智能需要大量的算力，仅10万张GPU集群就需要一个大亚湾核电站的发电供应，大约相当于全中国耗电量的千分之二；而且传统机房的设计容量还不到1万张GPU，短期弥补这个差距面临很大困难。

幸运的是， ChatGPT、Sora等产品带给行业的思维冲击，已经证实了一条通往AGI奇点，得到通用智能的可行路径。“人工智能中的‘智能’，本质是通过‘无损压缩’使得数据的信息熵减少，减少信息熵需要能源，通过更大的模型、更多的数据将能源以最高的效率转化为智能；而‘通用性’来源于大量丰富的含有大量规律数据，经过‘无损压缩’得到通用智能，也是目前最可行的技术路线。 ”周昕宇预测，接下来几年就会有某种程度的通用人工智能出现，在一些任务上智能水平超过人类。

更关键的是，AI是实现很多人类畅想的未来技术的基础。“要实现元宇宙，实现AI是先决条件之一。”杨植麟表示，随着AI技术成熟，人的时间分配可能也会产生很多变化。“比如，可能把大量时间花在精神世界里面，进而会演化出一个巨大的虚拟精神空间。”

关键词 : 人工智能AI周昕宇智能新浪众测

新浪科技公众号

“掌”握科技鲜闻（微信搜索techsina或扫描左侧二维码关注）

欢迎光临浙江公益网！

穿越奇点 | 实现通用智能，人类欠缺什么？业内人士：路径已存在，但还缺三种“资源”