本文作者:访客

对话AI教父辛顿关门弟子:为什么现有的AI方向可能是错的

访客 2025-06-17 16:38:30 5
对话AI教父辛顿关门弟子:为什么现有的AI方向可能是错的摘要: 作者:陈白,题图来自:AI生成AI教父杰弗里·辛顿可能是这个时代对AI最悲观的人。2024年的诺贝尔物理学奖颁给了他,以...

对话AI教父辛顿关门弟子:为什么现有的AI方向可能是错的

作者:陈白,题图来自:AI生成

AI教父杰弗里·辛顿可能是这个时代对AI最悲观的人。

2024年的诺贝尔物理学奖颁给了他,以表彰他在神经网络领域的开创性成就。但“AI威胁人类”一直都是辛顿的主要论调。除此之外,他对当前主流大模型的经典评价是,“一辆锈迹斑斑到处都是问题的车,只是进行了一次喷漆。”

众所周知,目前主流大模型都采用了基于人类反馈的强化学习(RLHF)来进行预训练微调,而辛顿的评价原话是“ChatGPT的RLHF就是垃圾。”

王欣是杰弗里·辛顿的硕士研究生。在辛顿执教多伦多大学期间,他见证了辛顿在整个学术圈最边缘的时光。

作为辛顿的关门弟子,在王欣想要继续跟随辛顿读博士的时候,辛顿劝他辍学,不要再读了。原因是,这个专业根本找不到工作。他的师兄师姐们的求职之路都不顺利。

在很长一段时间里,辛顿选择的神经网络研究方向就一直不被学术界看好,认为是没有未来、注定失败的一条路。

在硅谷,这个专业在2000年前后基本没有任何应用场景——没有人认为神经网络的方向是对的。彼时,人工智能研究最流行的,还是穷举法。

很长一段时间里,多伦多大学计算机科学系官网上辛顿的个人页面都极为简陋。只有黄褐色背景上的一行行文字与超链接。其中还有他的声明:

不再招收学生、博士后或访问学者。

于是,王欣成为了他第一批华人弟子,也是最后一批关门弟子。

因为辛顿的不断苦口婆心的劝说,他没有再继续攻读辛顿的博士,而是选择回到国内大厂阿里巴巴,后来还参与了滴滴出行的创业,是滴滴出行的创始团队成员。

在中国的互联网大厂担任高管多年,王欣看起来比辛顿还是要乐观一些,在他看来,这一轮AI的商业化应用还是有巨大的机会。

今天,生成式人工智能验证了杰弗里·辛顿多年的技术路线。但辛顿依然被认为是AI的“末日先知”,对AI与人类未来持怀疑态度,和他的另一位学生、OpenAI的前首席科学家Ilya Sutskever一样,辛顿一直主张AI应当要对齐人类。

和他的导师类似,王欣对于当前的人工智能浪潮,也持有保留看法,但他更关注应用侧的变化,“大模型目前看依然只是工具,工具和基础设施,是完全不同的估值逻辑。”

Meta 的CTO安德鲁·博思沃兹的想法和王欣类似。对于AI最被看好的应用场景机器人,他的说法是,“千亿数据都无法堆出‘抓杯直觉’。”

现有的人工智能路线,真的是错的吗?

大模型只有智能,没有智慧

DeepResearch:你怎么看待这一轮AI革命?

王欣:我对于当前的技术本身依然持悲观态度。因为当前的所有大模型,本质上还是统计模型,无法产生真正的智慧或新知识。

统计模型的本质是通过数据归纳规律,但这种归纳只是对已有信息的总结,而非创造新知识。人类历史上所有推动社会进步的新知识,都是突发性的、非量变积累的结果。比如禅宗所说的“顿悟”,是一种超越线性逻辑的创造性突破。

而大模型的训练过程是纯粹的量变,通过穷举数据寻找规律,这种模式无法引发质变,也无法突破现有知识的边界。

DeepResearch:杨立昆最近批评了辛顿的悲观。你怎么看?

王欣:辛顿早期研究神经网络时,正是试图模仿生物大脑的归纳能力。他提出,人类大脑并非通过穷举法处理信息,而是通过神经网络的层级结构实现知识的抽象与归纳。

这种路线在2000年前后并不被主流认可,甚至被视为“不切实际的梦想”。

但后来AlphaGo的突破证明了这一点——传统穷举法在复杂问题(如围棋)面前完全失效,而神经网络的归纳能力成为关键。

然而,即便如此,大模型的能力依然局限于“归纳”而非“创造”,它无法像人类一样产生真正意义上的智慧。

从技术路线来看,神经网络的突破依赖于生物学启发,而非纯粹的数学优化。辛顿的研究证明,人类大脑的神经网络并非简单的“输入-输出”模型,而是通过层级化的特征提取和抽象能力实现认知。

比如视觉感知需要从像素到边缘、形状、物体的逐级抽象,这一过程与当前的卷积神经网络相似。但是人类的抽象能力远超机器,我们不仅能识别物体,还能赋予其意义。

所以我说,大模型的“智能”是统计学意义上的归纳,而非人类智慧的创造。它的价值在于提升效率和辅助决策,但无法替代人类在复杂领域的核心作用。

所以未来的技术发展,还需要突破“统计归纳”的框架,探索更接近生物大脑的“智慧生成”机制,而这可能需要跨学科的协同创新。

从现阶段来看,我们对人脑的理解都太少太少了,而AI要复制人脑,还有更远的距离。这一点我是支持杨立昆的看法的。

AI Agent很关键,但现有AI公司估值存在泡沫

DeepResearch:2023年底时我采访凯文·凯利,他说当时AI还处于blackberry moment,你如何看?

王欣确实。别说2023年了,现在AI的商业化应用也还没有找到“杀手级”场景,许多公司的高估值缺乏支撑。

我们以上一轮的人脸识别为例就会发现,尽管技术已经成熟,但其商业需求过于狭窄,主要集中在政府或特定行业,难以形成规模化市场。16-17年曾有一波AI泡沫,商汤、旷视等公司因过度依赖政府订单而迅速降温。

相比之下我们再看看互联网时代,淘宝的成功在于解决了交易效率的核心问题,而AI目前的工具属性尚未达到基础设施的层级。如今的AI公司如果无法找到可持续的商业需求,可能重蹈覆辙。

基础设施的价值在于长期沉淀和规模化应用,而大模型目前只是工具,无法支撑“基础设施”的估值逻辑。以当年的英特尔为例,其价值在于为整个计算生态提供底层支持,而当前AI公司尚未具备类似的影响力。

DeepResearch:最近芝加哥大学有一位教授发了一份报告,结果是AI大热两年半,完全没颠覆我们的工作,对于收入的影响也微乎其微。

王欣:所以我说,还没有到真正改变世界的时刻。

我说的估值泡沫,核心在于技术乐观主义与商业现实的脱节。当前AI公司的高估值,往往基于对未来技术的想象,而不是说当前可验证的商业价值。

比如许多AI初创企业宣称“颠覆传统行业”,但实际落地时却发现,大家更关注成本效益而非技术先进性。

历史经验已经反复过很多次了,技术泡沫的破裂是产业发展的必经阶段。20世纪90年代的互联网泡沫(如Dot-com Bubble)催生了亚马逊、Google等巨头,但也淘汰了大量缺乏商业模式的公司。

当前AI行业的估值逻辑类似:资本追逐短期概念,而市场最终会筛选出真正具备商业价值的企业。比如英伟达的成功在于其GPU芯片成为AI计算的基础设施,而非依赖某个具体应用场景。

相比之下,专注于垂直领域的AI公司(如人脸识别)如果无法拓展至其他市场,可能面临生存危机。

DeepSeek是微软PC时刻

DeepResearch:如何看Manus为代表的AI Agent爆火?

王欣:我对于AI Agent的长期未来还是非常乐观,因为其潜力在于人机交互的革命。比如语音助手或智能客服的普及,标志着人机交互从键盘、触屏向自然语言的转变。

这一趋势有点类似于PC从专业设备到大众工具的演变,不过当前的AI Agent仍处于“工具”阶段,缺乏真正的自主决策能力。

可技术的“基础设施化”需要长期积累。以微信为例,其成功并不是说源于技术突破,而是通过解决社交需求的痛点,最终成为用户生活的“基础设施”。

这一轮如果某一款AI应用想达到类似地位,需经历的是从工具到平台再到生态的演进。比如OpenAI的GPT模型通过API开放,为开发者提供了通用的语言处理能力,但其商业价值仍需依赖第三方应用的创新。

这种“平台化”路径与微软的Windows系统类似,但当前AI的生态尚未成熟,许多企业仍停留在“技术展示”阶段。

所以尽管我比较乐观,但AI Agent的未来取决于商业化能力的提升,而非单纯的技术突破。当前的高估值反映了市场的乐观预期,但也暗含泡沫风险。企业需回归商业本质,聚焦真实需求,而不是追逐虚幻的“颠覆”叙事。

只有当AI真正成为基础设施,其估值逻辑才能与商业价值匹配。

DeepResearch:你怎么看待DeepSeek的出现?

王欣:就像我们刚刚说的,DeepSeek的出现让我联想到比尔·盖茨降低PC成本的历史。技术的普及需要门槛的降低,而DeepSeek最大的成就是降低了AI的使用门槛,类似PC从专业设备到大众工具的转变。

所以未来AI的最大爆发点是让普通人无需学习复杂操作即可使用AI。这种平权化的技术扩散,将带来比互联网更大的变革。

技术的普及往往需要“平民化替代”。回到我们刚刚说的科技商业史,PC的普及得益于Windows系统的易用性,而智能手机的普及则依赖于安卓的开源生态。

DeepSeek的意义在于,它可能成为AI领域的“Windows”或“安卓”,通过降低技术门槛,让更多人无需编程即可使用AI。

从商业角度看,我把DeepSeek视为“PC时刻”的开始,是因为其重新定义AI的应用场景。比如说一个农民通过语音指令让AI规划农田灌溉,或一个学生通过自然语言查询学术资料,这些场景在传统AI公司看来可能是“低端需求”,但正是这些“边缘场景”构成了技术普及的基石。

DeepSeek的出现标志着AI从“精英工具”向“大众工具”的转变。这一轮技术平权可能带来比互联网更大的变革,但其成功与否取决于能否解决商业落地、伦理风险和社会公平等问题。

硅谷太傲慢了,中国的机会在平替和平权

DeepResearch:硅谷目前是如何看待中国的AI产业的?之前的国会山听证会能够看出来,美国事实上存在对于中国技术进展的不确定性。

王欣:在美国这几年,我最大的感受是,硅谷正在变成“老钱”,而且变得越来越傲慢,越来越有门槛了。甚至我们可以说,硅谷的保守与资源垄断正在限制创新。

所以从这一点来看,我非常看好中国市场在这一轮AI革命中的可能性。

还是回到历史,如果没有华强北的低成本设备,你觉得中国的移动互联网能够普及得这么快吗?而滴滴的崛起离不开安卓手机的普及,而非高端设备。

边缘场景往往能突破主流思维,而硅谷的精英化路线反而可能成为桎梏。加上这一轮打压和限制,我的预测是,中国在资源匮乏的背景下,反而可能激发更强的创新力。未来,中国的平替路线和技术平权可能成为AI竞争的关键。

硅谷的成功依赖于“精英主义”和“资本驱动”,但这种模式正在遭遇瓶颈。比如斯坦福大学,因为它离硅谷实在是太近了,它并不缺乏资源,但丰富的资源,真的能带来创新吗?我是持保留态度的。

事实上大家也发现了这一点,因为后来越来越多的创新都诞生在更远的伯克利。于是硅谷的钱又都跑到伯克利去了。

相比之下,中国的创业环境更注重“草根创新”——目前互联网大厂的创始人很多都不是名校毕业,而是凭借对市场需求的敏锐洞察抓住机会。

所以这也是未来值得乐观的地方,这种“边缘创新”模式在AI时代同样适用

这就是我说的,资源匮乏反而可能成为创新的催化剂。硅谷的“老钱”模式正在削弱初创企业的活力。相比之下,中国的创业者更愿意尝试“蓝海市场”。例如,DeepSeek的低成本API模式,正是针对中小企业和个人开发者的需求设计的,而这类市场在硅谷的估值体系中被视为“非主流”。

DeepResearch:国内互联网大厂未来机会在哪里?

王欣:科技公司谈基业长青,是一个非常奢侈的话题。生生死死才是科技行业的常态。这可能和麦当劳、肯德基、沃尔玛是完全不同的商业逻辑。所以关键是我们如何看待它。

历史上的颠覆性创新,比如我曾经工作过的滴滴和阿里巴巴,其实都是源于被主流忽视的“边缘场景”。

滴滴不是简单地对Uber的模仿,淘宝的崛起则源于对C2C交易效率的重新定义,而绝不是简单模仿亚马逊的B2C模式。

这种“边缘创新”的逻辑在AI领域同样适用:当前大厂的资源集中于大模型研发,而真正的突破可能来自中小企业或初创公司在垂直领域的应用探索。

我觉得创始人们可能需要做好这样的心理准备,技术迭代和商业需求的不确定性远超传统行业。比如IBM曾是计算机行业的霸主,但其核心业务(大型机)被PC和互联网取代;英特尔的CPU虽成为基础设施,但面对AI芯片和量子计算的挑战,其地位同样面临动摇。

这种“死亡”并非失败,而是行业演化的必然结果。

但我们可能要跳出公司的视角来看,这是我开始对制度经济学感兴趣的原因。科技行业的核心是推动社会交易效率的提升,而不是说去追求永恒的生命力。

你看,从PC到移动互联网,再到AI,每一次技术浪潮都会淘汰旧有格局,但也会催生新的基础设施。对于中国互联网大厂而言,关键在于在动荡中找到“基础设施化”的路径:通过解决真实需求、降低技术门槛、拥抱边缘创新。

作者:陈白

阅读
分享