对话AI教父辛顿关门弟子：为什么现有的AI方向可能是错的

访客 2025-06-17 16:38:30 5

默认

摘要： 作者：陈白，题图来自：AI生成AI教父杰弗里·辛顿可能是这个时代对AI最悲观的人。2024年的诺贝尔物理学奖颁给了他，以...

作者：陈白，题图来自：AI生成

AI教父杰弗里·辛顿可能是这个时代对AI最悲观的人。

2024年的诺贝尔物理学奖颁给了他，以表彰他在神经网络领域的开创性成就。但“AI威胁人类”一直都是辛顿的主要论调。除此之外，他对当前主流大模型的经典评价是，“一辆锈迹斑斑到处都是问题的车，只是进行了一次喷漆。”

众所周知，目前主流大模型都采用了基于人类反馈的强化学习（RLHF）来进行预训练微调，而辛顿的评价原话是“ChatGPT的RLHF就是垃圾。”

王欣是杰弗里·辛顿的硕士研究生。在辛顿执教多伦多大学期间，他见证了辛顿在整个学术圈最边缘的时光。

作为辛顿的关门弟子，在王欣想要继续跟随辛顿读博士的时候，辛顿劝他辍学，不要再读了。原因是，这个专业根本找不到工作。他的师兄师姐们的求职之路都不顺利。

在很长一段时间里，辛顿选择的神经网络研究方向就一直不被学术界看好，认为是没有未来、注定失败的一条路。

在硅谷，这个专业在2000年前后基本没有任何应用场景——没有人认为神经网络的方向是对的。彼时，人工智能研究最流行的，还是穷举法。

很长一段时间里，多伦多大学计算机科学系官网上辛顿的个人页面都极为简陋。只有黄褐色背景上的一行行文字与超链接。其中还有他的声明：

不再招收学生、博士后或访问学者。

于是，王欣成为了他第一批华人弟子，也是最后一批关门弟子。

因为辛顿的不断苦口婆心的劝说，他没有再继续攻读辛顿的博士，而是选择回到国内大厂阿里巴巴，后来还参与了滴滴出行的创业，是滴滴出行的创始团队成员。

在中国的互联网大厂担任高管多年，王欣看起来比辛顿还是要乐观一些，在他看来，这一轮AI的商业化应用还是有巨大的机会。

今天，生成式人工智能验证了杰弗里·辛顿多年的技术路线。但辛顿依然被认为是AI的“末日先知”，对AI与人类未来持怀疑态度，和他的另一位学生、OpenAI的前首席科学家Ilya Sutskever一样，辛顿一直主张AI应当要对齐人类。

和他的导师类似，王欣对于当前的人工智能浪潮，也持有保留看法，但他更关注应用侧的变化，“大模型目前看依然只是工具，工具和基础设施，是完全不同的估值逻辑。”

Meta 的CTO安德鲁·博思沃兹的想法和王欣类似。对于AI最被看好的应用场景机器人，他的说法是，“千亿数据都无法堆出‘抓杯直觉’。”

现有的人工智能路线，真的是错的吗？

大模型只有智能，没有智慧

DeepResearch：你怎么看待这一轮AI革命？

王欣：我对于当前的技术本身依然持悲观态度。因为当前的所有大模型，本质上还是统计模型，无法产生真正的智慧或新知识。

统计模型的本质是通过数据归纳规律，但这种归纳只是对已有信息的总结，而非创造新知识。人类历史上所有推动社会进步的新知识，都是突发性的、非量变积累的结果。比如禅宗所说的“顿悟”，是一种超越线性逻辑的创造性突破。

而大模型的训练过程是纯粹的量变，通过穷举数据寻找规律，这种模式无法引发质变，也无法突破现有知识的边界。

DeepResearch：杨立昆最近批评了辛顿的悲观。你怎么看？

王欣：辛顿早期研究神经网络时，正是试图模仿生物大脑的归纳能力。他提出，人类大脑并非通过穷举法处理信息，而是通过神经网络的层级结构实现知识的抽象与归纳。

这种路线在2000年前后并不被主流认可，甚至被视为“不切实际的梦想”。

但后来AlphaGo的突破证明了这一点——传统穷举法在复杂问题（如围棋）面前完全失效，而神经网络的归纳能力成为关键。

然而，即便如此，大模型的能力依然局限于“归纳”而非“创造”，它无法像人类一样产生真正意义上的智慧。

从技术路线来看，神经网络的突破依赖于生物学启发，而非纯粹的数学优化。辛顿的研究证明，人类大脑的神经网络并非简单的“输入-输出”模型，而是通过层级化的特征提取和抽象能力实现认知。

比如视觉感知需要从像素到边缘、形状、物体的逐级抽象，这一过程与当前的卷积神经网络相似。但是人类的抽象能力远超机器，我们不仅能识别物体，还能赋予其意义。

所以我说，大模型的“智能”是统计学意义上的归纳，而非人类智慧的创造。它的价值在于提升效率和辅助决策，但无法替代人类在复杂领域的核心作用。

所以未来的技术发展，还需要突破“统计归纳”的框架，探索更接近生物大脑的“智慧生成”机制，而这可能需要跨学科的协同创新。

从现阶段来看，我们对人脑的理解都太少太少了，而AI要复制人脑，还有更远的距离。这一点我是支持杨立昆的看法的。

AI Agent很关键，但现有AI公司估值存在泡沫

DeepResearch：2023年底时我采访凯文·凯利，他说当时AI还处于blackberry moment，你如何看？

王欣：确实。别说2023年了，现在AI的商业化应用也还没有找到“杀手级”场景，许多公司的高估值缺乏支撑。

我们以上一轮的人脸识别为例就会发现，尽管技术已经成熟，但其商业需求过于狭窄，主要集中在政府或特定行业，难以形成规模化市场。16-17年曾有一波AI泡沫，商汤、旷视等公司因过度依赖政府订单而迅速降温。

相比之下我们再看看互联网时代，淘宝的成功在于解决了交易效率的核心问题，而AI目前的工具属性尚未达到基础设施的层级。如今的AI公司如果无法找到可持续的商业需求，可能重蹈覆辙。

基础设施的价值在于长期沉淀和规模化应用，而大模型目前只是工具，无法支撑“基础设施”的估值逻辑。以当年的英特尔为例，其价值在于为整个计算生态提供底层支持，而当前AI公司尚未具备类似的影响力。

DeepResearch：最近芝加哥大学有一位教授发了一份报告，结果是AI大热两年半，完全没颠覆我们的工作，对于收入的影响也微乎其微。

王欣：所以我说，还没有到真正改变世界的时刻。

我说的估值泡沫，核心在于技术乐观主义与商业现实的脱节。当前AI公司的高估值，往往基于对未来技术的想象，而不是说当前可验证的商业价值。

比如许多AI初创企业宣称“颠覆传统行业”，但实际落地时却发现，大家更关注成本效益而非技术先进性。

历史经验已经反复过很多次了，技术泡沫的破裂是产业发展的必经阶段。20世纪90年代的互联网泡沫（如Dot-com Bubble）催生了亚马逊、Google等巨头，但也淘汰了大量缺乏商业模式的公司。

当前AI行业的估值逻辑类似：资本追逐短期概念，而市场最终会筛选出真正具备商业价值的企业。比如英伟达的成功在于其GPU芯片成为AI计算的基础设施，而非依赖某个具体应用场景。

相比之下，专注于垂直领域的AI公司（如人脸识别）如果无法拓展至其他市场，可能面临生存危机。

DeepSeek是微软PC时刻

DeepResearch：如何看Manus为代表的AI Agent爆火？

王欣：我对于AI Agent的长期未来还是非常乐观，因为其潜力在于人机交互的革命。比如语音助手或智能客服的普及，标志着人机交互从键盘、触屏向自然语言的转变。

这一趋势有点类似于PC从专业设备到大众工具的演变，不过当前的AI Agent仍处于“工具”阶段，缺乏真正的自主决策能力。

可技术的“基础设施化”需要长期积累。以微信为例，其成功并不是说源于技术突破，而是通过解决社交需求的痛点，最终成为用户生活的“基础设施”。

这一轮如果某一款AI应用想达到类似地位，需经历的是从工具到平台再到生态的演进。比如OpenAI的GPT模型通过API开放，为开发者提供了通用的语言处理能力，但其商业价值仍需依赖第三方应用的创新。

这种“平台化”路径与微软的Windows系统类似，但当前AI的生态尚未成熟，许多企业仍停留在“技术展示”阶段。

所以尽管我比较乐观，但AI Agent的未来取决于商业化能力的提升，而非单纯的技术突破。当前的高估值反映了市场的乐观预期，但也暗含泡沫风险。企业需回归商业本质，聚焦真实需求，而不是追逐虚幻的“颠覆”叙事。

只有当AI真正成为基础设施，其估值逻辑才能与商业价值匹配。

DeepResearch：你怎么看待DeepSeek的出现？

王欣：就像我们刚刚说的，DeepSeek的出现让我联想到比尔·盖茨降低PC成本的历史。技术的普及需要门槛的降低，而DeepSeek最大的成就是降低了AI的使用门槛，类似PC从专业设备到大众工具的转变。

所以未来AI的最大爆发点是让普通人无需学习复杂操作即可使用AI。这种平权化的技术扩散，将带来比互联网更大的变革。

技术的普及往往需要“平民化替代”。回到我们刚刚说的科技商业史，PC的普及得益于Windows系统的易用性，而智能手机的普及则依赖于安卓的开源生态。

DeepSeek的意义在于，它可能成为AI领域的“Windows”或“安卓”，通过降低技术门槛，让更多人无需编程即可使用AI。

从商业角度看，我把DeepSeek视为“PC时刻”的开始，是因为其重新定义AI的应用场景。比如说一个农民通过语音指令让AI规划农田灌溉，或一个学生通过自然语言查询学术资料，这些场景在传统AI公司看来可能是“低端需求”，但正是这些“边缘场景”构成了技术普及的基石。

DeepSeek的出现标志着AI从“精英工具”向“大众工具”的转变。这一轮技术平权可能带来比互联网更大的变革，但其成功与否取决于能否解决商业落地、伦理风险和社会公平等问题。

硅谷太傲慢了，中国的机会在平替和平权

DeepResearch：硅谷目前是如何看待中国的AI产业的？之前的国会山听证会能够看出来，美国事实上存在对于中国技术进展的不确定性。

王欣：在美国这几年，我最大的感受是，硅谷正在变成“老钱”，而且变得越来越傲慢，越来越有门槛了。甚至我们可以说，硅谷的保守与资源垄断正在限制创新。

所以从这一点来看，我非常看好中国市场在这一轮AI革命中的可能性。

还是回到历史，如果没有华强北的低成本设备，你觉得中国的移动互联网能够普及得这么快吗？而滴滴的崛起离不开安卓手机的普及，而非高端设备。

边缘场景往往能突破主流思维，而硅谷的精英化路线反而可能成为桎梏。加上这一轮打压和限制，我的预测是，中国在资源匮乏的背景下，反而可能激发更强的创新力。未来，中国的平替路线和技术平权可能成为AI竞争的关键。

硅谷的成功依赖于“精英主义”和“资本驱动”，但这种模式正在遭遇瓶颈。比如斯坦福大学，因为它离硅谷实在是太近了，它并不缺乏资源，但丰富的资源，真的能带来创新吗？我是持保留态度的。

事实上大家也发现了这一点，因为后来越来越多的创新都诞生在更远的伯克利。于是硅谷的钱又都跑到伯克利去了。

相比之下，中国的创业环境更注重“草根创新”——目前互联网大厂的创始人很多都不是名校毕业，而是凭借对市场需求的敏锐洞察抓住机会。

所以这也是未来值得乐观的地方，这种“边缘创新”模式在AI时代同样适用。

这就是我说的，资源匮乏反而可能成为创新的催化剂。硅谷的“老钱”模式正在削弱初创企业的活力。相比之下，中国的创业者更愿意尝试“蓝海市场”。例如，DeepSeek的低成本API模式，正是针对中小企业和个人开发者的需求设计的，而这类市场在硅谷的估值体系中被视为“非主流”。

DeepResearch：国内互联网大厂未来机会在哪里？

王欣：科技公司谈基业长青，是一个非常奢侈的话题。生生死死才是科技行业的常态。这可能和麦当劳、肯德基、沃尔玛是完全不同的商业逻辑。所以关键是我们如何看待它。

历史上的颠覆性创新，比如我曾经工作过的滴滴和阿里巴巴，其实都是源于被主流忽视的“边缘场景”。

滴滴不是简单地对Uber的模仿，淘宝的崛起则源于对C2C交易效率的重新定义，而绝不是简单模仿亚马逊的B2C模式。

这种“边缘创新”的逻辑在AI领域同样适用：当前大厂的资源集中于大模型研发，而真正的突破可能来自中小企业或初创公司在垂直领域的应用探索。

我觉得创始人们可能需要做好这样的心理准备，技术迭代和商业需求的不确定性远超传统行业。比如IBM曾是计算机行业的霸主，但其核心业务（大型机）被PC和互联网取代；英特尔的CPU虽成为基础设施，但面对AI芯片和量子计算的挑战，其地位同样面临动摇。

这种“死亡”并非失败，而是行业演化的必然结果。

但我们可能要跳出公司的视角来看，这是我开始对制度经济学感兴趣的原因。科技行业的核心是推动社会交易效率的提升，而不是说去追求永恒的生命力。

你看，从PC到移动互联网，再到AI，每一次技术浪潮都会淘汰旧有格局，但也会催生新的基础设施。对于中国互联网大厂而言，关键在于在动荡中找到“基础设施化”的路径：通过解决真实需求、降低技术门槛、拥抱边缘创新。

作者：陈白

标签：硅谷技术

海报

阅读

大模型只有智能，没有智慧

AI Agent很关键，但现有AI公司估值存在泡沫

DeepSeek是微软PC时刻

硅谷太傲慢了，中国的机会在平替和平权

相关推荐

一觉醒来，专业没了

平台捆绑与合规高压，千万网红童锦程的“洗白”困局

彩妆巨头集体“恋上”护肤，谁能俘获芳心？

小米、东风加持，博泰车联网二次赴港上市背后难掩多重困境

6月17日A股分析：沪指跌0.04%报3387.4点，两市合计成交12072.22亿元，资金流入最多的行业板块为电池

国药和华润，快把血制品公司买光了

中国跑出一个电算帝国

突然“暴雷”，欢牛蛋糕屋官宣倒闭，曾计划今年新开百店