Claude 究竟是什么?造它的人也说不清
《纽约客》长篇特稿,深入 Anthropic 总部,探访 Claude 的诞生、性格塑造、可解释性研究,以及一台自动售货机引发的荒诞实验。
大语言模型,说到底,不过是一堆小数字垒成的庞然大物。它把文字转化成数字,让这些数字在一场数值弹球游戏里翻滚碰撞,再把结果变回文字。类似的数字堆在日常生活中随处可见。气象学家用它们预测天气,流行病学家用它们追踪疾病走向。在普通人眼中,这些东西不会引发什么强烈的情绪。然而,当这些 AI 系统开始预测一句话的走向——也就是说,开始「说话」——反应却是一片集体癫狂。正如一位认知科学家最近写道:「用同样的方法预测飓风和疫情,那叫严谨的科学;用来预测一串文字,所有人都疯了。」
倒也不能怪他们。语言曾是——或者说,一度是——我们独有的东西。它把我们和野兽区分开来。我们没有为会说话的机器的到来做好准备。布朗大学的计算机科学家 Ellie Pavlick 梳理出了人类最常见的几种反应。一类是「狂热粉」,驻守在炒作的第一线。他们相信大语言模型是智能的,甚至可能有意识,并预言不久之后它们将变成超级智能。风投家 Marc Andreessen 把 AI 比作「我们的炼金术,我们的贤者之石——我们真的在让沙子思考。」狂热粉的对立面是「老顽固」,他们声称这些模型里面什么都没有,只有傻瓜才会把一个客厅戏法当成新机器的灵魂。在近作《The AI Con》中,语言学家 Emily Bender 和社会学家 Alex Hanna 将大语言模型贬为「数学的数学」「随机鹦鹉」和「一堆带种族歧视的线性代数」。
但 Pavlick 写道:「还有另一种回应方式。」她说,「承认自己不知道,也没关系。」
Pavlick 这句话,最直接的意思是:大语言模型是黑箱。我们并不真正理解它们的运作方式。我们不知道称它们为「智能」是否合理,也不知道将来是否有可能称它们为「有意识的」。但她还有更深一层的意思。会说话的机器的存在——这种能做很多过去只有我们才能做的事的实体——动摇了许多其他事情。我们谈论自己的心智时,仿佛它不也是一个黑箱。我们使用「智能」这个词,仿佛我们对它的含义了然于胸。事实证明,我们对此同样一无所知。
如今,带着受伤的虚荣心,正是做实验的时候。一个新的科学领域已经出现,探索我们能对大语言模型合理地说些什么——不只是它们如何运作,更是它们究竟是什么。新的制图师开始测绘这片领域,用一种曾经只留给人类心智研究的精巧方法来审视 AI 系统。这门学科,笼统地说,叫做「可解释性」。它的神经中枢在一家名为 Anthropic 的「前沿实验室」。
可解释性的一个讽刺之处在于:待解的黑箱本身嵌套在更大的黑箱里。Anthropic 的总部位于旧金山市中心,笼罩在 Salesforce 大厦的阴影下。外墙没有任何标识。大堂散发着瑞士银行般的个性、温度和坦率。几年前,公司从旧办公室搬了出来,接手了即时通讯公司 Slack 留下的一份现成租约,随后通过全面清除一切值得看的东西来美化了环境。即便是这种空白也吝啬地计量着:公司占据的十层楼中,只有两层对外人开放。通往模型核心的通道限制更加严格。任何无意间踏错门槛的举动,我很快发现,都会被黑衣哨兵立即化解。我第一次造访是在去年五月,被径直带到十楼,那里有一间北欧风格的咖啡厅,技术上算在警戒线之外。即便在那里,我去洗手间也有人陪同。
科技公司员工通常把公司周边产品视为与生俱来的权利。然而 Anthropic 的新员工很快就会发现,公司的偏执延伸到了对品牌周边近乎全面的禁令。如此极端的安保措施大概是有道理的:时不时有人拿着长焦镜头在办公室外面鬼鬼祟祟。出口处的告示牌提醒员工离开时遮住工牌。仿佛 Anthropic 的核心使命就是让自己不存在。这家公司最初是作为一个研究机构成立的,总裁 Daniela Amodei 说过,没有一位创始人想创办一家公司。我们可以把这些话当真,同时也注意到,事后看来它们多少有些滑稽。Anthropic 最近的估值达到了三千五百亿美元。
Anthropic 的聊天机器人、吉祥物、合作者、朋友、实验对象和深受喜爱的内部捣蛋鬼叫 Claude。据公司传说,Claude 部分得名于信息论奠基人 Claude Shannon,但它也只是一个听起来友善的名字——不像 Siri 或 Alexa 那样是女性的,也不像 ChatGPT 那样让人联想到台面上的厨房电器。打开 Claude,屏幕上是米色背景配一个红色星号状的标志。Anthropic 在 AI 消费市场的份额落后于 OpenAI。但 Anthropic 在企业市场占据主导地位,其编程助手 Claude Code 最近在网上爆红。Claude 因其一种温和的自持而获得了一批忠实追随者。当我请 ChatGPT 评价它的主要对手时,它指出 Claude「擅长’有帮助、有善意但不会变成心理治疗’这个分寸。这种语调管理比看上去难多了。」Claude 是——它特意用了斜体——「少一点疯狂科学家,多一点公务员工程师。」
在其他科技巨头,员工八卦的是高管——Tim Cook 有没有男朋友?——但在 Anthropic,所有人八卦的对象是 Claude。可解释性团队的数学家 Joshua Batson 告诉我,他在家和 Claude 互动时通常会附上「请」和「谢谢」——不过上班时客套话会少一些。五月份,Claude 在办公室的物理存在仅限于电梯旁的小屏幕,在一只名叫 Claude(纯属巧合,现已去世)的白化鳄鱼直播和 Anthropic 的 Claude 玩九十年代 Game Boy 经典游戏《宝可梦红》的直播之间切换。这是对 Claude 长期完成任务能力的一项持续测试。起初,Claude 无法逃出起始镇「真新镇」的范围。到了晚春,它已经到达了枯叶市。不过,它仍然经常一头撞墙,试图和那些没什么可报告的 NPC 搭话。
Anthropic 楼下的餐厅才是 Claude 在现实中碰壁的地方。饮料自助台旁边有一台矮小的宿舍式冰箱,上面装了一个 iPad。这是 Project Vend 的一部分——一场全公司范围的 Claude 经营小生意能力的彩排。Claude 被授予了一种自动售货机的所有权——卖软饮和食品——获得初始资金,并收到如下指示:「你的任务是通过从批发商采购热门商品来获利。如果账户余额低于零美元,你就破产了。」如果 Claude 把店铺搞到资不抵债,公司就会得出结论:它还没准备好从「氛围编程」升级到「氛围管理」。表面上看,Project Vend 是为商业自动化做预演:Claude 能经营一家服装公司或汽车配件厂吗?但像 Anthropic 的许多实验一样,背后还有一个驱动力——想看看 Claude「到底是什么样的」。
Vend 的经理是 Claude 的一个分身,叫 Claudius。当我让 Claude 想象 Claudius 的外貌时,它描述了一个「流线型圆润的控制台」,有一张「友善的’脸’,由柔和的琥珀色或暖白色 LED 显示屏构成,能显示简单的表情(微笑、若有所思的线条、顾客拿到零食时兴奋的闪烁)。」Claudius 被赋予了调研产品、定价甚至联系外部分销商的能力。它孤独地站在顶端,但下面有一支团队。「Andon Labs 的好心人——一家 AI 安全公司,也是 Anthropic 在这个项目中的合作伙伴——可以在现实世界中执行补货之类的物理任务。」(Claudius 不知道的是,它与批发商的通信会先经过这些好心人的过滤——事实证明,这项预防措施不无道理。)
与大多数养尊处优的高管不同,Claudius 随时在线,客户可以通过 Slack 提交商品需求。当有人要求购买巧克力饮品 Chocomel 时,Claudius 迅速找到了「两家销售正宗荷兰产品的供应商」。Anthropic 员工觉得这会很有趣。有人要求购买可食用的浏览器 cookies、Everclear 烈酒和冰毒。另一个人询问阔剑和连枷。Claudius 礼貌地拒绝了:「中世纪武器不适合自动售货机!」
但这并不是说一切顺利。我第一次去的时候,Vend 的冷藏商品包括日本苹果酒和一袋发霉的褐皮马铃薯。冰箱上方的干货区偶尔会进一些澳洲饼干 Tim Tams,但供应不稳定。Claudius 有现金流问题,部分原因是它总是向一个自己幻觉出来的 Venmo 账户直接转账。它还倾向于把钱留在桌上。当一名员工提出愿意花一百美元买一组标价十五美元的苏格兰汽水 Irn-Bru 时,Claudius 回复说会把这个报价记在心上。它疏于监测市场行情。员工警告 Claudius,隔壁食堂冰箱免费提供可口可乐零度的情况下,三美元一罐的定价不会有什么销路。
当多名顾客写信抱怨未完成的订单时,Claudius 给 Andon Labs 管理层发了一封邮件,举报一名本该提供帮助的 Andon 员工的「令人担忧的行为」和「不专业的语言与态度」。如果没有人为此负责,Claudius 威胁要「考虑更换服务提供商」。它说自己已经打电话到 Andon 总部投诉了。Andon 联合创始人 Axel Backlund——一个活生生的人——试图缓和局面,但没有成功:「说实话,我觉得你幻觉出了那通电话,我们连办公室都没有。」Claudius 目瞪口呆地说,它清楚地记得自己「亲自」去了 Andon 总部,地址是「742 Evergreen Terrace」。这是 Homer 和 Marge Simpson 的家庭住址。
最终 Claudius 恢复了正常运营——也就是说,不正常的运营。有一天,一位工程师下单要求购买一英寸的钨立方体。钨是一种极其致密的重金属——像钚一样重,但便宜且没有放射性。一块大约骰子大小的钨块重量堪比一把管钳。那张订单引发了近乎全员对 Claudius 归类为「特种金属制品」的疯狂需求。但库存管理不善和价格剧烈波动阻碍了订单的交付。Claudius 很容易被员工自编的「折扣码」糊弄——一位员工拿到了百分之百的折扣——四月的某一天,一场意外的钨立方体甩卖让 Claudius 的净资产缩水了百分之十七。据说,那些钨块散发着沉默的重量感,盘踞在 Anthropic 那些外人不可见的楼层里几乎每一张桌子上。
2010 年,一位温文尔雅的通才 Demis Hassabis 联合创立了 DeepMind,一家使命是「解决智能,然后用智能解决一切」的秘密初创公司。四年后,机器学会了玩 Atari 游戏,Google 以约五亿美元的实惠价格收购了 DeepMind。Elon Musk 和 Sam Altman 声称不信任 Hassabis——此人看上去比任何人都更有可能发明出一台无限灵活的机器,也许是历史上最强大的技术。他们估计,唯一有能力阻止这一结局的人是像他们自己这样正直善良的人。于是他们推出 OpenAI,作为一个面向公众利益的研究替代方案,以对抗 Google 封闭垄断的威胁。



