文/陈永伟
相传西周时期,有一个皇帝,名叫周穆王,非常喜欢旅游。他曾越过昆仑山西行,用了三年的时间周游世界。
正当他旅行归来时,一位名叫偃师的工匠在路上求见他,并赠送了他自己制作的一个娃娃。该娃娃外观栩栩如生,可以像人一样自由站立和行走。周穆王见状大为惊讶,召来自己最宠爱的妃子一起观看。正当周穆王和他的爱妃仔细端详着傀儡时,燕师一声令下,傀儡就开始唱歌了。这首歌旋律优美,非常动人。当歌曲达到高潮时,木偶伸展四肢并跳舞。如此精彩的表演,让周穆王笑了。
而就在演出即将结束时,意外发生了:木偶对周穆王身边的爱妃深情地眨了眨眼。或许在当时所在的西域,演员向观众眨眼是常有的事,但在从小接受礼仪教育的周穆王看来,这种行为无疑是一种轻浮之举。更重要的是,这种人性化的举动,似乎证实了眼前的娃娃其实是假的。如果真是这样,那么偃师就犯了欺君之罪。周穆王盛怒,下令处死偃师。
偃师赶紧向周穆王解释,自己刚才表演的只是一个傀儡。周穆王见不相信,当场就把娃娃拆了。周穆王看到眼前散落的一堆碎片,终于相信刚才为自己跳舞的人确实不是人。于是我不禁感叹道:“原来人工技能可以达到与天地造物主同等的程度,真是不可思议啊!”
上面的小故事来自《列子·汤问》。按照目前的观点来看,故事中偃师制作的娃娃就是一个机器人。一些神秘的营销账号也炒作了这个传说,作为古代机器人存在的证据。这种炒作当然不可信。作为一部道家经典,《列子》充满了奇幻色彩,而这段关于周穆王、偃师的轶事只是其中记载的数百个故事之一,不具备任何史料价值。不过,这个故事反映了一个问题,那就是人类对创造机器人的追求至少可以追溯到两千多年前。
古代人形机器人
如果我们放眼更广的范围,我们就会发现,对机器人的想象并非中国独有。
例如,古埃及神话中有这样一个故事:法老奥西里斯被弟弟塞特杀死,他的尸体被肢解成许多碎片。后来,奥西里斯的妻子伊西斯找到了丈夫的身体部位,将它们重新组装起来,然后在死神阿努比斯的帮助下复活了他。有趣的是,在古埃及壁画中,奥西里斯的形象是一个背负特斯拉线圈状装置的男子。在出土的陶器上,有伊希斯把手伸进奥西里斯背部的场景。有学者将神话与这些图片结合起来,得出了一个大胆的猜测:所谓复活的奥西里斯实际上并不是一个真人,而只是一个被伊希斯控制的机器人。
虽然这种说法看起来太过离奇,但其实还是有一定历史依据的。在古埃及时期,人们已经掌握了一些简单的机械设计知识,并建造了一些由机械力驱动的机器。有些机器被装饰成人形,变成了“机器人”。比如当时有一个舂米机器人,其实就是用杠杆传动在舂米设备上雕刻出一个人像。在宗教领域,这些当时非常先进的技术当然也得到了广泛的应用。例如,古埃及祭司在祭祀时会使用机械偶像。借助机械传动,这些雕像可以做出张嘴、伸手等简单的动作。显然,这可以大大增加祭祀仪式的神秘感。也许有关奥西里斯的传说只是对这种宗教仪式的扭曲记忆。
作为与古埃及有着密切接触的文明,古希腊对机器人也非常感兴趣。据记载,与柏拉图同时代的工匠菲隆发明了倒酒机器人。机器人的胸部是一个盛酒的容器,容器中的酒可以通过管道输送到其右手的一个烧瓶中。如果人们需要喝水,他们会把杯子放在左手上。然后酒就会自动从壶中流出并倒入杯子中。可想而知,以当时的技术水平,这种人形机器给人的震撼是非常强烈的。
很难确切知道古希腊有多少机器被包装成人类形态。不过,这些“机器人”的话题度应该不亚于今天的ChatGPT。事实上,就连亚里士多德在他的《政治学》中也专门讨论了机器人取代人类后人类社会结构可能发生的变化。 —— 他的选题不亚于两千多年后学者的前卫。
这里需要说明的是,虽然古埃及和古希腊都创造了所谓的“机器人”,但由于当时的技术水平,这些“机器人”只能算是包装成人类形态的机器。它们的结构非常简单,能够完成的活动也非常有限。尽管如此,作为激发人们想象力的先驱,其意义还是重大的。
在接下来的数百年里,人们一直试图将最新技术应用到机器人上。例如,11世纪,著名伊斯兰学者伊斯梅尔·贾扎里(Ismail al-Jazari)发明分段齿轮后,试图用它来改进菲隆(Philon)的倒酒机器人。到了1495年,“后文艺复兴三杰”之一的达·芬奇根据安萨里留下的资料并加以改进。花了十五年的时间,终于打造出了机器人骑士。这个骑士可以通过风和水的能量来驱动,完成张嘴、摇头、挥手、坐起等动作。
之后,随着科技的不断发展,越来越多的机器人被发明出来。到了十八世纪,由发条装置和齿轮驱动的机器人已经成熟。在欧洲各国的宫殿里,经常可以看到各种会写字、画画、唱歌的机器人。就连当时的乾隆宫廷也收藏有一枚文笔钟。只要打开开关,就会工整地写出“八方九地王来”八个大字。
19世纪,发明了越来越复杂的机器人。其中,最著名的就是《土耳其人》。这款由奥地利工匠沃尔夫冈·冯·肯佩伦制作的机器人不仅能说话,还能像人类一样下棋,而且棋艺也非常精湛。它在各国巡演期间,不仅击败了当时的众多国际象棋大师,其气势与一百多年后的AlphaGo颇为相似。不幸的是,这个木偶后来在美国巡演时被火烧毁。然而,得益于这次意外,人们终于解开了这个下棋木偶的秘密:原来,它的下面隐藏着一个方格。下棋时,真正的围棋高手进入棋局控制棋局,并通过麦克风与对手对话。因此,土耳其国际象棋傀儡虽然复杂,但其本质仍然是由人类控制的简单机器。
早期现代人形机器人
进入电气时代后,人们迅速将相关技术应用到机器人上。 1927年,西屋公司的罗恩·温斯利(Ron Wensley)发明了一种机器人,名为赫伯特·泰勒沃克斯(Herbert Televox)。本质上,这个机器人是一块电路板,可以根据声音控制开关并完成某些动作。然而,这块电路板上覆盖着人形,并作为机器人出售。然而,这样一个丑陋且毫无实用价值的机器人毫无卖点,连广告公司都拒绝为其做广告。面对这种尴尬的局面,西屋电气不得不下功夫对特里·沃克斯进行美化,不仅给它加上了胳膊和腿,还给它加上了一张像华盛顿一样的脸。这个策略奏效了。经过一番包装,一块简单的电路板变成了引人注目的高科技产品,就连美国军方也表示了担忧。
特里·沃克斯的意外成功使西屋电气认识到了温斯利的才能。很快,他就升职了,并拥有了自己的研发团队。经过多年的努力,Wensley 的团队于1937 年推出了机器人Elektro。相比Trivox,Elekro 进步了很多。它已经可以根据操作者的语音命令完成包括行走、吸烟、计数等26种动作。虽然这些动作现在看来很呆板,而且语音命令也只能按照固定的脚本进行,但在当时却显得非常神奇。因此,很多人认为Elektro应该算是第一个真正意义上的人形机器人。
从实用价值来看,Elekro其实乏善可陈,但其推广意义却非常重大。自此,机器人成为时尚代表,大量公司、组织和个人相继推出了各种机器人产品。例如,1939年瑞典发明家奥古斯特·哈蒙发明的机器人可以接受无线电指令并行走; 1951年美国人克利福德·兰迪斯发明的机器人可以完成高尔夫挥杆动作。 1953年出现的机器人Garco可以在人类控制下完成多项任务;美国国家航空航天局(NASA)1963年生产的“机动多关节假人”不仅可以模仿30多种动作,还可以试穿利用人体动作的宇航服。
需要注意的是,虽然人形机器人在这一时期全面开花,但这些机器人仍然没有摆脱起源于古埃及的传统——。从根本上来说,它们仍然是需要人类控制的机器,本身并没有智能。可以说它的实用性也很弱。面对这种情况,人们对机器人的发展方向看法不一。
有人认为,开发机器人最重要的是让其代替人类完成各种任务。它们是否与人类相似并不重要。基于这种认识,他们开始专注于非人形机器人的开发。具有里程碑意义的事件是1959年Unimate #001机器人的发明。准确地说,由发明家Joseph F. Engelberger和George C. Devol联合开发的Unimate #001实际上只是一只机械手。虽然它不具有完整的人类形态,但它可以很好地模仿人类的双手,完成各种复杂的任务。由于其强大的实用性,Unimate #001在发明后不久就被应用到工业领域,执行装配、喷漆等各种任务。显然,与那些华而不实的人形机器人相比,像Unimate #001 这样的机械臂确实很实用。因此,它的成功也引领了机器人的发展走向另一个方向:更注重功能的非人形机器人取代了人形机器人,成为机器人的主流。
然而,一些人仍然坚持开发人形机器人。在他们看来,虽然基于当时的情况,非人形机器人确实具有很多功能优势,但只有人形机器人才能适应更通用的任务。从长远来看,人形机器人将成为主流。然而,以当时人形机器人的发展水平来看,这一切显然是天方夜谭,而要改变这一切,就必须赋予机器人智能。
赋予人形机器人智能
1973年,日本早稻田大学发布了一款人形机器人WABOT-1。这款机器人由著名机器人专家加藤一郎设计,并以大学命名,身高与人一样高。它可以用两只脚行走,搬运物品和执行其他任务,还可以用简单的日语与人交谈。与之前的人形机器人不同,WABOT-1 并不是在操作员的控制下完成这些任务。它配备了人工视觉和听觉装置,双手也配备了传感器。因此,它可以通过视觉、听觉、触觉来感知周围的情况,并自行调整动作。
根据控制论的观点,非生命体可以与生命体有很多共同点。非生命体要像生命体一样智能,关键是要有与生命体同样的感知和响应周围复杂环境的能力。要做到这一点,它至少需要包括三个要素:感觉要素、运动要素和思维要素。其中,感觉元件主要用于了解周围环境的状态;运动元件主要用于对外界做出反应动作;思维元素负责根据从感觉元素获得的信息得出应该采取什么对策。显然,我们之前提到的机器人中,这三个要素并不全面。更准确的说,它们基本上只有运动的成分,缺乏感觉和思考的成分。因此,他们不能被认为是聪明的,也不能实现自我控制。相比之下,WABOT-1 完成了这三个要素。从这个意义上来说,它与以往的机器人有着本质的区别,成为了真正的智能机器人。
我国国家机器人检测评估中心发布了机器人智能化标准。根据这个标准,智能机器人的智能水平从低到高可分为五个等级:L1为基础级,表示已经具备一定的智能水平; L2表示机器人可以与人实现半交互; L3意味着机器人可以实现与人的充分互动; L4表示机器人可以实现完全自主行动; L5意味着机器人能够适应环境。如果应用该标准,WABOT-1的智能程度大约为L1级别。事实上,当时的研究人员还测试了WABOT-1的智力水平,结果是它的智力大约相当于一岁半的孩子。这一智能水平虽然不高,但实现了机器人智能的“零突破”,其象征意义非常重要。
1984年,加藤一郎带领的团队推出了WABOT新一代产品WABOT-2。 WABOT-2定位为音乐机器人。它可以自行识别乐谱,并根据乐谱用手灵活地弹奏电子键盘。显然,这比其前身有了很大的进步。如果按照之前的标准,大约已经达到了L2级别。
加藤一郎研究团队的成功再次激发了人们对人形机器人的兴趣。然而,人们很快发现,在目前的技术水平下,想要制造出完美的人形机器人非常困难:一方面,其智能水平难以提高;另一方面,其智能水平也难以提高。另一方面,机器也很难成功实现人类的各种动作。这不是一件容易的事。在这种情况下,除了少数机构外,大多数研究团队都将研究重点重新转移到非人形机器人领域。
人形机器人的两条路
人形机器人在上世纪末再次进入人们的视野。 1997年,本田推出了P3人形机器人。该机器人配备了三维视觉和平衡系统,不仅可以使其两足完全独立行走,还可以识别障碍物并自行改变方向。即使被推倒了,他还能自己站起来。此外,它还可以与人进行口头互动,根据语音命令与人进行交流。
2000年,本田在P3的基础上进一步推出了ASIMO机器人。与P3相比,这款机器人在性能上取得了很大的提升。它不仅可以实现跑步、跳跃等多种运动,通过视觉和听觉传感器规划路线,避免与人类发生碰撞,还可以使用语音或手语与人类进行交流。更重要的是,它还可以完成许多复杂的活动,比如给人们倒茶、倒水,甚至可以为人们表演舞蹈。 —— 可以说,正是有了阿西莫,偃师娃娃的传说才最终变成了现实。由于其强大的功能,Asimo自推出以来就广受欢迎。在接下来的几年里,它不仅环游世界,还成为纽约证券交易所的第一个非人类敲钟人。遗憾的是,由于ASIMO的成本非常高,所以并没有很受欢迎,所以这款机器人的研发在2018年就停止了。2022年,阿西莫的最后一次表演结束了,这款曾经闻名的机器人也宣布退役。
尽管阿西莫本身在商业上并不成功,但却向人们展示了人形机器人的巨大潜力。尤其是在艺术表演和日常服务方面,人形机器人的优势得到了充分的展现。这激发了许多企业重新关注仿人机器人,从而掀起了新一轮的仿人机器人热潮。在这波新热潮中,人形机器人的发展大致可以分为两条路线:
一是简化机器人的部分功能并控制其成本,从而快速实现商业普及的目标。这条路线的代表是法国公司Aldebaran Robotics于2006年推出的NAO机器人。 NAO的能力虽然比ASIMO稍弱,但性能也达到了非常高的水平。在动作方面,NAO达到了25个自由度,可以实现行走、踢球等更复杂的动作,甚至可以打出一套完整的太极拳。在智能方面,NAO可以自动识别周围环境,看、听、说,与人互动。根据上述标准,基本达到L3标准。更重要的是,它还可以通过进一步编程来扩展机器人的功能。正因为这些特点,NAO机器人一经推出就大受欢迎。
另一条路线是进一步增强机器人的能力,使其能够完成更复杂的任务。走这条路线的代表公司是波士顿动力公司。这家脱胎于麻省理工学院的公司有着浓厚的学术气质。当同行们考虑如何开发满足市场的商业产品时,它却花了十多年的时间来研究机器人腿的稳定性。这种“十年面壁,力图打破”的精神,为其赢得了行业内外的良好声誉。 2009年,波士顿动力公司发布了人形机器人Petman。该机器人旨在为美国军方试验防护服。得益于之前对腿部稳定性的研究打下的坚实基础,佩特曼可以在没有外部支撑的情况下轻松完成站立、跑步、蹲下和爬行等任务。他的灵活性和平衡性都非常好。不仅如此,它还可以调节自身的体温、湿度和排汗来模拟人体生理中的自我保护功能,因此可以很好地达到测试防护服的目的。 2013年,波士顿动力公司推出了人形机器人Atlas的原型机。这款机器人在Pateman机器人的基础上进一步优化,从一开始就具有非常好的性能。它不仅可以在碎石上顺利行走,而且在遇到外部冲击后也能迅速恢复平衡。 2016年,Atlas正式发布第一代产品。这时,它就可以完全摆脱线缆的束缚,依靠内置的电池组在路上知己知彼。此后,Atlas经历了多轮迭代。最新版本中,它不仅可以完成跑酷、后空翻、侧滚、前滚、180度空中转身、空中劈叉、360度空中转身等高难度动作,还可以进行复杂的动作。自主行动。在野外环境中完成各种任务。如果按照之前的智能标准,应该已经达到L4级别了。
需要指出的是,尽管波士顿动力公司的人形机器人表现出色,但这一卓越产品线的商业化前景仍不明朗。波士顿动力公司在过去几年里经历了三位所有者。它首先被谷歌收购,然后转让给软银,最近又被现代收购。每次收购前,买家都满怀希望,但后来却对波士顿动力“只讲努力,不讲收获”的学院派风格感到失望。需要指出的是,波士顿动力公司并不拒绝商业化,但其目前最成功的商业化产品是四足机器人Spot,而不是Atlas为代表的人形机器人。在这样的情况下,人们不得不对其持续的发展方向打上一个大大的问号。
人形机器人将走向何方?
我们看到,目前人形机器人的发展已经达到了相当的高度,神话般的偃师娃娃利用现代技术已经可以完美实现。但尽管如此,人形机器人要真正走进社会、走进家庭,似乎还有很长的路要走。相比技术原因,更重要的原因还是来自经济层面。
单纯从性能上看,ASIMO、Atlas等机器人已经达到了相当的水平,但其商业化还算不上成功。关键是它的成本太高了。如前所述,在工业场景中,人形机器人没有优势,更便宜、更实用的非人形机器人就足以满足要求。因此,人形机器人想要追求商业落地,更有可能是在消费场景。但问题是,仿人机器人的价格对于普通消费者来说太高了。以Asimo为例,其单台成本在300万至400万美元之间。如此高的成本,在消费者端使用起来显然是非常困难的。事实上,阿西莫推出后,其主要用途是在表演中,但其一场表演的表演费高达数万美元。显然,除了一些愿意“尝鲜”的订单外,客户很难愿意长期聘请如此高价的机器执行者。尤其是随着元宇宙技术的发展,人们发现如此昂贵的表演者可以被廉价的3D虚拟形象所取代,其需求急剧下降。在此背景下,曾经风光无限的阿西莫不得不黯然退役。
通过以上分析,我们不难得出结论,随着技术已经达到相当水平,仿人机器人下一步发展的关键应该是性价比问题。只有平衡技术开发、成本控制和功能开发,人形机器人才能真正从科幻小说走进人们的日常生活。
目前,最积极从成本效益角度寻求人形机器人实施突破的公司可能是特斯拉。 2022年10月1日的“特斯拉AI日”上,马斯克代表特斯拉非常高调地推出了公司首款人形机器人“擎天柱”。根据发布会上的展示,擎天柱已经可以独立行走,但脚步不是很平稳。与此同时,现场还播放了一段有关擎天柱的视频。视频显示,擎天柱已经可以完成搬运重物、给植物浇水等任务。然而,它在运动和工作时还需要一根牵引绳来引导它。
擎天柱机器人首次亮相后,收到了两种完全相反的评价。特斯拉粉丝普遍认为擎天柱很有科技感,很有魅力。不过,专业领域人士对这款机器人表示了更多的不认可。毕竟有阿西莫、阿特拉斯等机器人在面前,擎天柱的表现几乎没有任何优势可言。但如果我们只关注技术方面,显然会曲解马斯克的意图。事实上,相对较低的性能可能是马斯克的有意之举,因为它可以有效降低成本。根据马斯克自己的展望,这种低成本机器人将非常容易量产,未来几年产量将达到数百万台。一旦生产规模扩大,规模经济和学习曲线将推动成本迅速下降。最终,Optimus Prime 机器人的成本可能会降低到2 万美元以下,甚至低于一辆特斯拉汽车。如果真是这样,那么这款机器人就可以真正走进家庭,并被消费者所接受。
此外,如果你看看马斯克最近的商业活动,似乎还可以发现擎天柱机器人的另一个重要作用。从表面上看,马斯克最近的商业行为似乎非常混乱:一会儿收购Twitter,一会儿投资大型模型团队,而且似乎没有一个焦点。但事实上,所有这些行为很可能都是马斯克试图打造一个完整的商业生态系统的尝试。 —— Twitter是最好的数据源。可作为有价值的大型模型培训教材;大模型可以赋予机器人更高的能力。智能水平,大大提高机器人的交互能力。如果这一切都做到了,机器人将更容易受到人们的欢迎,从而为机器人进入人们的生活扫清障碍。一旦机器人进入家庭,它就可以通过实践获得更多有价值的数据,这不仅有助于提升其性能,也能为特斯拉的其他业务活动做出贡献。从这个意义上来说,擎天柱机器人很可能不仅仅是一个产品,而是特斯拉未来商业生态系统的关键组成部分。
特斯拉能走这条路吗?我们还不知道。但从特斯拉汽车的经验来看,其成功的概率似乎还是比较高的。更值得期待的是,似乎与此同时,很多其他公司也开始尝试与特斯拉同样的事情,其中包括小米、玉树等中国公司。相信在不久的将来,我们一定能够以相对低廉的价格拥有自己的人形机器人。