根据业界有关机构的数据,2023年,全球人工智能(AI)机器人市场规模达到143.0亿美元,预计到2032年,将达到824.7亿美元左右,复合年增长率为21.50%。
最近具身智能这个概念很火。那么,究竟什么是具身智能?它包括哪些类别和关键技术?
通过这篇文章,我们来深入了解一下。
什么是具身智能
“智能”,大家都懂,也就是AI。那么,什么是“具身”?
“具身”是一个很小众的名词,通常都出现在哲学、认知科学领域。它的英文叫Embodied,是embody的过去式和过去分词。
em-表示“进入,使……”,-body表示“身体”。组合起来,就是“使……进入身体”。
Embodied Intelligence(具身智能),顾名思义,就是“使智能进入身体”、“给智能一个身体”的意思。
那么,具身智能,是不是就是“AI+身体”呢?
这样说并不准确。
根据业界的普遍共识——具身智能,除了物理身体之外,更关键的是在于能够“与环境进行交互,在交互中不断调整优化”。
也就是说,具身智能是一种基于物理身体进行感知和行动的智能系统。它通过实体智能体与环境的交互,获取信息、理解问题、做出决策,并实现行动,从而产生智能行为和适应性。
本体、智能、环境,被称为具身智能的三要素。AI领域著名大佬李飞飞也曾明确指出:“具身的含义不是身体本身,而是与环境交互以及在环境中做事的整体需求和功能。”

举个例子来解释一下:
我们通过手机和电脑使用的大模型(例如ChatGPT和DeepSeek)或虚拟智能体(AI Agent),擅长处理文字、图片、视频等数据,能与我们进行交流并输出信息,功能非常强大。然而,手机和电脑的感知能力很弱,行动能力几乎为零。所以,无法与环境进行交互。
这种智能,就不是具身智能,而是离身智能(Disembodied Intelligence,智能和身体分离、解耦)。
我们打造一个实体机器身体,在上面部署了AI大脑。如果,只有感知能力(有摄像头、传感器等),没有行动能力(没有手、脚、轮子等),或者,只有行动能力,没有感知能力。那么,它也不属于具身智能。
只有同时具备了AI大脑,以及有感知能力、行动能力的身体,能够和外部环境进行实时互动,才是真正的具身智能。
具身智能的发展历程
具身智能并不是一个新概念。它的起源,可以追溯到1950年。
那一年,著名科学家艾伦・图灵发表了经典的《计算机器与智能》一文,标志着人工智能理论的奠基。在这篇论文的最后两个段落里,图灵展望了人工智能未来可能的两种发展途径。一种是比较抽象的、像下棋所需的智能,一种则是拥有最好的感官、能学习甚至能说英语的智能。
没错,这两种智能,分别就是离身智能和具身智能。
在那之后,人工智能经历了非常波折的发展阶段。受限于当时的科技发展水平,人工智能的主要研究方向,还是以离身智能为主。
至于身体(机器人),当时完全是一条独立的技术路线,没有什么智能可言,行动能力很弱,感知能力更弱。



3万+

被折叠的 条评论
为什么被折叠?



