【杜兰说AI】机器人领域现在最主要的难题是什麽呢?
2025年02月28日 10:15
我觉得,
是现在机器人的“大脑”还是不够聪明。
这两年发展特别快的大模型,
它的全名是“大型语言模型”,
绝大多数都是基於互联网上的大量人类资源数据,
训练出来的“语言”层面的智能,
但要进入真实的物理世界,
还是远远不够的。
就像黄仁勋在CES2025上说的,
AI 发展的最後一个阶段是“物理AI”,
它强调的就是AI对於物理空间的理解和感知,
比如物理空间学,
比如几何和空间关系等等,
李飞飞团队在去年年底的
“一张图生成一个可交互3D世界”的空间智能模型,
也是这个方向。
在仿真环境中训练,
基於人类语言的数据,
与真实物理世界中的数据是有本质的差别的。
就像你再如何用语言教一个人握住瓶子,
都不如直接让他直接看到这个瓶子的形状,
知道它有多重来得快。
在全球最具权威的IT研究与咨询公司Gartner
最新发布的“新兴技术成熟度曲线图”中,
“人形工作机器人”仍然排在“技术萌芽期”的阶段,
也就是说,
这个领域还需要10年以上的时间,
才能走向生产成熟。
现在业界努力的方向,
主要有两个。
第一,
自动驾驶为啥进步快?
靠的就是路上狂跑攒数据,
机器人当然也一样。
现在比较主流的,
要麽是让机器人看自己操作的视频学经验,
要麽是让机器人用仿真环境狂练技能。
第二,
还是得靠AI技术上的突破,
比如李飞飞的空间智能模型,
还有杨乐昆的世界模型,
都是在让AI学着认识和理解真实的三维世界。
我和很多人一样,
都在期待着机器人领域迎来一个DeepSeek式的惊喜,
期待着马斯克所说的“人手三台人形机器人”的未来。
是现在机器人的“大脑”还是不够聪明。
这两年发展特别快的大模型,
它的全名是“大型语言模型”,
绝大多数都是基於互联网上的大量人类资源数据,
训练出来的“语言”层面的智能,
但要进入真实的物理世界,
还是远远不够的。
就像黄仁勋在CES2025上说的,
AI 发展的最後一个阶段是“物理AI”,
它强调的就是AI对於物理空间的理解和感知,
比如物理空间学,
比如几何和空间关系等等,
李飞飞团队在去年年底的
“一张图生成一个可交互3D世界”的空间智能模型,
也是这个方向。
在仿真环境中训练,
基於人类语言的数据,
与真实物理世界中的数据是有本质的差别的。
就像你再如何用语言教一个人握住瓶子,
都不如直接让他直接看到这个瓶子的形状,
知道它有多重来得快。
在全球最具权威的IT研究与咨询公司Gartner
最新发布的“新兴技术成熟度曲线图”中,
“人形工作机器人”仍然排在“技术萌芽期”的阶段,
也就是说,
这个领域还需要10年以上的时间,
才能走向生产成熟。
现在业界努力的方向,
主要有两个。
第一,
自动驾驶为啥进步快?
靠的就是路上狂跑攒数据,
机器人当然也一样。
现在比较主流的,
要麽是让机器人看自己操作的视频学经验,
要麽是让机器人用仿真环境狂练技能。
第二,
还是得靠AI技术上的突破,
比如李飞飞的空间智能模型,
还有杨乐昆的世界模型,
都是在让AI学着认识和理解真实的三维世界。
我和很多人一样,
都在期待着机器人领域迎来一个DeepSeek式的惊喜,
期待着马斯克所说的“人手三台人形机器人”的未来。