使用微信扫一扫分享到朋友圈
使用微信扫一扫进入小程序分享活动
达闼机器人早期投资人兼董事会成员,腾讯即时通讯部(QQ)总经理、腾讯云创始副总裁、AI创业公司CEO
一、课程导论
1. 什么是具身智能?基本定义及重要性
(1) 基本定义:智能不是孤立于身体和环境,而是通过感知、行动和环境的交互而产生。
(2) 核心思想:智能体(生物体或机器人)必须通过其身体与环境产生交互,智能由此涌现。
2. 具身智能与传统人工智能的区别:符号主义 vs 具身认知
(1) 对比传统人工智能的符号主义方法(Symbolic AI)。
(2) 为什么需要从“身体”出发理解智能?
3. 具身智能的三大应用场景:
(1) 机器人学:机器人通过身体与环境交互完成复杂任务(如行走、攀爬)。
(2) 虚拟环境:在虚拟环境(如游戏、仿真)中训练AI Agent完成具身化任务。
(3) 自动驾驶:将物理环境中的感知与行动结合,优化车辆导航和安全性。
二、具身智能的理论基础
1. 多学科背景:
(1) 认知科学:具身认知理论(Embodied Cognition)
1) 人类的大脑如何通过身体感知世界
2) 动态系统理论(Dynamic Systems Theory)
(2) 神经科学:感觉-运动循环的作用。
1) 感觉(Perception)如何与动作(Action)联结。
2) 镜像神经元的发现及启示。
(3) 哲学:现象学对具身智能的启发。
1) “身体”作为理解世界的核心。
2) Merleau-Ponty的“身体-主体性”理论。
2. 重要理论:
(1) 行为主义机器人(Behavior-based Robotics)
1) Rodney Brooks的“智能无需表征”(Intelligence without Representation)。
(2) 生态心理学(Ecological Psychology)
1) Gibson的“直接感知”(Direct Perception)与“可供性”(Affordance)。
3. 案例研究:从Shakey到现代具身系统。
三、空间智能(Spatial Intelligence)——感知与行动的耦合
1. 场景理解模型:
(1) 通过视觉信息推理物体的空间关系,帮助AI完成复杂的空间导航和任务规划
(2) 案例:ImageNet和近期的3D场景重建项目
2. SLAM技术:
(1) 通过空间智能提供精确的环境建模,帮助机器人完成定位和路径规划
(2) 案例:自动驾驶中的激光雷达导航
3. 感知-行动闭环:
(1) 感知与行动如何相互作用。
(2) 动态环境中感知和行动的实时调整。
4. 环境的动态影响:
(1) 环境不仅是智能体的输入,而且是学习和适应的关键。
5. 自主学习与适应:
(1) 强化学习(Reinforcement Learning)在感知-行动中的作用。
(2) 自主探索行为(Curiosity-driven Learning)。
四、具身智能的系统构建
1. 硬件与身体形态:
(1) 传感器:视觉、触觉、听觉及其他感官。
(2) 致动器:肢体、柔性材料和机械组件。
(3) 身体形态如何影响智能表现(如地形适应的四足机器人)。
2. 软件与控制:
(1) 控制算法:分布式控制与集中式控制。
(2) 实时响应系统:如何实现低延迟、高精度的感知与行动。
3. 案例分析:
(1) 四足机器人如何实现稳定行走。
(2) 柔性机器人如何通过形态适应环境。
五、具身智能的商业落地
1. 机器人学:自主机器人、服务机器人与协作机器人。
2. 人机交互:具身虚拟助手、增强现实与混合现实。
3. 医疗领域:康复机器人、假肢控制与人体增强。
4. 案例分析:OpenAI的Dactyl项目、软体机器人。
六、深度学习与具身智能的结合
1. 深度学习与具身智能的交叉:
(1) 深度强化学习(Deep Reinforced Learning)如何优化感知-行动循环。
(2) 自监督学习(Self-Supervised Learning)在具身智能中的应用。
2. 多模态学习:
(1) 将视觉、触觉、声音等多种感官数据结合起来。
3. 模拟环境中的训练:
(1) 使用工具(如MuJoCo、PyBullet)进行具身任务的强化学习
七、具身智能行业现状
1. 全球具身智能(机器人)产业图谱
(1) 上游:核心零部件(传感器、芯片、伺服系统)
(2) 中游:机器人本体制造商、系统集成商
(3) 下游:工业、服务、消费级场景应用
2. 国内外头部企业分析
(1) 国外:波士顿动力、特斯拉、Figure AI
(2) 国内:宇树科技、智元、优必选
八、具身智能行业的投资逻辑与机会
1. 产业链投资逻辑:
(1) 核心零部件国产替代(力矩传感器、精密减速器)
(2) 具身大模型开发平台
(3) 垂直场景解决方案(仓储物流、医疗手术)
(4) 仿真训练与数字孪生工具链
2. 未来趋势投资逻辑:
(1) 技术融合:脑机接口+具身智能的想象空间
(2) 成本下降曲线:何时迎来消费级爆发点?
(3) 投资窗口期判断:硬件先行还是软件为王?
3. 项目评估标准:
(1) 技术壁垒评估:专利布局、研发团队背景
(2) 商业化验证:客户粘性、订单增长曲线
(3) 卡位能力:是否具备平台化潜力
一、课程导论
二、具身智能的理论基础
三、空间智能(Spatial Intelligence)——感知与行动的耦合
四、具身智能的系统构建
五、具身智能的商业落地
六、深度学习与具身智能的结合
七、具身智能行业现状
八、具身智能行业的投资逻辑与机会