// Embodied AI · 具身智能
论文精读笔记
面向具身智能(Embodied AI)方向的中文论文解析。聚焦 VLA(视觉-语言-动作)模型、
世界模型、控制策略、认知科学等方向,每篇包含架构精读、核心公式、以及与工程实践的连接。
世界模型 · JEPA 路线
World Model · JEPA Lineage
LeCun 倡导的非生成式联合嵌入预测架构。按 "开山→横向扩展→原理改进" 组织。
VLA · 视觉-语言-动作
Vision-Language-Action
把 VLM 作为 backbone,直接从感知+指令映射到机器人动作。当前 embodied 主流路线。
控制 · Policy & Planning
Control · Policy / Planning
底层策略网络与经典控制方法。常作为 VLA / 世界模型的下游输出。
认知科学 · 参考背景
Cognitive Science
从婴幼儿认知、动物智能借鉴经验,指导 embodied AI 的数据/课程/评测设计。
// ABOUT
关于本项目
这是一个个人学习笔记仓库,记录具身智能(Embodied AI)方向的论文精读过程。
每篇笔记包含:论文核心贡献、架构拆解、关键公式推导、以及与实际工程/研究的联系。
使用中文写作,英文专业术语保留对照,方便查阅原文。
如有错误或建议,欢迎通过 GitHub Issues 指出。