Towards General Robotic Manipulation，我们现在在哪里

本文作于2026.4.7，真格实习生内部分享（信息具有时效性）

上周初去北京和2家真格被投--丁宁&松铭，都交流了一下，因为我接下来4年phd研究方向就是dexterous manipulation，而且phd可以走联培所以有很开放的深度合作可能，所以谈的很愉快

近期也和其他家做手&数采的公司有交流，聊的都是同一个故事——1条pipeline4个components

<aside>

手-本体

</aside>

小执行器触觉传感器

反驱、sim2real gap 量产能力

<aside>

数采device-本体

</aside>

收敛至类UMI路线： • 人手joints • 触觉信号 • 视觉一致性 • EEF 6DOF • egocentric+wrist

柔性/刚性（穿戴舒适性-精度trade-off）测角方案触觉集成形式

<aside> ☝

当前主要卡点

</aside>

技术路线未共识
产品化未量产
无产品验证走通整条pipeline

问题定义： Sensorize human-方浩树 Download human-谢赛宁

<aside>

数据管线pipeline

</aside>

数采device-手本体transfer 3态的对齐

规模化的工程问题

<aside>

触觉native的 model training

</aside>

触觉native v.s. 触觉bonus

触觉know-how： • 触觉传感器本身压阻电容电磁视触觉 • Task-specific的需求空间/精度分辨率，排布甚至是task-specific的触觉design • 视觉-触觉 co-training 高频触觉-低频视觉，maybe快慢系统？后训再引入 vs 预训native？ • 触觉RL、真机RL、IL小模型单任务技能的训练

不追求泛化，也许能作为实验讲清每个任务对触觉的需求&如何使用不同源数据co-train

<aside> ☝

一片荒芜地

</aside>

很少有组织有凑齐前三项的能力，而且实验中需要co-design调整
前三项链路未通过共识，卡点和精力未后移至此

各家聊下来后的直观对比：

know-how分布不均且有壁垒，触觉&数采的认知、技术路线选择有很大差异

（A公司接下来想使用的触觉供应商，B公司一年前就用过摸过底了）

诸如此类的故事有很多，半年摸索的领先都是很大的领先

横跨hardware和learning，长链路高复杂强耦合，工业界&科研界共同积累know-how

生态链足够长，每个component下都足够催生一批公司

当下没有哪家公司/机构已自证有包揽4项components的组织能力，生态合作是短期内的主旋律

（且我认为通吃生态位本身也不合理）

Next Aha Moment：轻量化走通了整条pipeline

whatever手 + whatever数采 + 稳定采集了xxxh的数据 + 训出小模型能完成某几个复杂任务

非灵巧手不能完成，且不是tricky demo而是可稳定复现；先不需要追求泛化，单点任务爆破

值得关注的SOTA

手本体：WUJI，sharpa，强脑即将release

各家聊下来后的直观对比：

横跨hardware和learning，长链路 高复杂 强耦合，工业界&科研界共同积累know-how

Next Aha Moment：轻量化走通了整条pipeline

值得关注的SOTA

横跨hardware和learning，长链路高复杂强耦合，工业界&科研界共同积累know-how