本文作于2026.4.7,真格实习生内部分享(信息具有时效性)
上周初去北京和2家真格被投--丁宁&松铭,都交流了一下,因为我接下来4年phd研究方向就是dexterous manipulation,而且phd可以走联培所以有很开放的深度合作可能,所以谈的很愉快
近期也和其他家做手&数采的公司有交流,聊的都是同一个故事——1条pipeline4个components
<aside>
手-本体
</aside>
小执行器 触觉传感器
反驱、sim2real gap 量产能力
<aside>
数采device-本体
</aside>
收敛至类UMI路线: • 人手joints • 触觉信号 • 视觉一致性 • EEF 6DOF • egocentric+wrist
柔性/刚性 (穿戴舒适性-精度trade-off) 测角方案 触觉集成形式
<aside> ☝
当前主要卡点
</aside>
问题定义: Sensorize human-方浩树 Download human-谢赛宁
<aside>
数据管线pipeline
</aside>
数采device-手本体transfer 3态的对齐
规模化的工程问题
<aside>
触觉native的 model training
</aside>
触觉native v.s. 触觉bonus
触觉know-how: • 触觉传感器本身 压阻 电容 电磁 视触觉 • Task-specific的需求 空间/精度分辨率,排布 甚至是task-specific的触觉design • 视觉-触觉 co-training 高频触觉-低频视觉,maybe快慢系统? 后训再引入 vs 预训native? • 触觉RL、真机RL、IL小模型 单任务技能的训练
不追求泛化,也许能作为实验讲清每个任务对触觉的需求&如何使用不同源数据co-train
<aside> ☝
一片荒芜地
</aside>
know-how分布不均且有壁垒,触觉&数采的认知、技术路线选择有很大差异
(A公司接下来想使用的触觉供应商,B公司一年前就用过摸过底了)
诸如此类的故事有很多,半年摸索的领先都是很大的领先
生态链足够长,每个component下都足够催生一批公司
当下没有哪家公司/机构已自证有包揽4项components的组织能力,生态合作是短期内的主旋律
(且我认为通吃生态位本身也不合理)
whatever手 + whatever数采 + 稳定采集了xxxh的数据 + 训出小模型能完成某几个复杂任务
非灵巧手不能完成,且不是tricky demo而是可稳定复现;先不需要追求泛化,单点任务爆破