本文作于2026.4.7,真格实习生内部分享(信息具有时效性)

上周初去北京和2家真格被投--丁宁&松铭,都交流了一下,因为我接下来4年phd研究方向就是dexterous manipulation,而且phd可以走联培所以有很开放的深度合作可能,所以谈的很愉快

近期也和其他家做手&数采的公司有交流,聊的都是同一个故事——1条pipeline4个components

<aside>

手-本体

</aside>

小执行器 触觉传感器

反驱、sim2real gap 量产能力

<aside>

数采device-本体

</aside>

收敛至类UMI路线: • 人手joints • 触觉信号 • 视觉一致性 • EEF 6DOF • egocentric+wrist

柔性/刚性 (穿戴舒适性-精度trade-off) 测角方案 触觉集成形式

<aside> ☝

当前主要卡点

</aside>

问题定义: Sensorize human-方浩树 Download human-谢赛宁

<aside>

数据管线pipeline

</aside>

数采device-手本体transfer 3态的对齐

规模化的工程问题

<aside>

触觉native的 model training

</aside>

触觉native v.s. 触觉bonus

触觉know-how: • 触觉传感器本身 压阻 电容 电磁 视触觉 • Task-specific的需求 空间/精度分辨率,排布 甚至是task-specific的触觉design • 视觉-触觉 co-training 高频触觉-低频视觉,maybe快慢系统? 后训再引入 vs 预训native? • 触觉RL、真机RL、IL小模型 单任务技能的训练

不追求泛化,也许能作为实验讲清每个任务对触觉的需求&如何使用不同源数据co-train

<aside> ☝

一片荒芜地

</aside>

各家聊下来后的直观对比:

know-how分布不均且有壁垒,触觉&数采的认知、技术路线选择有很大差异

(A公司接下来想使用的触觉供应商,B公司一年前就用过摸过底了)

诸如此类的故事有很多,半年摸索的领先都是很大的领先

横跨hardware和learning,长链路 高复杂 强耦合,工业界&科研界共同积累know-how

生态链足够长,每个component下都足够催生一批公司

当下没有哪家公司/机构已自证有包揽4项components的组织能力,生态合作是短期内的主旋律

(且我认为通吃生态位本身也不合理)

Next Aha Moment:轻量化走通了整条pipeline

whatever手 + whatever数采 + 稳定采集了xxxh的数据 + 训出小模型能完成某几个复杂任务

非灵巧手不能完成,且不是tricky demo而是可稳定复现;先不需要追求泛化,单点任务爆破

值得关注的SOTA