虎嗅

【対話橡木果・姜峣：“言語には本能がない、操作にはある”——清華大学の博士たちが8年間をかけて新しいアプローチに賭けた】

原文：对话橡木果姜峣： “语言没有本能，操作有”，一群清华博士用8年时间押注具身新路线

2026-06-02 阅读原文

核心内容の要約

清華大学の姜峣氏のチーム（8人の博士全員が彼に従っている）は、主流のAIアプローチとは異なる道を歩んでいます。神経科学の研究から「操作には本能があり、言語には本能がない」ということを発見し、8年間かけて「本能に基づく」ロボットの動作メカニズムを開発してきました。大規模なデータを使ったモデル構築ではなく、人間のような触覚本能（例えば物を掴む際に滑りを感知し、力加減を自動的に調整する能力）をロボットに組み込むことで、工業現場でVLA（視覚・言語・動作の連携）や世界モデルが機能しない問題を解決しました。現在では化粧品やアロマなどの消費財産業で実用化されており、「生産ラインの変更時に機械の調整が不要」というニーズに応えています。

1. なぜ彼らはAIのトレンドを追わないのか？——操作と言語は根本的に異なる

主流のAI（例：ChatGPT）は「大規模なデータを使ったモデル構築」で成功しているため、ロボットの動作も同じように行えると考えられがちです。しかし、姜峣氏はハーバード大学で人間の脳を研究する中で次のことを発見しました：言語は後天的に学ぶものだ（教えなくても話せるようになる）が、物を掴む動作は誰でも自然とでき、その方法もほぼ同じ。これは操作には本能が関与しており、データだけでは説明できないことを意味します。

例えば、水のボトルを掴む場合、従来の方法では水の重さや摩擦係数を事前に知る必要があります（掴む前には分からない）。しかし本能に基づくアプローチでは、ロボットは物体が滑るのを感知すると自動的に力を加減します。人間のように「手触りで感じ取る」のです。

2. VLAや世界モデルはなぜ失敗したのか？——ハードウェアの違いと接触力学が問題

昨年注目されたVLAや今年の世界モデルは、工業現場で失敗に終わりました：

VLAの問題：「タスク（例：物を掴む）」と「ハードウェア（ロボットの手）」が密接に結びついている。同じ形状のグリッパーでも締め付け具合が異なれば、VLAで学習したモデルは通用しない。また、VLAには触覚が欠けており、視覚情報だけを模倣するため物を掴むのに役立たない。
世界モデルの問題：実際の物理世界をシミュレートしようとしても、接触動作（例：ペンを押す）は星の運動を予測するよりも複雑で、シミュレーターでは摩擦係数やハードウェアの抵抗などの細部を再現できない。実環境から切り離されたシミュレーションは机上の空論に過ぎません。

3. ロボットに「手触り」を持たせるには？——触覚センサーと3つの本能的な反応

姜峣氏のチームは7年間かけて触覚センサーを開発し、物体の硬さや摩擦、滑りなどの情報を取得することができるようにしました。そして、ロボットに3つの「本能的な反応」を組み込みました：

1. 方向性のある反応：物体を見ると自動的に手が近づく。

2. 探索的反応：暗闇でも物体を探す（触覚で位置を把握する）。

3. 掴み取りの反応：滑りを感知して力加減を調整する。

例えば、ロボットが身分証明書を掴む場合、親指がないため自動的に身分証明書を持ち上げて挟む。これはプログラムで決まっているのではなく、本能による「創発的な行動」です。

4. なぜ消費財産業から実用化を始めたのか？——自動車産業では壁にぶつかり、消費財産業のニーズが適していた

当初は自動車産業をターゲットにしましたが、自動車の生産ラインのペース（1分間に100回の動作）が速すぎて機械化が必要であり、メーカーも投資を渋りました。しかし、消費財産業（化粧品やアロマ）では以下のような問題が解決できました：

製品の種類が多く（数百種類）、生産ラインの変更が頻繁（数週間ごと）。従来の自動化では毎回機械を調整する必要があり、停止による損失が大きい。
例：アロマの芯を正す作業では、芯が柔らかく太さも異なるため、力加減が難しい。これは触覚本能によって解決できる。

彼らの強みは「ゼロコストでの導入」です。ロボットを調整する必要がなく、すぐに使用でき、使えば使うほど熟練していきます。

5. なぜ8人の博士全員が彼に従ったのか？——信念が高給よりも重要で、起業が唯一の道

チームの選抜では「本能に対する信念」を重視しました。コンピューター関連の背景を持つ学生でもデータ駆動型の考え方を変えられなければ参加できませんでした。8人の博士が全員彼に従った理由は：

信念の一致：本能に基づくアプローチが正しいと信じており、主流の道を歩みたくない。
大学の進化の遅さ：大学では3年かけて1台の試作機を作るが、市場指向の企業は1年で数千台を販売する。起業しないと他社に追い越される。
姜峣氏の粘り強さ：彼はこの道を10～30年間続ける意欲があり、チームは彼の能力を信じていた。

起業後は大変でしたが（半年が5年のように感じられた）、製品の出荷が始まり、ユーザーからのフィードバックをもとに改善が進み、成熟してきました。

6. 反対意見の中での価値

主流のAIがデータの蓄積やシミュレーションに注力する中、姜峣氏のチームは人間の本能に基づいてロボットの動作方法を探求しました。彼らが目指すのは「汎用的な操作」ではなく、「物を掴む」という具体的なタスクを人間よりも優れたものにすることです。このような反対意見に立ち向かう姿勢は、業界の実際の問題を解決し、AIの発展に新たな方向性を示しています：人間自身から学ぶことが、データの蓄積よりも効果的かもしれない。