虎嗅

【対話橡木果・姜峣:“言語には本能がない、操作にはある”——清華大学の博士たちが8年間をかけて新しいアプローチに賭けた】

原文:对话橡木果姜峣: “语言没有本能,操作有”,一群清华博士用8年时间押注具身新路线

核心内容の要約

清華大学の姜峣氏のチーム(8人の博士全員が彼に従っている)は、主流のAIアプローチとは異なる道を歩んでいます。神経科学の研究から「操作には本能があり、言語には本能がない」ということを発見し、8年間かけて「本能に基づく」ロボットの動作メカニズムを開発してきました。大規模なデータを使ったモデル構築ではなく、人間のような触覚本能(例えば物を掴む際に滑りを感知し、力加減を自動的に調整する能力)をロボットに組み込むことで、工業現場でVLA(視覚・言語・動作の連携)や世界モデルが機能しない問題を解決しました。現在では化粧品やアロマなどの消費財産業で実用化されており、「生産ラインの変更時に機械の調整が不要」というニーズに応えています。

1. なぜ彼らはAIのトレンドを追わないのか?——操作と言語は根本的に異なる

主流のAI(例:ChatGPT)は「大規模なデータを使ったモデル構築」で成功しているため、ロボットの動作も同じように行えると考えられがちです。しかし、姜峣氏はハーバード大学で人間の脳を研究する中で次のことを発見しました:言語は後天的に学ぶものだ(教えなくても話せるようになる)が、物を掴む動作は誰でも自然とでき、その方法もほぼ同じ。これは操作には本能が関与しており、データだけでは説明できないことを意味します。

例えば、水のボトルを掴む場合、従来の方法では水の重さや摩擦係数を事前に知る必要があります(掴む前には分からない)。しかし本能に基づくアプローチでは、ロボットは物体が滑るのを感知すると自動的に力を加減します。人間のように「手触りで感じ取る」のです。

2. VLAや世界モデルはなぜ失敗したのか?——ハードウェアの違いと接触力学が問題

昨年注目されたVLAや今年の世界モデルは、工業現場で失敗に終わりました:

  • VLAの問題:「タスク(例:物を掴む)」と「ハードウェア(ロボットの手)」が密接に結びついている。同じ形状のグリッパーでも締め付け具合が異なれば、VLAで学習したモデルは通用しない。また、VLAには触覚が欠けており、視覚情報だけを模倣するため物を掴むのに役立たない。
  • 世界モデルの問題:実際の物理世界をシミュレートしようとしても、接触動作(例:ペンを押す)は星の運動を予測するよりも複雑で、シミュレーターでは摩擦係数やハードウェアの抵抗などの細部を再現できない。実環境から切り離されたシミュレーションは机上の空論に過ぎません。

3. ロボットに「手触り」を持たせるには?——触覚センサーと3つの本能的な反応

姜峣氏のチームは7年間かけて触覚センサーを開発し、物体の硬さや摩擦、滑りなどの情報を取得することができるようにしました。そして、ロボットに3つの「本能的な反応」を組み込みました:

1. 方向性のある反応:物体を見ると自動的に手が近づく。

2. 探索的反応:暗闇でも物体を探す(触覚で位置を把握する)。

3. 掴み取りの反応:滑りを感知して力加減を調整する。

例えば、ロボットが身分証明書を掴む場合、親指がないため自動的に身分証明書を持ち上げて挟む。これはプログラムで決まっているのではなく、本能による「創発的な行動」です。

4. なぜ消費財産業から実用化を始めたのか?——自動車産業では壁にぶつかり、消費財産業のニーズが適していた

当初は自動車産業をターゲットにしましたが、自動車の生産ラインのペース(1分間に100回の動作)が速すぎて機械化が必要であり、メーカーも投資を渋りました。しかし、消費財産業(化粧品やアロマ)では以下のような問題が解決できました:

  • 製品の種類が多く(数百種類)、生産ラインの変更が頻繁(数週間ごと)。従来の自動化では毎回機械を調整する必要があり、停止による損失が大きい。
  • 例:アロマの芯を正す作業では、芯が柔らかく太さも異なるため、力加減が難しい。これは触覚本能によって解決できる。

彼らの強みは「ゼロコストでの導入」です。ロボットを調整する必要がなく、すぐに使用でき、使えば使うほど熟練していきます。

5. なぜ8人の博士全員が彼に従ったのか?——信念が高給よりも重要で、起業が唯一の道

チームの選抜では「本能に対する信念」を重視しました。コンピューター関連の背景を持つ学生でもデータ駆動型の考え方を変えられなければ参加できませんでした。8人の博士が全員彼に従った理由は:

  • 信念の一致:本能に基づくアプローチが正しいと信じており、主流の道を歩みたくない。
  • 大学の進化の遅さ:大学では3年かけて1台の試作機を作るが、市場指向の企業は1年で数千台を販売する。起業しないと他社に追い越される。
  • 姜峣氏の粘り強さ:彼はこの道を10~30年間続ける意欲があり、チームは彼の能力を信じていた。

起業後は大変でしたが(半年が5年のように感じられた)、製品の出荷が始まり、ユーザーからのフィードバックをもとに改善が進み、成熟してきました。

6. 反対意見の中での価値

主流のAIがデータの蓄積やシミュレーションに注力する中、姜峣氏のチームは人間の本能に基づいてロボットの動作方法を探求しました。彼らが目指すのは「汎用的な操作」ではなく、「物を掴む」という具体的なタスクを人間よりも優れたものにすることです。このような反対意見に立ち向かう姿勢は、業界の実際の問題を解決し、AIの発展に新たな方向性を示しています:人間自身から学ぶことが、データの蓄積よりも効果的かもしれない