核心内容の要約
清華大学の姜峣氏のチーム(8人の博士全員が彼に従っている)は、主流のAIアプローチとは異なる道を歩んでいます。神経科学の研究から「操作には本能があり、言語には本能がない」ということを発見し、8年間かけて「本能に基づく」ロボットの動作メカニズムを開発してきました。大規模なデータを使ったモデル構築ではなく、人間のような触覚本能(例えば物を掴む際に滑りを感知し、力加減を自動的に調整する能力)をロボットに組み込むことで、工業現場でVLA(視覚・言語・動作の連携)や世界モデルが機能しない問題を解決しました。現在では化粧品やアロマなどの消費財産業で実用化されており、「生産ラインの変更時に機械の調整が不要」というニーズに応えています。
1. なぜ彼らはAIのトレンドを追わないのか?——操作と言語は根本的に異なる
主流のAI(例:ChatGPT)は「大規模なデータを使ったモデル構築」で成功しているため、ロボットの動作も同じように行えると考えられがちです。しかし、姜峣氏はハーバード大学で人間の脳を研究する中で次のことを発見しました:言語は後天的に学ぶものだ(教えなくても話せるようになる)が、物を掴む動作は誰でも自然とでき、その方法もほぼ同じ。これは操作には本能が関与しており、データだけでは説明できないことを意味します。
例えば、水のボトルを掴む場合、従来の方法では水の重さや摩擦係数を事前に知る必要があります(掴む前には分からない)。しかし本能に基づくアプローチでは、ロボットは物体が滑るのを感知すると自動的に力を加減します。人間のように「手触りで感じ取る」のです。
2. VLAや世界モデルはなぜ失敗したのか?——ハードウェアの違いと接触力学が問題
昨年注目されたVLAや今年の世界モデルは、工業現場で失敗に終わりました:
- VLAの問題:「タスク(例:物を掴む)」と「ハードウェア(ロボットの手)」が密接に結びついている。同じ形状のグリッパーでも締め付け具合が異なれば、VLAで学習したモデルは通用しない。また、VLAには触覚が欠けており、視覚情報だけを模倣するため物を掴むのに役立たない。
- 世界モデルの問題:実際の物理世界をシミュレートしようとしても、接触動作(例:ペンを押す)は星の運動を予測するよりも複雑で、シミュレーターでは摩擦係数やハードウェアの抵抗などの細部を再現できない。実環境から切り離されたシミュレーションは机上の空論に過ぎません。
3. ロボットに「手触り」を持たせるには?——触覚センサーと3つの本能的な反応
姜峣氏のチームは7年間かけて触覚センサーを開発し、物体の硬さや摩擦、滑りなどの情報を取得することができるようにしました。そして、ロボットに3つの「本能的な反応」を組み込みました:
1. 方向性のある反応:物体を見ると自動的に手が近づく。
2. 探索的反応:暗闇でも物体を探す(触覚で位置を把握する)。
3. 掴み取りの反応:滑りを感知して力加減を調整する。
例えば、ロボットが身分証明書を掴む場合、親指がないため自動的に身分証明書を持ち上げて挟む。これはプログラムで決まっているのではなく、本能による「創発的な行動」です。
4. なぜ消費財産業から実用化を始めたのか?——自動車産業では壁にぶつかり、消費財産業のニーズが適していた
当初は自動車産業をターゲットにしましたが、自動車の生産ラインのペース(1分間に100回の動作)が速すぎて機械化が必要であり、メーカーも投資を渋りました。しかし、消費財産業(化粧品やアロマ)では以下のような問題が解決できました:
- 製品の種類が多く(数百種類)、生産ラインの変更が頻繁(数週間ごと)。従来の自動化では毎回機械を調整する必要があり、停止による損失が大きい。
- 例:アロマの芯を正す作業では、芯が柔らかく太さも異なるため、力加減が難しい。これは触覚本能によって解決できる。
彼らの強みは「ゼロコストでの導入」です。ロボットを調整する必要がなく、すぐに使用でき、使えば使うほど熟練していきます。
5. なぜ8人の博士全員が彼に従ったのか?——信念が高給よりも重要で、起業が唯一の道
チームの選抜では「本能に対する信念」を重視しました。コンピューター関連の背景を持つ学生でもデータ駆動型の考え方を変えられなければ参加できませんでした。8人の博士が全員彼に従った理由は:
- 信念の一致:本能に基づくアプローチが正しいと信じており、主流の道を歩みたくない。
- 大学の進化の遅さ:大学では3年かけて1台の試作機を作るが、市場指向の企業は1年で数千台を販売する。起業しないと他社に追い越される。
- 姜峣氏の粘り強さ:彼はこの道を10~30年間続ける意欲があり、チームは彼の能力を信じていた。
起業後は大変でしたが(半年が5年のように感じられた)、製品の出荷が始まり、ユーザーからのフィードバックをもとに改善が進み、成熟してきました。
6. 反対意見の中での価値
主流のAIがデータの蓄積やシミュレーションに注力する中、姜峣氏のチームは人間の本能に基づいてロボットの動作方法を探求しました。彼らが目指すのは「汎用的な操作」ではなく、「物を掴む」という具体的なタスクを人間よりも優れたものにすることです。このような反対意見に立ち向かう姿勢は、業界の実際の問題を解決し、AIの発展に新たな方向性を示しています:人間自身から学ぶことが、データの蓄積よりも効果的かもしれない。