核心内容の要約
最近、AIプログラミング分野で「Loop Engineering(ループエンジニアリング)」という新しいトレンドが注目を集めています。以前は開発者がAIに手動でヒント(プロンプト)を与えてコードを書かせていましたが、今ではより高度なループシステムを設計し、AIに自らヒントを出させて継続的に作業させることが推奨されています。この新しいアプローチを積極的に支持しているのは、Claude Codeの創始者であるBoris Chernyや「Lobster」の創設者Peter Steinbergerなどの業界の専門家たちです。しかし、tokenコストが高いことやデバッグが困難であるといった実際の問題も存在します。Claude CodeはLoop機能を標準搭載しており、長時間の実行に関する技術的な課題の一部を解決しています。
1. Loop Engineering:AIに指示するからAIに自ら指示させるへ
簡単に言うと、以前のコード作成方法は「AIツールを開いて『ユーザーログインページを作ってほしい』と入力し、AIが出力した後で調整する」というものでした。しかしLoop Engineeringでは、「1時間ごとにログインページにバグがないかチェック→バグがあれば修正→修正後は自動的にテスト→テストに合格すればコードを提出」といったループ処理を設計し、AIにそのルールに従って自動的に実行させます。これにより、開発者は毎回手動で指示を出す必要がなくなります。
Boris Chernyは、自分の仕事が「プロンプトを書く」ことから「ループ処理を設計する」ことに変わったと述べています。つまり、複数のループを実行させてAIに次に何をすべきかを判断させるのです。Peter Steinbergerも同様に、「プログラミング用のAIにプロンプトを書くのではなく、ループ処理を設計する必要がある」と主張しています。これはAIに「自主的な作業マニュアル」を与えることであり、「一時的な労働者」から「継続的に仕事をこなせる従業員」へと変化させることを意味します。
2. ループは「無限の繰り返し」ではなく、「ブレーキ」と「ナビゲーション」が必要
ループとは単に定期的に同じ作業を繰り返すことだけでしょうか?例えば、毎日自動的にメールを送るようなものですか?実際にはそうではありません。効果的なループには「フィードバックのサイクル」が必要です。つまり、従業員にタスクを与えるときには「目標は何か」「どれだけうまくできたか」「いつ終わらせるか」を伝える必要があるのです。
例えば、Eコマース最適化のためのループでは、AIがユーザー行動データを分析し、商品ページのレイアウトを調整し、A/Bテストを行い、転換率が向上したかどうかを確認します。目標に達していなければさらに最適化を続け、達成されたら停止します。「フィードバック」とは転換率データのことで、「ブレーキ」は目標の達成、「ナビゲーション」は方向性の調整です。
YCのCEOであるGarry Tanも、AIを「フォックスコン式の繰り返し作業機械」にしないように注意しています。AIには問題を自ら発見したりプロセスを最適化したりする思考力が求められます。フィードバックがなければ、AIは間違ったコードを繰り返し作成し続ける可能性があります。
3. 実際の問題点:tokenコストが高く、一般開発者には手が出せない
Loopのアイデアは素晴らしいですが、最大の課題はコストです。ループの実行ごとにAI APIが呼び出され、token(AIの「燃料」と考えられるもの)が消費されます。例えば1分間に1回実行する場合、8時間で480回の呼び出しが発生し、コストは非常に高くなります。
大企業(AnthropicやOpenAIなど)はほぼ無限のtoken供給を持っていますが、一般開発者や小規模チームの予算には限りがあります。ある人は「20ドルのプランでは全く足りない!」と不満を述べています。Peter Steinbergerは「時間の方がtokenよりも価値がある」と答えていますが、ネットユーザーからは「それは資金の問題であり、技術的な問題ではない」と反論されています。
Claude Codeはコストを抑えるためにいくつか制限を設けています。ループの最小間隔は1分で、最大実行時間は3日間です。端末を閉じると実行が停止します。しかし、これは一時的な解決策に過ぎません。AIを継続的に動かすためにはやはりお金が必要です。
4. Claude Codeの進化:20分から数日間連続実行へ
Claude Codeは1年前は20分しか連続して実行できませんでした(以前の作業を忘れたりエラーが発生しやすかったりします)。しかし現在では数日間連続して実行できるようになりました。以下の3つの核心的な問題を解決しました:
- コンテキストの記憶喪失:以前は毎回ループが「クールスタート」され、AIは前回何をしたかを忘れていました。現在ではセッションのコンテキストが保持され、前回の操作(例えば修正したバグ)を覚えています。
- 計画能力の不足:以前はAIはすべてを一度に完了しようとしたり、途中で停止してしまったりしていました。現在ではOpusモデルを使用して計画を立て(例えば「Eコマースサイトの作成」を「ホームページ→商品ページ→支払いページ」に分ける)、Sonnetモデルでコードを実行し、役割が明確になっています。
- 自己判断の不正確さ:以前はAIは未完成品を完成品として扱うことがありました(例えばフロントエンドのボタンはあるがバックエンドのロジックが書かれていない)。現在では「ジェネレーター+エベリゲーター+プランナー」の構造を使用しています。ジェネレーターがコードを書き、エベリゲーターがPlaywrightなどのツールを使って実際にテストし(ボタンをクリックして支払いができるか確認)、プランナーがタスクを分割します。エベリゲーターはジェネレーターと事前に契約を結び(例えば「ボタンをクリックした後に必ず支払いページに移動する」という基準を設定し)、コードの作成を開始します。これにより理解の偏りを防ぎます。
5. 実装は簡単ではない:デバッグが困難で、移行コストが高い
多くの開発者がLoopを試してみた結果、実際の運用は想像以上に面倒だと感じています:
- デバッグが困難:47回ループを実行した後のデバッグは、プロンプトを調整するよりも10倍困難です。なぜなら、各ループの状態を追跡し、どのステップでエラーが発生したかを特定する必要があるからです。
- 移行コストが高い:一部のチームはLoopを導入した後、自分たちのプロジェクトに適していないと気づきましたが、他のツールに移行するには多くの時間とリソースが必要で、苦労しています。ある開発者は「Loopを会社に導入したけど、今では移行したい人がいない!」と不満を述べています。
- 基礎が不足している:信頼性の高いプロンプトさえ書けない人が多く、直接Loopに取り組もうとすると問題が発生します。
したがって、Loopは将来の方向性ですが、現在はまだ初期段階にあります。一般開発者は慎重に試す必要があります。
まとめ
Loop EngineeringはAIプログラミングの次の段階であり、AIを「受動的な実行」から「能動的な作業」へと変えるものです。しかし、コストやデバッグ、実装に関する問題がまだ存在します。大企業にとっては効率向上のための強力なツールですが、一般開発者にとっては技術がより成熟し、コストが下がるまで待つ必要があるかもしれません。しかし、このトレンドはすでに始まっており、数ヶ月後にはLinkedInに「Loopエンジニア」の履歴書が増えるかもしれません。