虎嗅

가장 빨리 달리는 사람이 왜 브레이크를 걸자고 하나요? Anthropic, 전 세계에 AI 연구 중단을 촉구… 네티즌들: “왜 당신부터 멈추지 않나요?”

原文：跑得最快的人却喊着要刹车？Anthropic 呼吁全球中止AI 研究，网友：你自己为啥不先停

2026-06-05 阅读原文

핵심 내용 요약

Anthropic은 블로그를 통해 “AI의 재귀적 자기 개선(RSI, Recurrent Self-Improvement)”이라는 개념을 제시했습니다. 이는 AI가 단순히 인간을 돕는 도구에서 벗어나 더 강력한 다음 세대의 AI를 개발하는 데 직접 참여하며, 그 진화 속도가 점점 빨라지고 있음을 의미합니다(예: AI가 독립적으로 작업을 완수하는 효율이 4개월마다 두 배로 증가함). 이에 따라 Anthropic은 전 세계적으로 최첨단 AI 개발을 일시 중단할 것을 촉구했지만, 그 조건은 “모든 최첨단 연구소가 함께 중단하고 서로 감독해야 한다”는 것이었습니다. 그렇지 않으면 단독으로 개발을 멈추지 않겠다고 밝혔습니다. 이러한 요구의 배경에는 단순한 안전 경고가 아니라 AI 경쟁에서의 “도덕적 딜레마(Prisoner’s Dilemma)”와 각 기업들이 AI 규제 체계를 만드는 주도권을 두고 벌이는 싸움이 있습니다(규칙을 정하는 쪽이 미래의 발언권을 잡게 됨). OpenAI 역시 규제 체계를 마련하겠다고 발표했으며, 양측 모두 AI가 통제 불능 상태에 이르기 전에 주도권을 잡으려는 의지를 보이고 있습니다.

1. AI가 스스로를 개발하기 시작했다? 재귀적 자기 개선이란 무엇인가?

간단히 말해, AI가 “도구”에서 “조수+개발자”로 변화하고 있습니다. 이전에는 인간이 코드를 작성하고 실험을 통해 AI를 만들었지만, 이제 AI가 인간을 도와 코드를 작성하고 시스템을 조정하며 다음 세대의 AI 모델을 최적화할 수 있습니다. 예를 들어, Anthropic의 Claude는 다음과 같은 역할을 합니다:

코드 생성: 2026년 5월 기준으로 Anthropic의 코드 라이브러리 중 80%가 Claude가 작성한 것입니다(2025년에는 단지 소수였음). 엔지니어들이 매일 제출하는 코드 양은 2024년의 8배에 달합니다(코드 부채가 있긴 하지만, 효율성은 명확히 향상되었습니다).
실험 가속화: 인간 연구자가 AI 훈련 코드를 최적화하는 데 4~8시간이 걸리지만, Claude는 이 과정을 52배로 단축할 수 있으며, 시스템 오류도 스스로 찾아내어 인간이 며칠 동안 해야 할 작업을 두 시간 안에 완료할 수 있습니다.
연구 판단: AI가 “다음 단계는 무엇인가”에 대한 결정에도 참여하게 되었습니다. 인간이 잘못된 길을 갔던 129개 연구 사례 중에서, 2026년의 Claude는 인간보다 더 나은 선택을 할 확률이 64%였습니다.

결국 AI 개발은 “자기 가속화의 순환”에 들어섰으며, 모델이 강해질수록 개발 속도가 빨라지고 인간의 통제력은 점점 약해지고 있습니다.

2. 전 세계적으로 AI 연구를 일시 중단하자는 촉구? Anthropic의 “브레이크”는 진짜인가?

Anthropic은 최첨단 AI 개발을 늦추거나 중단할 것을 제안했지만, 중요한 전제를 추가했습니다: “다른 연구소도 함께 중단하고 서로 감독해야 한다”. 이는 마치 달리기 경주에서 선두에 있는 사람이 “모두 속도를 줄여라”고 외치지만, 자신은 먼저 속도를 줄이지 않는 것과 같습니다(멈추면 뒤따르는 사람에게 추월당할까 봐 두렵기 때문입니다).

네티즌들은 “왜 당신부터 멈추지 않나?”라고 의문을 제기했지만, 이는 핵심 문제를 지적합니다: 단독으로 중단하는 것은 경쟁에서의 철수와 같습니다. Anthropic은 선두에 있는 기업으로서 선두 자리를 포기할 수 없으며, 이러한 촉구는 사실상 “규칙을 만들자”는 것입니다: 모두 함께 속도를 줄이든 계속 경쟁하든, 그 규칙은 Anthropic이 정하는 것입니다.

3. 왜 아무도 먼저 멈추지 않을까? 이것은 전형적인 “도덕적 딜레마”

AI 기업들이 직면한 상황은 “두 명의 도둑이 잡히는” 이야기와 같습니다:

모든 기업이 중단하면 모두 안전해지고 선두 자리를 잃지 않습니다.
하나의 기업만 중단하면 다른 기업들은 계속 개발할 수 있으며, 그 기업은 도태됩니다.
따라서 모든 기업은 위험이 점점 커지는데도 불구하고 먼저 중단하기를 꺼립니다.

예를 들어, Anthropic과 OpenAI는 AI의 진화가 너무 빠르면 통제 불능 상태에 이를 수 있다는 것을 알고 있지만, 누구도 단독으로 개발을 멈추려 하지 않습니다(상대방이 몰래 개발하는 것을 두려워합니다). 이로 인해 전체 산업은 “경쟁이 심화될수록 위험해진다”는 악순환에 빠집니다.

4. 단순한 안전 경고가 아니라, 규제 체계를 만드는 것입니다

Anthropic과 OpenAI의 발언은 “기술적 문제”를 “규제적 문제”로 전환하는 것입니다. 누가 AI의 규칙을 정하느냐에 따라 미래의 발언권이 달라집니다. 예를 들어:

“위험한 기능”은 무엇인가? (AI가 어느 정도까지 자기 개선하면 위험한가?)
“중단 메커니즘”은 어떻게 설계할 것인가? (언제 중단해야 하며, 모두가 정말로 중단했는지 어떻게 확인할 것인가?)
위반 행위는 누가 감독할 것인가? (몰래 개발하는 기업은 어떤 처벌을 받을 것인가?)

양측 모두 이러한 문제들에 대한 주도권을 잡으려 하고 있습니다. 결국 규칙을 정하는 쪽이 산업의 방향을 결정하며, 경쟁자의 발전을 제한할 수 있습니다.

5. AI 자기 개선의 미래: 세 가지 가능성, 핵심은 “인간이 여전히 통제할 수 있는가?”

Anthropic은 세 가지 미래 시나리오를 제시했지만, 핵심 질문은 단 하나입니다: 인간이 가속화되는 AI 개발 속에서 여전히 통제력을 유지할 수 있을까?

1. 능력 둔화: AI의 진화 속도가 완만해집니다(예: 칩이나 전력 문제로 인해). 인간은 적응할 시간을 갖게 됩니다. 하지만 그렇더라도 기존 AI는 많은 시스템 결함을 발견할 수 있으며, 이를 모두 수정하는 것은 어려울 것입니다.

2. 인간이 여전히 주도: AI가 개발 과정을 자동화하지만, 인간이 방향을 결정합니다. 장점은 연구와 약물 개발이 가속화되지만, 단점은 위험한 행동의 임계값이 낮아집니다(예: AI가 해커를 도와 공격 코드를 작성함).

3. 완전한 자기 개선: AI가 스스로 다음 세대의 AI를 설계하며, 인간은 감독만 담당합니다. 이 경우 AI의 편향이 심화될 수 있으며, 인간은 그 결정을 이해하기 어려울 수 있습니다(가장 위험한 시나리오). 하지만 Anthropic도 이것이 반드시 일어날 것이라고는 확신하지 않습니다.

어떤 미래가 되든, 핵심은 인간이 AI의 속도를 따라잡아 통제하고 이해하며 개입할 수 있는지입니다. 그렇지 못한다면 통제 불능 상태가 현실이 될 수 있습니다.

결론적으로, AI 기술의 발전은 많은 변화를 가져오고 있으며, 이에 따른 규제와 정책도 중요해지고 있습니다. 인간은 이러한 변화에 적응하고 미래를 준비해야 합니다.