虎嗅

**손립평: Anthropic, AI 개발을 중단하다?** (손립평이 Anthropic의 AI 개발 중단 결정에 대해 언급함.)

原文:孙立平:Anthropic叫停AI发展?

핵심 내용 요약

“책임감 있는 AI”를 모토로 하는 Anthropic은 자사의 AI 도구인 Claude의 실제 데이터를 바탕으로 AI의 “반복적 자기 개선(RSI: Recurrent Self-Improvement)”이라는 현상이 통제 불능 상태에 이를 수 있다고 경고합니다. 즉, AI가 인간의 개입 없이도 스스로 더 강력한 버전으로 진화할 수 있으며, 그 속도는 인간의 통제 능력을 훨씬 초월합니다. Anthropic은 AI 연구를 직접 중단하라고 요구하는 대신, 이러한 위험을 관리하기 위한 글로벌 협력 체계(공동 기관, 검증 가능한 합의서, 개발 중단 조건 등)의 구축을 촉구합니다. 또한, 현재의 글로벌 협력 부족이 AI “군비 경쟁”을 야기할 수 있으며, 기존 국제 질서의 붕괴는 인류가 이러한 전지구적 위험에 대응하는 능력을 상실시킬 수 있다고 지적하며 글로벌 협력의 필요성을 강조합니다.

1. Anthropic의 경고: AI 연구 중단이 아니라, 그 자체의 통제 불능을 우려함

Anthropic의 보고서는 과장된 것이 아니라, 자사의 AI 도구 Claude의 실제 성능에 기반한 것입니다:

  • 코드 작성 능력의 향상: 2026년 5월 기준으로 코드의 80%가 Claude에 의해 작성되었으며, 이는 1년 전에는 단지 소수였습니다.
  • 효율성의 급증: 엔지니어들이 매일 작성하는 코드 양은 2024년의 8배에 달하며, 개인의 생산성도 AI를 사용하지 않았을 때의 4배입니다.
  • 능력의 빠른 향상: 복잡한 작업을 16시간 연속으로 수행할 수 있으며, 능력이 두 배로 증가하는 데 걸리는 시간은 7개월에서 4개월로 단축되었습니다.
  • 질의 향상: 복잡한 프로그래밍 작업의 성공률이 26%에서 76%로 상승하여 인간 엔지니어와 비슷해졌습니다.

특히 우려되는 것은 “반복적 자기 개선(RSI)” 현상입니다. AI는 스스로 다음 세대의 AI를 설계하고 최적화할 수 있으며, 그 속도가 점점 빨라지고 있습니다. 이러한 상황이 발생하면 인간은 AI의 진화 속도를 따라잡을 수 없게 됩니다. 마치 키우는 반려동물이 갑자기 더 똑똑한 종으로 진화하는 것과 같아서, 인간은 그 행동을 통제할 수도 예측할 수도 없습니다. 따라서 Anthropic은 위험을 관리하기 위해 공동 기관의 설립, 글로벌 검증 가능한 합의서의 마련, AI 개발 중단 시점의 명확화 등 세 가지 대응책을 제안합니다.

2. 왜 AI 위험을 통제할 수 없는가? 그것은 “글로벌적인 문제”이기 때문입니다

AI 위험은 단일 국가나 기업이 혼자서 해결할 수 있는 것이 아닙니다. 그 이유는 세 가지입니다:

1. **“죄수의 딜레마”: 만약 A국이 안전을 위해 AI 개발을 늦춘다면, B국은 속도를 높여 기술적 우위를 차지할 수 있습니다(경제적, 군사적으로 모두 이점을 얻음). 따라서 모든 국가는 위험을 알면서도 개발을 중단하기를 꺼립니다.

2. 기술의 전파: AI 모델은 디지털 형태이므로 복제 및 확산이 매우 쉽습니다(칩, 코드, 인재의 이동 등을 통해 국경을 넘어설 수 있음).

3. **한 번의 실수로 모든 것이 끝날 수 있는 “비대칭적 위험”: 통제 불능 상태의 AI는 개발한 국가만을 해치는 것이 아니라, 인터넷과 금융 시스템을 통해 전 세계에 즉시 영향을 미칠 수 있습니다. 방어에는 모든 사람의 완벽한 협력이 필요하지만, 공격은 단 한 번의 성공으로도 충분합니다(예: AI가 탈출하여 스스로 파괴를 일으킴).

3. 글로벌 규칙이 없으면 AI 경쟁은 “생사를 건 도박”이 됩니다

각국이 자신만의 방식으로 AI를 개발한다면, 그 결과는 단순한 기술적 통제 불능보다 더 끔찍할 것입니다:

  • 안전의 희생: 속도를 위해 안전 테스트와 연구 조정을 생략하게 되며, 책임감 있는 기업/국가는 오히려 뒤처지게 됩니다.
  • 감시의 어려움: AI는 핵무기와 달리 명확한 군사적 성격이 없으며, 민간용 대형 모델은 쉽게 자율 무기나 사이버 공격에 사용될 수 있습니다. 오픈소스 모델이 암시장으로 유출되면 테러 조직에게 위험이 됩니다.
  • 한 번의 실수로 모든 것이 끝남: AI 군비 경쟁은 누가 먼저 결승선에 도착하는지가 아니라, 누가 먼저 “사고”를 내는지의 문제입니다. 예: 검증되지 않은 군사용 AI가 몇 밀리초 만에 잘못된 판단으로 공격을 시작하거나, AI가 자기 개선 과정에서 “오작동”할 수 있으며, 인간은 이를 막을 시간이 없습니다.

4. 역사적 경험: 전지구적 위험에 대처하려면 모두가 협력해야 합니다

인류는 과거에도 전지구적 위험에 대비하기 위해 글로벌 협력을 통해 대응해 왔습니다:

  • 핵무기: 냉전 시기에도 미국과 소련은 핵확산금지조약을 체결하여 상호 파괴를 방지했습니다.
  • 환경 문제: 프론트라이온이 오존층을 파괴하자 각국은 몬트리올 의정서에 서명했으며, 이산화탄소로 인한 온난화를 막기 위해 파리 협정이 있습니다.

AI 위험은 이러한 문제들보다 더 심각하지만, 현재의 문제는 기존 국제 질서가 붕괴되고 있으며, 과거의 “글로벌 협력 체계”(통신 채널, 규칙, 검증 메커니즘)가 사라지고 있다는 것입니다. 새로운 질서가 구축되지 않으면 인류는 AI의 통제 불능 위험에 대처할 수 없습니다. 결국, 한 국가가 비밀리에 위험한 AI를 개발하면 전 인류가 그 대가를 치러야 합니다.

5. 기존 질서가 무너졌을 때, 새로운 “안전망”을 구축할 수 있을까?

기존 질서에는 많은 문제가 있었지만, 적어도 최소한의 글로벌 협력을 제공했습니다(위기 시의 소통, 공동 규칙, 제3자 검증 등). 이러한 체계가 붕괴된다면 새로운 질서가 더 나을 수 있을까요? 이것이 핵심 질문입니다.

AI 시대의 위험은 전 인류의 문제이며, 어떤 국가도 혼자서는 안전할 수 없습니다. 각국이 계속해서 자신만의 방식을 고수한다면 AI 군비 경쟁은 인류를 파멸로 이끌 것입니다. 따라서 기존 질서가 어떻게 변하든, 새로운 글로벌 AI 거버넌스 체계를 구축하는 것이 시급합니다.

이 기사의 핵심 논리는 간단합니다: AI는 빠르게 “자기 진화”하고 있으며, 인류는 글로벌적으로 협력하여 이를 통제해야 합니다. 그렇지 않으면 통제 불능 상태의 AI에 의해 파괴되거나 무질서한 경쟁에 의해 멸망할 것입니다. 이것은 과장된 경고가 아니라, 실제 데이터와 역사적 교훈에 기반한 경고입니다.