虎嗅

**DeepSeek V4, 수학적 증명을 통해 500배의 비용 우위를 확보하다: 인공지능 시스템이 여러 기록을 경신했다** DeepSeek V4가 수학적 증명을 통해 엄청난 비용 절감 효과를 입증했습니다. 이는 인공지능(AI) 시스템 분야에서 새로운 기록을 세우는 사건으로, 기존의 기술적 한계를 뛰어넘은 것입니다. 이러한 혁신은 다양한 산업 분야에 긍정적인 영향을 미칠 것으로 예상됩니다.

原文:DeepSeek V4做数学证明,500倍成本优势:智能体系统刷新多项纪录

핵심 내용 요약

최근 AI는 수학적 증명 분야에서 중대한 돌파구를 이루었습니다. 프린스턴 대학교 팀은 국내에서 개발된 오픈소스 모델인 DeepSeek-V4-Flash를 기반으로 한 Goedel-Architect 시스템을 사용하여 형식화된 정리 증명(기계가 검증할 수 있는 엄격한 증명) 분야에서 “저비용 + 고성능”의 혁신적인 성과를 달성했습니다. 이 시스템은 구글의 Gemini 시스템보다 비용이 500배 저렴하면서도 정확도가 더 높습니다. Goedel-Architect는 “블루프린트 생성 + 정제”라는 혁신적인 전략을 통해 AI 증명의 “검증 위기”와 효율성 문제를 해결하며, 수학 연구에 더 신뢰할 수 있고 효율적인 도구를 제공합니다.

1. 왜 AI의 수학 증명에 “형식화”가 필요한가? – “검증 위기” 해결

수학에서는 “모든 단계가 절대적으로 정확해야 한다”는 것이 중요하지만, 현재 AI가 생성하는 증명의 속도가 너무 빠르어 인간이 검증하기에 시간이 부족합니다(타오제셴은 수학이 “증명 부족”에서 “증명 과잉”으로 전환되고 있다고 말했습니다). 예를 들어, AI가 80년 동안 제기된 추측을 뒤엎었다고 주장할 때, 인간은 그것이 정말 맞는지 어떻게 판단할 수 있을까요?

이러한 상황에서 형식화된 증명이 “생명의 구명줄”이 됩니다. Lean과 같은 언어를 사용하여 증명을 작성하면, 모든 논리적 단계가 기계에 의해 이해될 수 있으며, 컴파일러가 승인하면 100% 정확합니다. 따라서 인간의 검토에 의존할 필요가 없습니다. 하지만 과거에는 형식화된 증명을 생성하는 데 매우 높은 비용이 들었습니다(예: 구글 시스템을 한 번 실행하는 데 17만 달러가 소요됨).

2. Goedel-Architect의 핵심 혁신: 먼저 “블루프린트를 그리고 나서 작업하기**

기존의 AI 증명 시스템은 마치 “맹인이 블록을 조립하는 것”과 같았습니다. 어려운 문제에 부딪히면 작은 문제로 분해하지만, 그 과정에서 막다른 길에 부딪힐 수 있어 이전의 노력이 모두 낭비될 수 있습니다. Goedel-Architect는 다른 접근 방식을 사용합니다:

1. 블루프린트 생성: 증명하려는 정리를 작은 가정들로 분해하고(예: “이진수 2를 곱하는 것은 0을 더하는 것과 같다”), 가정들 간의 의존 관계를 도형으로 표시합니다.

2. 병렬 증명: 여러 증명 엔진이 동시에 다른 가정들을 처리하며 서로 방해하지 않습니다.

3. 블루프린트 정제: 특정 가정이 실패할 경우, 시스템은 “원인을 진단”합니다:

  • 가정 자체에 오류가 있으면(예: 이진수 덧셈의 방향이 잘못되었다면), 해당 가정을 수정하고 의존 관계를 업데이트합니다.
  • 가정이 너무 어려우면, 그것을 더 작은 하위 가정들로 분해하여 다시 시도합니다.

마치 집을 지을 때 먼저 설계도를 그리는 것과 같아서, 어디가 잘못되었으면 그 부분만 수정하면 되며 처음부터 다시 시작할 필요가 없어 효율성이 크게 향상됩니다.

3. 성능과 비용의 “혁신적인 절감**

Goedel-Architect의 성능은 놀랍습니다:

  • 비용: PutnamBench 테스트 세트(672개의 경시 문제)에서 구글의 Hilbert 시스템은 17만 달러가 소요된 반면, Goedel-Architect는 294달러만으로 충분했습니다(500배 차이).
  • 정확도: Goedel의 통과율은 75.6%로 Hilbert의 70%보다 높습니다.
  • 문제 범위: 고등학교 경시 문제 세트인 MiniF2F(242/244)를 거의 해결할 수 있으며, IMO(국제수학올림픽)나 USAMO(미국수학올림픽)의 새로운 문제도 3/6의 정확도로 풀 수 있습니다.

중요한 점은 Goedel-Architect가 국내에서 개발된 오픈소스 모델인 DeepSeek를 사용한다는 것으로, 폐쇄형 모델의 높은 비용 없이 일반인도 사용할 수 있습니다.

4. 팀 배경: 신뢰할 수 있는 “수학 + AI” 조합

이 시스템을 개발한 팀은 프린스턴 대학교 출신으로, 두 명의 저명한 연구자가 이끌고 있습니다:

  • Sanjeev Arora: 계산 복잡성 분야의 전문가로, AI가 초인적인 수학자가 될 수 있는지 연구해왔습니다.
  • Chen Danqi: 칭화대학교에서 학사 학위를 받고 스탠퍼드대학교에서 박사 학위를 취득했으며, 구글과 협력하여 SyntaxNet(구글의 문법 분석 도구)을 개발한 경험이 있습니다. 현재는 언어 모델 추론에 집중하고 있습니다.

이들은 이전에도 두 세대의 Goedel-Prover 모델을 개발했으며, 이번 업그레이드는 우연이 아닙니다.

5. 미래의 의미: 수학 연구의 “가속기”

Goedel-Architect의 가치는 형식화된 증명의 장벽을 낮추는 데 있습니다:

  • 앞으로 수학자들은 세부 사항을 검증하는 데 몇 년을 보내지 않아도 AI가 기계가 검증할 수 있는 증명을 빠르게 생성할 수 있습니다.
  • 소규모 팀이나 개인도 대형 기관의 자원에 의존하지 않고 수학적 문제를 해결할 수 있습니다.
  • 만약 AI가 언젠가 리만 추측을 증명한다고 주장하면, Lean 컴파일러를 사용하여 Goedel의 증명을 실행함으로써 즉시 그 정확성을 확인할 수 있으며, 수십 년이 걸리는 동료 평가를 기다릴 필요가 없습니다.

이것은 수학 연구 방식을 완전히 바꿀 수 있습니다 – 인간은 “문제를 생각하는” 역할을 하고, AI는 “아이디어를 엄격한 증명으로 변환하는” 역할을 합니다.

결론적으로, Goedel-Architect는 AI의 수학 증명 분야에서의 중대한 돌파구일 뿐만 아니라 “신뢰할 수 있는 AI”를 수학 분야에 도입하는 데 있어 중요한 단계입니다. 오픈소스 모델과 혁신적인 전략을 사용하여 이전에는 접근하기 어려웠던 형식화된 증명을 모든 사람이 사용할 수 있게 만들었으며, 미래에는 수학 분야에서 더 많은 중대한 발견을 이끌어낼 가능성이 있습니다.