핵심 내용 요약
국가 데이터 국은 인공지능(AI)의 발전을 위한 “고품질 연료”인 고품질 데이터 세트를 제공하기 위한 계획을 발표했습니다. 기반 강화, 데이터 레이블링 개선, 품질 향상, 응용 확대, 관리 서비스, 가치 실현 등 6개의 전략적 조치를 통해 2028년까지 주요 분야를 아우르는 데이터 세트를 구축하고 관련 기업과 인재를 육성할 예정입니다. 이를 통해 “데이터 → 모델 → 응용 → 더 많은 데이터”의 선순환을 형성하여 데이터가 다양한 산업에 활용되도록 하여 지능 경제의 새로운 성장 동력을 창출할 것입니다.
상세 설명
1. AI 발전에 “연료”가 부족하다? 고품질 데이터 세트가 해결책
AI 모델은 자동차와 같으며, 데이터는 연료입니다. 일반적인 데이터(분산되어 있고 가공되지 않은 데이터)로는 AI가 효과적으로 작동하지 못합니다. 예를 들어, 암 진단을 위한 AI를 훈련시키기 위해서는 정확하게 레이블링된 의료 기록과 영상 데이터가 필요하며, 자율 주행을 위해서는 도로 상황과 차량 행동에 대한 구조화된 데이터가 필요합니다. 현재 많은 산업의 데이터가 분산되어 있거나 질이 낮아 AI가 실제 응용에서 제대로 작동하지 못하는 문제가 있습니다. 이 계획은 AI의 “연료 부족” 문제를 해결하여 AI가 다양한 산업에 활용될 수 있도록 하는 것을 목표로 합니다.
2. 주요 분야에 맞춘 데이터 세트 구축
계획은 어떤 분야의 데이터 세트를 구축할지 명확히 하고 있으며, 두 가지 유형으로 나뉩니다:
- 민생 필수 분야: 산업 제조(공장 장비 데이터), 농업 농촌(토양, 작물 성장 데이터), 의료(의료 기록, 영상), 교육(교육 자원), 금융(위험 평가 데이터) 등 AI 응용이 사람들의 생활에 직접 관련된 분야입니다.
- 신성장 분야: 저고도 경제(드론 데이터), 자율 주행, 증강 현실(로봇 상호작용 데이터), 바이오 제조 등 미래 지능 경제의 성장 동력이 될 분야입니다.
각 분야별로 필요에 맞는 데이터를 구축해야 하며, 예를 들어 농업 데이터 세트는 AI가 병충해를 예측할 수 있도록 해야 하고 의료 데이터 세트는 질병 진단을 돕도록 해야 합니다.
3. 데이터 레이블링의 업그레이드
데이터 레이블링은 데이터에 설명을 붙이는 과정으로, 이전에는 전적으로 수작업에 의존했지만 효율성이 낮고 오류가 많았습니다. 이제는 다음과 같이 업그레이드할 예정입니다:
- 자동 레이블링: 기계가 먼저 자동으로 레이블을 붙인 후 사람이 검토하는 방식으로 효율성을 높입니다.
- 전문가 참여: 의료, 법률과 같은 전문 분야의 데이터는 해당 분야 전문가가 레이블링하여 정확성을 보장합니다.
- 산업 육성: 국가는 첫 번째로 7개 시범 도시에서 레이블링 산업을 강화하고, 추가적인 시험 구역을 조성하여 선도 기업(의료 데이터 레이블링 전문 회사 등)을 육성할 예정입니다. 또한 레이블링 인재를 양성하기 위해 교육 프로그램과 직업 자격 시험도 제공할 것입니다.
4. 데이터의 활용 확대
데이터는 단순히 저장되어 있는 것이 아니라 “활동적인 자산”으로 전환되어야 합니다:
- 데이터 순환: 특정 상황에 필요한 데이터를 구축하여 모델을 훈련시키고, 그 모델을 활용해 더 많은 데이터를 생성하며, 모델을 지속적으로 개선합니다.
- 비즈니스 모델 혁신: 데이터는 거래소에서 거래되거나 구독 서비스로 제공되거나 API를 통해 활용될 수 있으며, 최소 단위로 분할하여 판매하는 방식도 모색될 예정입니다.
- 자산화: 데이터를 자산으로 활용하여 대출이나 기업 투자에 활용할 수 있습니다.
5. 다각적인 접근을 통한 실행 보장
이 계획의 성공을 위해서는 다음과 같은 조치가 필요합니다:
- 국가와 지방의 협력: 국가 데이터 국이 전체를 조정하고, 지방은 중복 투자를 방지하며 지역 산업 특성에 맞게 계획을 수립해야 합니다.
- 재정 지원: 금융 기관과 산업 펀드의 투자를 유도하며, 지방은 특별 자금을 마련할 수 있습니다.
- 보안 확보: 데이터 유출이나 오용을 방지하여 데이터가 안전하고 관리 가능하며 추적 가능하도록 해야 합니다.
이 계획은 결국 AI의 발전을 촉진하여 데이터와 AI가 함께 성장하도록 하는 것을 목표로 하며, 더 정확한 AI 의사, 더 지능적인 공장, 더 안전한 자율 주행 등 우리의 삶에 지능 기술이 실제로 도입되는 것을 의미합니다.