虎嗅

우리카이(WeChat AI)의 이 전략은 꽤 흥미롭네요.

原文：微信AI这招挺有意思的

2026-06-09 阅读原文

핵심 내용 요약

위챗이 자체 개발한 미니프로그램(소형 애플리케이션)을 AI와 연동할 수 있는 “자동 모드”를 공개했습니다. 개발자가 소스 코드를 제공하면, 위챗의 AI가 해당 미니프로그램을 AI가 이해하고 조작할 수 있는 “기능 팩”으로 자동으로 변환해 줍니다. 이 기능은 세 가지 핵심 기술(정확한 인터페이스 위치 파악, 작업 결과 예측, 작업의 정확성 확인)에 의해 가능합니다. 개발자는 자발적으로 이 기능을 사용할 수 있지만, 참여하지 않으면 향후 AI가 가져다줄 트래픽 증가의 혜택을 놓칠 수 있습니다. 위챗은 업계에서 흔히 사용되는 “Skill/MCP”라는 용어를 활용해 자신의 폐쇄적인 생태계 인터페이스를 강화하고 있습니다.

1. “자동 모드”란 무엇인가? – 개발자는 손을 놓고, 미니프로그램은 AI의 “도구가 된다”

간단히 말해, 자동 모드는 개발자가 미니프로그램의 소스 코드를 위챗에 제공하면, 위챗의 AI가 그 코드를 이해하고 조작할 수 있는 형태로 변환해 준다는 것입니다. 개발자는 아무것도 할 필요가 없지만, 그 대가로 자신의 미니프로그램이 “사용자가 직접 실행하는 제품”에서 “위챗 AI가 대신 실행하는 기능”으로 전환됩니다.

예를 들어, 이전에는 사용자가 커피를 주문하려면 미니프로그램을 열어 메뉴를 찾고, 사양을 선택하고, 주문해야 했습니다. 하지만 자동 모드를 활성화하면 사용자는 위챗 AI에게 “라떼 한 잔 주문해 줘”라고 말하기만 하면 되며, AI가 자동으로 미니프로그램을 실행하여 주문을 처리합니다. 이를 위해서는 개발자가 자동 모드에 동의해야 합니다.

2. 위챗 AI는 어떻게 다양한 미니프로그램을 제어할 수 있는가? – 세 가지 기술이 그 배경에 있다

위챗 AI가 수백만 개의 다양한 인터페이스를 가진 미니프로그램을 처리할 수 있는 이유는 세 가지 기술 덕분입니다:

1. AI의 정확한 시각: POINTS-GUI-G

이 기술은 AI가 미니프로그램의 스크린샷과 명령(예: “주문 버튼 찾기”)을 받아서 버튼이 어디에 있는지 픽셀 단위로 정확하게 파악할 수 있게 해줍니다. 이 기술은 전 세계 GUI 위치 파악 테스트에서 1등을 차지했으며, AI가 버튼을 찾지 못하는 문제를 해결했습니다.

2. AI의 예측 능력: UI-Oceanus

사람은 버튼을 클릭하기 전에 어떤 페이지로 이동할지 알 수 있지만, AI는 직관이 없습니다. 이 기술은 500만 개의 미니프로그램 사용 사례를 분석하여 클릭 후에 어떤 일이 일어날지 예측할 수 있게 해줍니다(예: 주문 후 결제 페이지가 팝업되는지). 심지어 전혀 익숙하지 않은 미니프로그램도 AI가 즉시 처리할 수 있으며, 탐색 성공률이 21.9% 향상되었습니다.

3. AI의 검증 기능: DiffSpot

작업이 완료된 후에는 결과가 올바른지 확인해야 합니다(예: 장바구니의 내용물이 변했는지). 하지만 이 기술은 아직 미흡하며, 주류 AI 모델은 인터페이스의 미세한 변화를 인식하는 데 어려움을 겪고 있습니다.

3. 개발자에게 진정한 선택권이 있는가? – 자발적인 참여의 “숨겨진 대가”

위챗은 “참여 여부는 개발자의 자유이며, 기존 서비스에는 영향을 미치지 않는다”고 주장하지만, 이 말은 현재 해당 미니프로그램을 사용하는 “기존 사용자”만 보호할 뿐입니다.

위챗 AI가 정식으로 서비스를 시작하면 14억 명의 사용자가 AI를 통해 서비스를 이용하게 될 것이며, 자동 모드에 참여하지 않은 미니프로그램은 사실상 존재하지 않는 것과 같습니다. 경쟁사가 이 기능을 도입하면 사용자는 “항공권 예약해 줘”라고 말하면 바로 경쟁사의 서비스를 이용할 수 있지만, 참여하지 않은 미니프로그램은 사용자가 직접 검색하고 주문해야 합니다. 이는 마치 개발자가 AI의 흐름을 따르지 못하는 것과 같으며, 결과적으로 트래픽이 감소할 수 있습니다.

4. Skill/MCP의 변질 – 개방형 용어로 폐쇄적인 생태계를 감춘다

업계에서 사용되는 “Skill”과 “MCP”는 원래 개방형 표준이었습니다:

MCP: Anthropic이 개발한 오픈 소스 프로토콜로, 모든 AI가 어떤 도구와도 연동할 수 있습니다(예: Baidu AI도 이를 사용하여 Taobao에 접속할 수 있음).
Skill: AI의 “기능 팩”으로, 개발자가 만든 기능은 다양한 플랫폼에서 사용될 수 있습니다(예: Claude나 Cursor에서도 사용 가능).

하지만 위챗은 이 용어들을 자신의 목적에 맞게 재해석했습니다:

위챗의 MCP는 위챗 내의 도구들만 연동할 수 있습니다.
위챗의 Skill은 개발자가 제공한 소스 코드를 기반으로 생성되며, 위챗 생태계 내에서만 작동합니다.

더욱 문제는 많은 중국어 개발자들이 이 용어들을 처음 접할 때 위챗의 문서를 통해 배우게 되며, 점차 “Skill”이 위챗 AI가 미니프로그램을 호출하는 인터페이스라고 오해하게 됩니다. 이로 인해 개발자들은 자신도 모르게 위챗의 폐쇄적인 생태계에 흡수됩니다.

5. 이 변화는 누구에게 영향을 미칠까? – 개발자는 더 의존하게 되고, 사용자는 더 “편리해진다”

개발자에게는 AI와의 연동 비용을 절약할 수 있지만, 위챗 생태계에 대한 의존도가 증가합니다(트래픽부터 기술, AI 호출 권한까지 모두 위챗의 통제하에 놓입니다).

사용자에게는 미니프로그램 사용이 더 편리해질 수 있지만, 선택 범위가 줄어들 수 있습니다(위챗 AI와 연동된 미니프로그램만 우선 추천되며, 사용 가능한 서비스도 위챗이 허용하는 것에 제한됩니다).

결론적으로, 위챗의 이번 조치는 겉보기에는 개발자를 돕는 것처럼 보이지만, 실제로는 AI 시대에 자신의 생태계를 더욱 강화하는 것입니다. 개발자는 단기적인 편리함과 장기적인 자율성 중 어느 쪽을 선택해야 할지 신중하게 고려해야 합니다.

(참고: 기술 관련 논문의 연도는 가상으로, 기술 로드맵을 설명하기 위한 것입니다.)