虎嗅

Перевод русского текста: Больше не спрашивайте, догнали ли они нас: истинное отличие между крупными моделями Китая и США заключается здесь.

原文:别再问追没追上:中美大模型的真实差距在这里

Краткое содержание анализа

К середине 2026 года крупные модели Китая и США больше не отстают друг от друга в целом; наступил этап разделения по конкретным сценариям использования: ведущие китайские модели демонстрируют близкие или даже лучшие результаты в таких областях, как открытая экосистема, локальное развертывание, адаптация к китайскому языку, эффективность затрат, распознавание текста из изображений (OCR), понимание документов и генерация коротких видео. Однако в таких аспектах, как высокая стабильность при выполнении сложных задач на большие расстояния, использование сложных инструментов, автоматизация пользовательских интерфейсов (GUI) на корпоративном уровне, а также международное доверие и развитие полноценной продуктовой экосистемы, закрытые американские модели по-прежнему имеют заметные преимущества. Ключевым фактором различий является не уровень интеллекта моделей, а их способность к стабильному выполнению сложных задач и возможности их коммерциализации.

Подробный анализ

1. Разделение по сценариям использования: каждый имеет свои сильные стороны

Китайские модели превосходят в областях, требующих близкого соответствия реальным потребностям пользователей и низких затрат:

  • Адаптация к китайскому языку: модели типа DouBao и DeepSeek показывают лучшие результаты в общении на китайском языке, обучении и создании аннотаций; DouBao еженедельно используется 155 миллионами пользователей (первое место в Китае); пользователи переключаются на них из-за бесплатности, защиты конфиденциальности данных и лучшей адаптации к китайскому языку;
  • Открытая экосистема и локальное развертывание: малые модели Qwen (например, Qwen3-0.6B/4B) пользуются большой популярностью среди разработчиков благодаря своей контролируемости и защите конфиденциальности; их можно запустить на обычных компьютерах и игровых устройствах;
  • Распознавание текста из изображений (OCR) и понимание документов: Qwen2.5-VL достигает почти таких же результатов, как GPT-4o, при более выгодном соотношении цены и качества;
  • Генерация коротких видео: модели Kling и Seedance сильны в преобразовании изображений в видео, сохранении деталей лиц и эффективности использования ресурсов; они конкурентоспособны на глобальном уровне.

Американские модели превосходят в выполнении сложных задач с высокой стабильностью:

  • Выполнение сложных программ: модели GPT-5.5 и Claude Sonnet 4.6 могут выполнять многоступенчатые операции, включая изменение файлов и использование инструментариев; китайские модели часто теряют информацию или допускают ошибки при использовании инструментов;
  • Корпоративное использование: ChatGPT по-прежнему является самым популярным продуктом в сфере искусственного интеллекта; модели типа Claude пользуются большим доверием благодаря высокой надежности;
  • Автоматизация пользовательских интерфейсов: они способны стабильно работать с компьютерными интерфейсами (браузеры, IDE); китайские модели часто допускают ошибки при работы с координатами и другими аспектами интерфейса.

2. Малые модели и открытая экосистема: китайский подход как ключ к успеху

Малые модели (с объемом параметров менее 40 миллиардов) являются сильной стороной китайских моделей:

  • Почему пользователи выбирают малые модели? Потому что они более контролируемы, недороги и обеспечивают защиту конфиденциальности данных; например, Qwen3-30B-A3B может работать на компьютере с 12 ГБ оперативной памяти со скоростью обработки 12 токов в секунду, что подходит для локальной обработки конфиденциальных данных;
  • Влияние открытой экосистемы: китайские модели Hugging Face занимают 41% всех загрузок с сайта Hugging Face; количество токенов, используемых моделью DeepSeek в платформе OpenRouter, превышает показатели Meta и Mistral; Microsoft включила модель DeepSeek R1 в свою облачную платформу Azure, что свидетельствует о распространении китайских открытых моделей среди западных компаний.

Однако наличие открытого кода не гарантирует лидерства на глобальном рынке: трафик, поступающий на сайт ChatGPT, в 2.7 раза превышает трафик на сайт Gemini; закрытые американские модели по-прежнему доминируют на потребительском рынке и рынке корпоративных решений.

3. Стабильность: важнее, чем уровень интеллекта

По отзывам пользователей, главная проблема китайских моделей заключается не в их невозможности выполнять задачи, а в их нестабильности при выполнении сложных операций:

  • Проблемы с выполнением длинных задач: например, при использовании модели Qwen3.6 для обработки данных объемом 32 Кбит информации могут возникать ошибки (теря информации, забывание целей); для успешного выполнения требуется увеличение объема обрабатываемых данных до 128 Кбит;
  • Частые ошибки в инструментарии: модели генерируют правильные команды для работы с инструментами, но системы анализа текста могут допускать ошибки (например, число 50306 изменяется на 503);
  • Влияние квантизации: использование низкокачественных методов квантизации снижает производительность моделей; американские модели сохраняют стабильность даже при таком подходе.

Американские модели отличаются меньшим количеством ошибок при выполнении сложных задач, что позволяет пользователям смело поручать им выполнение важных работ (например, редактирование больших кодовых баз).

4. Мультидисциплинарные возможности: китайские модели превосходят в OCR, но уступают в автоматизации пользовательских интерфейсов; американские модели ближе к совершенству в области видеогенерации

  • Распознавание текста из изображений и понимание документов: китайские модели лидируют; Qwen2.5-VL достигает почти таких же результатов, как GPT-4o при обработке 1000 документов в формате JSON;
  • Автоматизация пользовательских интерфейсов: разница между китайскими и американскими моделями заметна: китайские модели могут описывать элементы интерфейса, но не способны стабильно ими управлять; американские модели могут выполнять сложные операции в браузерах и IDE;
  • Генерация видео: китайские модели быстро сокращают разрыв с американскими; модель Kling сильна в преобразовании изображений в видео, но американская модель Veo превосходит их по качеству звука; тем не менее у западных продуктов также есть недостатки.

5. Заключение

Китайские модели демонстрируют значительный прогресс в области искусственного интеллекта, особенно в таких аспектах, как распознавание текста и обработка данных; однако им еще предстоит преодолеть ряд технических проблем. Американские модели показывают стабильность и надежность при выполнении сложных задач, что делает их конкурентоспособными на глобальном рынке; однако они также требуют дальнейших усовершенствований. Оба подхода могут быть полезны для разработчиков и пользователей в различных сферах.