虎嗅

Analyse approfondie de 151 offres d’emploi chez JD.com : dévoilés les secrets des “étiqueteurs de données” – Une polarisation des salaires (jusqu’à 30 fois de différence), et un avenir difficile.

原文:深扒151份JD,揭秘“数据标注员”:两极分化,30倍薪水差,残酷的未来

Résumé des principaux points

L'annotation de données est la « base humaine » qui se cache derrière l'intelligence artificielle (IA) : le fait que ChatGPT puisse écrire des poèmes, que les systèmes d'autopilotage reconnaissent les feux de circulation ou que les assistants vocaux comprennent les instructions repose sur le traitement manuel des données par des annotateurs. Cependant, l'industrie est aujourd'hui fortement segmentée : les revenus varient de 2 000 à 65 000 euros par mois, soit une différence de 30 fois. Le contenu du travail a évolué, passant d'une tâche mécanique (comme tracer des contours dans des images) à une tâche nécessitant des connaissances spécialisées (l'entraînement de l'IA). Les entreprises suivent un modèle où les grandes sociétés établissent les règles et externalisent les tâches, tandis que la technologie d'annotation automatique remplace progressivement les postes de base. En conséquence, il y a une pénurie croissante d'annotateurs experts ayant des connaissances dans leur domaine.

Analyse détaillée

1. Pourquoi un tel écart de revenus ?

Les revenus liés à l'annotation de données forment une sorte de « pyramide » :

  • Niveau bas (2 000-5 000 euros) : Principalement des emplois à temps partiel ou via le crowdsourcing, impliquant des tâches répétitives (comme tracer les contours des feux de circulation dans des images ou transcrire du texte vocal). Les qualifications et l'expérience ne sont pas requises ; le salaire est calculé au jour (100-200 euros). N'importe qui peut effectuer ces tâches.
  • Niveau intermédiaire (environ 10 000 euros) : Des annotateurs à plein temps réalisent des tâches plus complexes (comme identifier les émotions dans le texte vocal), mais selon des règles précises. Ils sont tout de même facilement remplaçables.
  • Niveau haut (20 000-65 000 euros) : Il ne s'agit plus simplement d'annoter des données, mais aussi d'établir des normes (par exemple, de définir les critères pour l'entraînement des grands modèles ou d'évaluer les erreurs dans le code de l'IA). Ces postes exigent des diplômes avancés (master en informatique, médecine, finance, etc.) et une expertise spécifique. Par exemple, Baidu propose un salaire de 500-600 euros par jour pour les stagiaires spécialisés dans l'annotation des algorithmes d'autopilotage, contre seulement 185 euros pour les annotateurs du crowdsourcing.

2. Les annotateurs ne se contentent plus de tracer des contours ! Ils doivent maintenant connaître le code, les dialectes et même la médecine…

Le travail des annotateurs est devenu beaucoup plus spécialisé :

  • Annotation de texte : Dans l'ère des grands modèles, il est nécessaire de comprendre le code pour détecter d'éventuelles erreurs dans les programmes écrits par l'IA.
  • Annotation vocale : Il faut reconnaître les dialectes et les nuances émotionnelles dans la parole. Par exemple, xAI de Musk recrute des instructeurs en chinois qui doivent maîtriser le dialecte du Sichuan pour identifier les erreurs de prononciation ; JD.com cherche des annotateurs francophones ayant un niveau B2.
  • Annotation d'images/vidéos : Dans le domaine de l'autopilotage, il est nécessaire de connaître le fonctionnement des capteurs. Une entreprise automobile recrute des ingénieurs spécialisés dans l'analyse de données 3D (salaires de 40 000-70 000 euros par mois).
  • Annotation multimodale : Il faut gérer simultanément texte, images, audio et vidéo. Par exemple, pour entraîner des systèmes d'IA à « parler en regardant des images », il est nécessaire de comprendre la beauté visuelle et la logique linguistique. Ces postes représentent 36 % de la demande totale.

3. La division du travail entre les grandes entreprises et les prestataires externes :

Les grandes entreprises (JD.com, Tencent, Alibaba) établissent les règles d'annotation et recrutent des professionnels hautement qualifiés pour garantir la qualité des données. Les sociétés de services externes (comme Haitian Ruisheng, Yunce Data) divisent ces tâches en petites unités à réaliser par des employés dans des villes de troisième ordre. Ces derniers ne savent souvent pas à quoi sont utilisées les données qu'ils annotent.

4. L'évolution de l'industrie au cours des 30 dernières années

L'annotation de données n'a pas toujours existé ; son développement s'est déroulé en quatre étapes :

  • Ère pré-automatique (2006-2014) : Les universitaires s'en chargeaient dans un contexte académique. Par exemple, Li Feifei a créé l'ensemble de données ImageNet et a recruté des étudiants pour annoter les images. Plus tard, le crowdsourcing a été utilisé (50 000 personnes à travers le monde ont annoté 14 millions d'images), ce qui était considéré comme une tâche dégradante.
  • Ère des usines d'annotation (2014-2017) : L'activité est devenue un véritable métier. Des entreprises ont ouvert des centres d'annotation dans des villes de troisième ordre, recrutant des jeunes et des mères au foyer pour des tâches basiques, avec des revenus décentes.
  • Ère de segmentation et d'amélioration (2017-2020) : Le ministère du Travail a inclus le métier d'« entraîneur en intelligence artificielle » dans le répertoire professionnel, divisant les annotateurs en trois catégories.
  • Ère de l'automatisation (depuis 2020) : L'arrivée de la technologie d'annotation automatique a réduit la nécessité de main-d'œuvre. GPT-3 a diminué la demande en données, mais des besoins nouveaux sont apparus (comme l'évaluation de la précision des réponses de l'IA), qui nécessitent encore une intervention humaine.

5. Quel sera l'avenir ? L'IA prendra-t-elle le travail des annotateurs ?

Les postes de base seront remplacés par des systèmes automatiques, tandis que ceux exigeant des connaissances spécialisées deviendront plus valorisés :

  • Postes disparus : Les tâches purement mécaniques (comme tracer des contours ou transcrire du texte) seront principalement automatisées, avec seulement un contrôle humain pour les corriger.
  • Postes qui survivront : Des experts dans leur domaine (par exemple, des annotateurs médicaux ou financiers) ainsi que des personnes capables de gérer et d'établir des règles.

Les recruteurs en IA préfèrent embaucher des diplômés en informatique plutôt que des employés basiques, car ces derniers manquent de connaissances spécialisées et de capacités logiques.

En résumé, l'industrie de l'annotation de données est en pleine évolution : les tâches simples seront remplacées par l'IA, mais ceux qui possèdent des compétences professionnelles et une pensée critique deviendront de plus en plus précieux. Cela représente à la fois un défi et une nouvelle opportunité pour les personnes souhaitant entrer dans le secteur de l'IA.