虎嗅

**Análisis en profundidad de 151 casos de JD: Revelaciones sobre los “etiquetadores de datos”** *Diferencias extremas, salarios que varían 30 veces; un futuro cruel.*

原文:深扒151份JD,揭秘“数据标注员”:两极分化,30倍薪水差,残酷的未来

Resumen del contenido central:

El etiquetado de datos es la “base humana” detrás del AI. Que ChatGPT escriba poesía, que los sistemas de conducción autónoma reconozcan semáforos o que las asistentes vocales entiendan instrucciones, todo depende del procesamiento manual de datos por parte de los etiquetadores. Sin embargo, la industria está experimentando una fuerte división: los ingresos varían enormemente (de 2000 a 65000 euros al mes), el contenido del trabajo ha evolucionado de tareas mecánicas a necesidades que requieren conocimientos especializados, y el modelo empresarial implica que las grandes empresas establecen las reglas mientras que las empresas externas se encargan de la ejecución. Además, el etiquetado automático está desplazando los puestos básicos, lo que ha llevado a una escasez cada vez mayor de etiquetadores expertos en sus respectivos campos.

Análisis detallado:

1. ¿Por qué hay tanto diferencia en los ingresos?

Los ingresos por el etiquetado de datos siguen una estructura piramidal:

  • Nivel inferior (2000-5000 euros): Generalmente se trata de trabajos a tiempo parcial o mediante crowdsourcing, con tareas repetitivas (como delinear los contornos de semáforos en imágenes o transcribir texto de voz). No se requiere educación superior ni experiencia específica, y el pago es por día (100-200 euros diarios), lo que hace que cualquier persona pueda realizarlo.
  • Nivel intermedio (alrededor de 10000 euros): Etiquetadores a tiempo completo realizan tareas más complejas (como identificar emociones en el audio), pero aún siguen seguindo reglas establecidas y son fácilmente reemplazables.
  • Nivel superior (20000-65000 euros): No se trata simplemente de etiquetar datos, sino de definir las reglas para los modelos AI (escribir estándares, evaluar errores en el código, gestionar la calidad de imágenes médicas, etc.). Se requiere una formación superior (maestría o especialización en informática, medicina, finanzas, etc.), lo que hace que estos profesionales sean más valiosos y por tanto mejor remunerados.

Ejemplo: Baidu paga 500-600 euros al día a los estudiantes practicantes que trabajan en el etiquetado de algoritmos para la conducción autónoma (se requiere una maestría), mientras que un etiquetador externo solo gana 185 euros diarios, lo que representa una diferencia de más del triple.

2. Los etiquetadores ya no se limitan a “delinear contornos”: ahora necesitan conocimientos de código, dialectos e incluso medicina

Antes, el trabajo de los etiquetadores era mecánico; hoy en día, es mucho más especializado:

  • Etiquetado de texto: En la era de los grandes modelos, se necesita conocer el código para detectar errores en los programas desarrollados por AI.
  • Etiquetado de voz: Es necesario entender dialectos y emociones. Por ejemplo, la empresa de Musk, xAI, busca instructores que conozcan el dialecto sichuanés para evaluar las pronunciaciones; JD.com busca etiquetadores de francés con un nivel avanzado de francés.
  • Etiquetado de imágenes/vídeos: En el ámbito de la conducción autónoma, se requiere conocimiento sobre sensores (por ejemplo, procesar datos 3D para crear escenas urbanas virtuales); los salarios pueden llegar a los 40-7000 euros al mes.
  • Etiquetado multimodal: Se trata de trabajar con imágenes, texto, audio y video simultáneamente. Estos puestos representan el 36% del mercado y son los más demandados. En resumen, los etiquetadores actuales deben ser expertos en su área y también asistentes eficaces para el AI.

3. La división del trabajo entre grandes empresas y proveedores externos: las grandes empresas establecen las reglas y los proveedores externos se encargan de la ejecución

La cadena industrial es clara:

  • Grandes empresas (JD.com, Tencent, Alibaba): Definen las reglas de etiquetado y reclutan profesionales calificados (para el etiquetado de código o la evaluación de modelos AI), asegurándose así de la calidad de los datos.
  • Proveedores externos (Haitian Ruisheng, Yunce Data): Dividen las tareas en partes más pequeñas y las asignan a etiquetadores en ciudades de menor tamaño. Estos etiquetadores a menudo no saben para qué se utilizan los datos que etiquetan.

¿Por qué las empresas externas prefieren ciudades de menor tamaño? Porque el coste laboral es más bajo: en Beijing cuesta 4000 euros al mes encontrar personal, mientras que en un pueblo puede conseguirse con solo 2000 euros.

4. La evolución del trabajo de etiquetado a lo largo de 30 años

El etiquetado de datos no siempre ha existido; su desarrollo ha seguido cuatro etapas:

  • Época inicial (2006-2014): Era un trabajo académico; por ejemplo, Li Feifei creó el conjunto de datos ImageNet y contrató a estudiantes universitarios para etiquetar imágenes. Más tarde, se recurrió al crowdsourcing (50.000 personas en todo el mundo etiquetaron 14 millones de imágenes), lo que en ese momento se consideraba una forma de “vergüenza”.
  • Época de las “fábricas de etiquetado” (2014-2017): Se convirtió en un negocio; las primeras empresas de etiquetado se establecieron en ciudades de menor tamaño, empleando a jóvenes y madres para tareas básicas con salarios razonables.
  • Época de división y mejora (2017-2020): El Ministerio de Trabajo y Seguridad Social incluyó al “entrenador de inteligencia artificial” en su catálogo profesional, dividiendo a los etiquetadores en tres niveles.
  • Época de la revolución del AI (desde 2020): Ha llegado el etiquetado automático; tecnologías como GPT-3 han reducido la necesidad de etiquetación manual, aumentando la automatización del proceso del 30% al 60%. Sin embargo, nuevas necesidades (como evaluar la precisión de las respuestas del AI) siguen requiriendo intervención humana.

5. ¿Qué pasará en el futuro? ¿El AI se apoderará de los puestos de etiquetadores?

Los puestos básicos serán reemplazados por sistemas automáticos, mientras que aquellos que requieren conocimientos especializados seguirán siendo muy demandados:

  • Puestos desaparecidos: Los etiquetadores que realizan tareas simples (delinear contornos, transcribir texto).
  • Puestos que permanecerán: Expertos en sus áreas (por ejemplo, médicos o financieros) y profesionales que saben cómo gestionar y establecer reglas.

Los recursos humanos de las empresas de AI prefieren contratar graduados en informática para puestos de entrenador, ya que los etiquetadores básicos carecen de conocimientos especializados y capacidad lógica.

En resumen: La industria del etiquetado de datos está experimentando cambios significativos: los trabajos mecánicos serán reemplazados por tecnología, mientras que aquellos que combinan conocimientos especializados con habilidades analíticas se volverán cada vez más valiosos. Esto representa un desafío, pero también nuevas oportunidades para las personas que quieran entrar en el sector del AI.