Resumen del contenido principal
La Oficina Nacional de Datos ha lanzado un plan cuyo objetivo es proporcionar “combustible de alta calidad” para el desarrollo de la inteligencia artificial (IA): conjuntos de datos de alta calidad para la industria (conjuntos de datos procesados que pueden utilizarse directamente para entrenar modelos de IA). A través de seis acciones específicas —fortalecer las bases, expandir la capacidad, mejorar la calidad y la eficiencia, potenciar las aplicaciones, ofrecer servicios de gestión y liberar el valor de los datos—, se pretende crear una serie de conjuntos de datos que cubran áreas clave para 2028. Esto permitirá fomentar empresas y talento relacionados, formando un ciclo virtuoso de “datos → modelos → aplicaciones → más datos”, lo que a su vez impulsará nuevos puntos de crecimiento en la economía inteligente.
Interpretación detallada
1. ¿El desarrollo de la IA carece de “combustible”? Los conjuntos de datos de alta calidad son clave para resolver el problema
Los modelos de IA son como los coches, y los datos son el combustible: el combustible común (datos dispersos e sin procesar) no permite un rendimiento óptimo; se necesita combustible de alta calidad (conjuntos de datos de alta calidad) para que la IA funcione con precisión. Por ejemplo, para entrenar a la IA en el diagnóstico del cáncer se necesitan grandes cantidades de historiales médicos y datos de imágenes etiquetados; para el aprendizaje automático, se requieren datos estructurados sobre escenarios de conducción y comportamiento de vehículos. Actualmente, los datos en muchas industrias son dispersos o de baja calidad, lo que impide que la IA funcione adecuadamente en aplicaciones reales. Este plan busca resolver la “crisis de combustible” de la IA para que pueda ser verdaderamente implementada en todos los sectores.
2. “Alimentación precisa” en áreas clave: cobertura de asuntos de bienestar público y industrias emergentes
El plan especifica qué tipos de conjuntos de datos se deben crear, divididos en dos categorías:
- Áreas de necesidad básica para el bienestar público: fabricación industrial (datos de equipos de fábricas), agricultura y silvicultura (datos sobre el suelo y el crecimiento de cultivos), salud (historiales médicos e imágenes), educación (recursos educativos), finanzas (datos de evaluación de riesgos), etc. Las aplicaciones de IA en estos campos están directamente relacionadas con la vida de las personas.
- Carreras emergentes: economía de baja altitud (datos de drones), conducción inteligente, inteligencia corporal (datos de interacción con robots), fabricación biológica, etc., que representan puntos de crecimiento para la economía inteligente del futuro. En cada área, los datos deben ser creados según las necesidades: por ejemplo, los conjuntos de datos agrícolas deben permitir que la IA prediga enfermedades y plagas, y los datos médicos deben ayudar en el diagnóstico de enfermedades, asegurando que sean útiles y fáciles de utilizar.
3. La etiquetación de datos debe “mejorarse”: de un proceso manual a una combinación de tecnología inteligente y expertos
La etiquetación de datos consiste en proporcionar información adicional (por ejemplo, etiquetar un gato en una imagen como “gato” o un historial médico como “diabetes”) para que la IA los entienda. Anteriormente, todo se hacía manualmente, lo cual era lento y propenso a errores. Ahora se está mejorando:
- Etiquetación inteligente: las máquinas etiquetan automáticamente primero y luego los humanos verifican la precisión (por ejemplo, la IA marca los vehículos en una imagen y luego los humanos revisan).
- Participación de expertos: los datos de áreas especializadas (como la salud y el derecho) requieren la participación de expertos del sector para garantizar la exactitud (por ejemplo, médicos que etiquetan tumores en imágenes de resonancia magnética).
- Desarrollo industrial: el estado fortalecerá la industria de etiquetación en las primeras 7 ciudades piloto y luego establecerá áreas de prueba, fomentando empresas líderes (como aquellas que se especializan en la etiquetación de datos médicos), así como formando personal calificado (cursos en instituciones educativas y exámenes profesionales), lo que también creará muchos puestos de trabajo.
4. Los datos deben “vivir”: pasar de ser almacenados a generar ingresos
Los datos no deben quedarse solo en discos duros; deben convertirse en activos verdaderos:
- Ciclo de datos dinámico: las necesidades del sector generan datos → se crean datos → se entrenan modelos → los modelos se utilizan en el sector, lo que genera más datos → luego se optimizan los modelos (por ejemplo, cuando la IA se utiliza en fábricas, los datos sobre el funcionamiento de los equipos pueden mejorar aún más la precisión del modelo).
- Innovación en modelos de negocio: los datos pueden comercializarse en bolsas de valores (como productos), ofrecerse por suscripción (comprar datos mensualmente) o a través de API (utilizar interfaces para obtener datos), e incluso se puede explorar la venta de unidades mínimas de datos útiles (por ejemplo, términos técnicos específicos del sector).
- Exploración de la capitalización de datos: los datos pueden considerarse activos, como garantías para préstamos o inversiones en empresas, convirtiéndolos en recursos monetarios reales.
5. Medidas integrales para asegurar la implementación: coordinación nacional + garantía de seguridad
Para que esto funcione, es necesario:
- Coordinación entre el estado y las localidades: la Oficina Nacional de Datos lidera el proceso, mientras que las autoridades locales deben evitar construcciones duplicadas y adaptar las iniciativas a las características industriales locales.
- Apoyo financiero: guiar la inversión de instituciones financieras y fondos industriales; las localidades pueden establecer fondos especiales.
- Garantías de seguridad: prevenir la pérdida de datos o su contaminación (por ejemplo, proporcionar datos incorrectos a la IA), asegurando que los datos sean gestionables, controlables y rastreables.
En esencia, este plan tiene como objetivo dar más impulso al desarrollo de la IA, permitiendo que los datos y la tecnología inteligente coevolucionen y beneficien nuestras vidas: médicos AI más precisos, fábricas más inteligentes y sistemas de conducción automática más seguros. Todo esto está cada vez más cerca de convertirse en realidad.