Résumé des principaux points
Le Bureau national des données a mis en place un plan visant à fournir au développement de l'intelligence artificielle (IA) un « carburant de haute qualité » : des ensembles de données de haute qualité pour l'industrie (des collections de données traitées pouvant être directement utilisées pour entraîner les modèles d'IA). Grâce à six actions spécifiques – renforcement des bases, amélioration de la qualité et de l'efficacité, facilitation des applications, services de gestion et libération de la valeur –, il s'agit de créer d'ici 2028 un ensemble de données couvrant des domaines clés, de promouvoir les entreprises et les talents concernés, et de créer un cercle vertueux « données → modèles → applications → plus de données », afin que les données puissent dynamiser tous les secteurs d'activité et stimuler de nouvelles croissances économiques intelligentes.
Interprétation détaillée
1. Le développement de l'IA manque-t-il de « carburant » ? Les ensembles de données de haute qualité sont la clé pour briser le cercle vicieux
Les modèles d'IA sont comme des voitures, et les données sont l'essence : de l'essence ordinaire (des données dispersées et non traitées) ne permet pas une performance optimale ; il faut utiliser de l'essence de haute qualité (des ensembles de données bien structurés) pour que l'IA puisse fonctionner avec précision. Par exemple, pour entraîner un modèle d'IA à diagnostiquer le cancer, il est nécessaire de disposer de nombreuses données médicales et d'imageries bien étiquetées ; pour l'apprentissage automatique dans le domaine de la conduite intelligente, des données structurées sur les scénarios routiers et le comportement des véhicules sont indispensables. Actuellement, les données dans de nombreux secteurs sont soit dispersées, soit de mauvaise qualité, ce qui empêche l'IA d'être efficace dans les applications pratiques. Ce plan vise à résoudre cette crise de « carburant » et à permettre à l'IA de s'imposer réellement dans tous les secteurs.
2. Ciblage précis des domaines clés : couverture des besoins essentiels de la population et des industries émergentes
Le plan spécifie les domaines pour lesquels des ensembles de données doivent être créés, divisés en deux catégories :
- Domaines d'urgence pour la vie quotidienne : fabrication industrielle (données sur l'équipement des usines), agriculture et zones rurales (données sur le sol et la croissance des cultures), santé (dossiers médicaux, images), éducation (ressources pédagogiques), finance (données de gestion des risques), etc. Les applications de l'IA dans ces domaines affectent directement la vie des citoyens.
- Industries émergentes : économie aérienne de basse altitude (données sur les drones), conduite intelligente, intelligence corporelle (données sur l'interaction avec les robots), fabrication biologique, etc. Ces secteurs représentent des points de croissance pour l'économie intelligente du futur.
Pour chaque domaine, il est nécessaire de créer des données adaptées aux besoins spécifiques : par exemple, les ensembles de données agricoles doivent permettre à l'IA de prédire les maladies des cultures, et les ensembles de données médicales d'aider à diagnostiquer les maladies, afin que les données soient utiles et faciles à utiliser.
3. L'étiquetage des données doit être amélioré : de la méthode manuelle à une approche « intelligente + experte**
L'étiquetage des données consiste à fournir des informations claires (par exemple, identifier un chat dans une image ou diagnostiquer le diabète dans un dossier médical) pour que l'IA puisse les comprendre. Auparavant, tout était fait manuellement, ce qui était peu efficace et sujet à erreurs. L'amélioration passe par :
- Étiquetage intelligent : les machines effectuent d'abord l'étiquetage automatique, suivi d'une vérification humaine (par exemple, l'IA identifie d'abord les voitures dans une image, puis les humains vérifient l'exactitude).
- Participation des experts : pour les données spécialisées (comme en médecine ou en droit), il est nécessaire de faire appel à des experts du domaine pour assurer l'exactitude (par exemple, des médecins identifient les tumeurs sur des images d'imagerie).
- Développement industriel : l'État renforcera l'industrie de l'étiquetage dans les sept premières villes pilotes, puis créera des zones d'essai et encouragera le développement d'entreprises leaders (par exemple, des entreprises spécialisées dans l'étiquetage de données médicales), ainsi que la formation de professionnels (cours universitaires, examens de compétences professionnelles) – ce qui créera également de nombreux emplois.
4. Les données doivent devenir « vivantes » : passer d'un stockage inactif à une source de revenus
Les données ne doivent pas rester simplement stockées sur des disques durs ; elles doivent devenir un actif réel :
- Cercle vertueux des données : les scénarios nécessitent des données → création de données → entraînement de modèles → utilisation des modèles dans ces scénarios pour générer davantage de données → optimisation des modèles (par exemple, l'IA utilisée dans les usines génère des données sur le fonctionnement des équipements, permettant d'améliorer encore les modèles).
- Innovation des modèles commerciaux : les données peuvent être échangées sur des marchés (comme des produits), vendues sous forme de abonnements, utilisées via des API, ou même vendues au niveau des unités les plus utiles (par exemple, des termes techniques précis).
- Expérimentation de l'activation financière : les données peuvent être considérées comme un actif, permettant par exemple d'utiliser des garanties basées sur elles pour obtenir des prêts ou d'investir dans des entreprises, transformant ainsi les données en revenus réels.
5. Une approche globale pour assurer la mise en œuvre : coordination nationale + garantie de sécurité
Pour que ce plan fonctionne, il est nécessaire :
- Coordination nationale et locale : le Bureau national des données assure la coordination, tandis que les autorités locales doivent éviter des constructions redondantes et adapter les initiatives aux caractéristiques industrielles locales.
- Appui financier : orientation des institutions financières et des fonds industriels vers des investissements ; les autorités locales peuvent créer des fonds spéciaux.
- Garantie de sécurité : prévention des fuites de données et des attaques (par exemple, fourniture de données erronées à l'IA), afin que les données soient gérables, contrôlables et traçables.
Ce plan vise essentiellement à « alimenter » l'IA pour favoriser un développement conjoint des données et de l'intelligence artificielle, permettant ainsi aux technologies intelligentes d'intégrer réellement notre vie quotidienne : des médecins IA plus précis, des usines plus autonomes, une conduite intelligente plus sûre… Tout cela est désormais à portée de main.