Une solution d’intelligence artificielle sur mesure pour optimiser la gestion de votre industrie

Vous avez un projet ? Parlons-en !

Combien d'images faut-il vraiment pour entraîner un modèle de vision industrielle ?

images vision industrielle

« Il nous faut des milliers d’images pour démarrer. »

C’est la réponse que reçoivent encore beaucoup d’industriels quand ils posent la question à un intégrateur. Dans certains contextes, ce chiffre est juste. Il ne l’est pas quand l’approche est conçue autrement dès le départ. L’IA frugale part d’une logique différente : s’adapter aux contraintes du terrain, pas l’inverse. Moins de données, mais mieux choisies. Un modèle sobre, construit from scratch, robuste en production.

La vraie réponse dépend du cas d’usage, de l’approche choisie et surtout de la qualité de l’annotation. Voici comment calibrer ce besoin sur un projet industriel concret.

Pourquoi le chiffre de "milliers d'images" est juste et pourquoi il ne s'applique pas à nous

Les solutions de vision IA du marché (logiciels spécialisés, intégrateurs, solutions packagées) reposent sur des approches génériques, conçues pour traiter un large spectre de cas d’usage. Cette généralité a un coût : des volumes de données importants pour que le modèle « apprenne » suffisamment.

Sur un projet de détection de défauts standard, les estimations courantes tournent autour de 1 000 à 10 000 images annotées selon la complexité. Ce chiffre est légitime dans ce cadre. Il ne l’est pas quand l’approche est conçue autrement dès le départ.

L’IA frugale n’est pas un compromis sur la performance. C’est une façon différente de formuler le problème : construire un modèle qui apprend vite, sur peu d’exemples, dans un environnement contrôlé. C’est précisément ce que font les architectures que nous développons chez Leveraize.

Exemple : Un fabricant de pièces en tôlerie a reçu une estimation de 3 000 images auprès d’un intégrateur pour détecter des micro-rayures sur surface laquée. Le même projet a démarré chez Leveraize avec 12 images annotées, et le modèle a atteint 96 % de précision en production.

Ce que l'IA frugale change concrètement

Ce qui change, c’est la façon dont les modèles sont conçus pour apprendre efficacement à partir d’un volume limité d’exemples.

Quatre types d’approches couvrent la quasi-totalité des besoins en contrôle qualité visuel :

La détection d’anomalies est particulièrement adaptée aux cas où les défauts sont rares ou difficiles à anticiper. Elle ne nécessite que des images de pièces conformes : aucun défaut à collecter en amont.

Exemple : En agroalimentaire, un fabricant de boîtes métalliques a déployé un modèle de détection d’anomalies à partir de 18 images de boîtes conformes. Il détecte toute déformation ou anomalie de surface, y compris des défauts apparus pour la première fois.

Un avantage concret de la construction from scratch : la capitalisation interne. Un modèle construit pour un premier cas d’usage chez un client peut être étendu à ses autres lignes ou pièces sans repartir de zéro. L’investissement initial bénéficie aux déploiements suivants.

Les volumes réels sur les projets Leveraize

Ces chiffres sont issus de projets industriels. Ils varient selon la complexité du défaut à détecter et la stabilité des conditions d’imagerie.

Type de modèle Images nécessaires (Leveraize) Référence marché standard Cas d'usage typique

Détection d’objets

5 à 10 images
500 à 2 000 images
Localiser un défaut précis sur la pièce

Classification

10 à 100 images

200 à 1 000 images par classe

Distinguer conforme / NOK / type de défaut

Détection d’anomalies

10 à 100 images conformes

300 à 1 500 images

Défauts rares ou imprévisibles, surface homogène

Segmentation

10 à 100 images

500 à 3 000 images

Délimiter la zone affectée, métrologie visuelle

Ces volumes s’entendent avec des conditions d’imagerie maîtrisées et une annotation rigoureuse. C’est la combinaison des trois qui rend ces chiffres possibles.

Ce qui compte plus que le volume : la qualité de l'annotation

L’annotation est l’étape où un expert qualité définit ce qui est un défaut, et ce qui ne l’est pas. C’est aussi l’étape la plus sous-estimée des projets de vision IA.

Un modèle apprend exactement ce qu’on lui montre. Si l’annotation est ambiguë (par exemple une rayure superficielle classée défaut dans 60 % des images et conforme dans 40 %) le modèle apprend cette ambiguïté. Il ne la résout pas. Comme pour les postes de contrôle : on définit une défauthèque.

Trois règles pour une annotation efficace :

1. Formaliser les critères avant d'annoter

Le guide d'annotation doit précéder l'annotation elle-même. Il définit : à partir de quelle taille un défaut est NOK, quels types de défauts sont hors scope, comment gérer les cas limites. Ce document est rédigé par le responsable qualité, validé par le client, et utilisé comme référence tout au long du projet — y compris pour les futures sessions d'annotation.

2. Des outils ergonomiques boostés à l'IA

L'annotation manuelle image par image est le principal frein cité par les équipes qualité. Ce n'est plus une fatalité. Les outils d'annotation que nous proposons intègrent des assistants IA qui pré-annotent automatiquement les nouvelles images à partir des exemples déjà validés. L'opérateur valide, corrige, ou rejette mais il ne dessine plus à la main. Le temps d'annotation est réduit de 60 à 80 % dès les premières sessions. Ces outils permettent aussi d'identifier automatiquement les images les plus utiles à annoter en priorité (par exemple en priorisant celles sur lesquelles le modèle est encore incertain). Résultat : on annotate moins, mais on annotate ce qui compte.

3. Un annotateur principal, une revue par un second

L'annotation par une seule personne introduit des biais personnels. L'annotation par dix personnes sans référentiel introduit de l'incohérence. La configuration efficace : un annotateur principal formé sur le guide, une relecture systématique d'un second expert.

4. Inclure des cas difficiles dès le départ

Un modèle entraîné uniquement sur des défauts évidents échoue sur les cas limites (ceux précisément où la décision humaine est aussi difficile). Il faut représenter les cas ambigus dans le jeu d'entraînement, avec leur décision attendue clairement documentée.

Les conditions d'imagerie : le facteur souvent oublié

La quantité de données nécessaires augmente significativement si les conditions d’acquisition sont instables. Un modèle entraîné dans des conditions lumineuses fixes peut perdre 20 à 40 % de ses performances si l’éclairage change en production.

Avant de calculer le volume d’images nécessaires, il faut donc stabiliser les conditions physiques :

Un projet avec des conditions d’imagerie bien maîtrisées peut démarrer avec 10 images. Le même projet sur une ligne avec éclairage variable peut en nécessiter 600 pour compenser la variabilité non contrôlée.

En pratique : résoudre les problèmes d’imagerie avant de collecter des données. C’est moins séduisant qu’un algorithme, mais c’est là que se joue 80 % de la robustesse en production.

Comment collecter efficacement les données sur votre ligne

Constituer un jeu d’entraînement représentatif ne s’improvise pas. Voici la méthode utilisée sur les projets Leveraize :

  1. Définir les classes et le guide d’annotation avec le responsable qualité avant toute collecte
  2. Identifier les périodes de production représentatives : changements de lot, différents opérateurs, début et fin de poste
  3. Collecter en priorité les pièces aux limites des critères qualité (pas uniquement les défauts évidents)
  4. Viser un équilibre entre classes : si vous avez 80 images de défauts, cherchez aussi 80 images conformes proches des limites
  5. Valider le jeu d’entraînement sur un lot de test avant de lancer l’entraînement complet

Le temps de collecte et d’annotation est souvent comparable au temps de développement du modèle. Avec des outils adaptés, comme ceux présentés plus haut, on peut réduire ce temps.

Nos solutions de vision IA chez Leveraize

Leveraize développe des solutions de vision industrielle conçues pour les PME et ETI qui ne disposent ni de volumes de données massifs, ni d’équipes data. L’IA frugale n’est pas un positionnement commercial mais une contrainte que nous posons au départ de chaque projet.

ClairIA

ClairIA intègre les capacités de vision de Leveraize dans un pipeline complet : collecte des images sur ligne, annotation assistée par IA, entraînement du modèle, déploiement on-premise et suivi des performances en production.

Chaque image annotée et chaque décision validée par l’opérateur enrichissent le modèle. La base de connaissance visuelle du client se construit au fil des sessions de production, sans dépendance externe.

Développement de modèles à la demande

Pour les besoins spécifiques (intégration dans un MES ou système qualité existant, développement sur un type de défaut particulier, formation des équipes à l’annotation) Leveraize accompagne les projets sur mesure.

Chaque projet commence par le diagnostic des données disponibles. Aucun engagement de développement n’est pris avant que la faisabilité soit établie.

Notre article précédent

  • All Posts
  • Autre
  • Data et analyse
  • Emploi
  • Intelligence artificielle
  • Méthode

Nos solutions d'intelligence Artificielle au service de votre industrie

Suivez-nous sur LinkedIn

Retrouvez toutes nos actualités et nos nouveautés sur LinkedIn

FAQ sur la qualité industrielle

Peut-on démarrer avec des images de pièces conformes uniquement, sans images de défauts ?

Oui, avec l’approche d’anomaly detection. Le modèle apprend ce qu’est une pièce normale et signale tout ce qui s’en écarte. C’est particulièrement utile quand les défauts sont rares ou imprévisibles. La contrainte : les conditions d’imagerie doivent être stables.

 

Combien de temps prend la collecte et l'annotation des données ?

Pour un premier modèle sur un cas d’usage ciblé : enter 1h et 2 jours de collecte sur ligne et 1 à 2 jours d’annotation. C’est variable selon la fréquence des défauts et la complexité des critères. Une organisation rigoureuse de la collecte (planifiée avec la production) réduit significativement ce délai.

Faut-il tout reannoter si les conditions de production changent ?

Pas forcément. Si le changement est mineur (nouveau lot, légère variation de surface), une session de réentraînement avec quelques images nouvelles suffit généralement. Si les conditions d’imagerie changent substantiellement (nouvel éclairage, nouvelle caméra), une reconstruction partielle du jeu de données est nécessaire

Qui doit annoter les images : l'équipe Leveraize ou notre équipe interne ?

L’annotation des critères qualité doit venir de votre équipe. C’est vous qui définissez ce qui est conforme ou non car c’est votre référentiel qualité. Leveraize peut néanmoins réaliser une partie des annotations automatiquement en formant votre équipe aux outils d’annotation que nous développons.