L’utilisation de l’intelligence artificielle, jumelée à l’analyse d’images, est de plus en plus répandue dans notre environnement professionnel et personnel.
Parmi les applications non-exhaustives, on retrouve :
- Le diagnostic médical
- Les véhicules autonomes
- L’identification de produits dans la grande distribution
- La vidéosurveillance
- La réalité augmentée
- La robotique
- Le contrôle qualité en milieu industriel
Les lunettes Meta/Rayban analysent en temps réel ce qui apparaît dans le champs de vision de l’utilisateur
Différents facteurs ont contribué à cet essor fulgurant :
- Les avancées technologiques – Les algorithmes d’apprentissage profond et de traitement d’images ont effectué d’énormes progrès ces dernières années, permettant des applications plus précises et robustes.
- La disponibilité des données – L’accumulation des données images et vidéos accessibles permet d’entraîner les algorithmes de façon plus efficace. Les jeux de données annotés sont de plus en plus volumineux.
- La puissance de calcul – Les GPU et autres architectures matérielles dédiées permettent d’effectuer rapidement les calculs nécessaires au traitement d’images par IA.
- La baisse des coûts – Le coût du stockage, des GPU et des infrastructures cloud a diminué, rendant l’IA sur les images plus abordable.
- Les applications grand public – L’IA pour l’imagerie apporte des fonctionnalités intéressantes pour les smartphones, les réseaux sociaux, la photographie, etc.
- Les investissements – Les géants du numérique et les startups injectent des sommes colossales dans ces technologies de pointe, accélérant les avancées.
L'expérience utilisateur et l'IA
Dans le milieu professionnel, nos clients ont adopté ces technologies, notamment pour le contrôle qualité, la maintenance et l’assistance aux opérateurs. Souvent cantonnés à des caméras fixes sur les chaînes de production, nous sommes amenés à étudier de plus en plus de systèmes légers et transportables :
Dans le cadre de nos projets, nous avons testé différentes configurations de systèmes portables, en commençant par les lunettes de réalité augmentée que nous avons décrites dans notre article sur l’utilisation des lunettes de réalité augmentée dans une déploiement industriel.
Et le plus souvent, le smartphone est la solution la plus appropriée : un système mobile efficace (batterie, ergonomie) de vision par ordinateur pouvant fonctionner en mode connecté ou déconnecté (informatique en périphérie). À condition de concevoir un réseau de neurones efficient, le système peut opérer de manière autonome ou faire appel à une puissance de calcul externalisée sur un serveur.
Mais la plupart du temps, les outils que nous créons vont au-delà du simple contrôle qualité et sont capables d’effectuer des prises de mesures et des traitements d’images assez poussés.
Application smartphone Octarina embarquée pour identification, comptage et mesures de pièces
Au-delà de l’analyse d’image, le smartphone fournit des fonctionnalités applicatives plus traditionnelles. Des applications classiques de contrôle qualité permettent d’effectuer la traçabilité des activités. Dans notre cas, le rapport est agrémenté de photos analysées par de l’IA. Un complément à très grande valeur ajoutée.
L'amélioration continue grâce à l'intelligence artificielle
Grâce à notre application, l’utilisateur peut augmenter sa productivité, automatiser ses rapports d’activité et leur archivage, mais aussi renvoyer les nouveaux cas non résolus ou erronés à l’intelligence artificielle (réseau neuronal convolutif) pour un perfectionnement de l’apprentissage en profondeur.
Comme le montre le schéma, les tentatives infructueuses viennent nourrir l’ensemble de données pour ré-entraîner l’IA et améliorer le système.
Pour alimenter l’intelligence artificielle, la pertinence du jeu de données est cruciale.
Créer un jeu de données pour le machine learning
La plupart du temps, nous créons des modèles de vision personnalisés aux problématiques de nos clients.
Cela consiste à :
- Créer un jeu de données le plus complet possible
- Créer le modèle de vision associé
Sans détailler l’intégralité du processus qui peut intervenir, après le passage par des outils de segmentation générique comme SAM, l’essentiel du travail consiste à créer un jeu de données métier pertinent, c’est-à-dire :
- Collecte de données : rassembler toutes les photos correspondant aux différentes situations
- Étiquetage des photos : indiquer dans la photo l’objet d’étude
Pour prendre un exemple trivial, créer un modèle de vision qui détecte les chats consiste à prendre des milliers de photos de chats et à « entourer » le chat dans chaque image.
Afin d’optimiser ce processus, nous utilisons notre propre outil de création de jeux de données : en employant notre outil 3D temps réel, nous pouvons produire des jeux de données étiquetés en un temps record et les mettre à jour très rapidement.
Nous appliquons aux photos générées un transfert de style qui permet d’appliquer un rendu ultra-réaliste (dans notre cas) à une image 3D. On peut voir ici un exemple avec Ned Flanders.
Ce logiciel Label Factory de génération de dataset accèlere et simplifie la création de modèle de vision. Basé sur le moteur 3D Unreal, il nous permet d’accélerer la mise en place de solutions avancées d’intelligence artificielle.
Si vous êtes intéressé par l’utilisation de l’intelligence articielle dans le cadre de vos activités, contactez nous.