La vision par ordinateur est un secteur de l’intelligence artificielle qui utilise l’apprentissage automatique et le deep learning pour permettre aux ordinateurs de « voir” et d’analyser leur environnement. La vision par ordinateur a un impact massif sur les entreprises de tous les secteurs, du commerce de détail à l’agriculture. Il est particulièrement utile pour les problèmes où nous aurions besoin d’un œil humain pour voir la situation. En raison de la grande quantité de problèmes qui existent dans ces critères, des milliers d’applications de la vision par ordinateur n’ont pas encore été découvertes ou épuisées.
Cet article sera une liste cumulative des applications de vision par ordinateur à croissance rapide et progressive utilisées par des industries de premier plan en 2021.
Vision par ordinateur dans le sport
Suivi de la pose du joueur
La vision par IA peut être utilisée pour reconnaître les schémas entre le mouvement du corps humain et la pose sur plusieurs images dans des séquences vidéo ou des flux vidéo en temps réel. L’estimation de la pose humaine a été appliquée à des vidéos réelles de nageurs où des caméras fixes uniques filment au-dessus et au-dessous de la surface de l’eau. Ces enregistrements vidéo peuvent être utilisés pour évaluer quantitativement les performances des athlètes sans annoter manuellement les parties du corps dans chaque image vidéo. Les réseaux de neurones convolutifs sont utilisés pour déduire automatiquement les informations de pose requises et détecter le style de natation d’un athlète.
Capture de mouvement sans marqueur
Les caméras peuvent être utilisées pour suivre le mouvement du squelette humain sans utiliser de marqueurs optiques traditionnels ni de caméras spécialisées. Ceci est essentiel dans la capture sportive, où les joueurs ne peuvent pas être chargés de vêtements ou d’appareils de capture de performances supplémentaires.
Évaluation objective de la performance de l’athlète
La détection et la reconnaissance automatisées des mouvements spécifiques au sport surmontent les limites associées aux méthodes d’analyse manuelle de la performance. Les entrées de données de vision par ordinateur peuvent être utilisées en combinaison avec les données de capteurs et de dispositifs portables portés sur le corps. Les cas d’utilisation populaires sont l’analyse de la natation, l’analyse du swing de golf, l’analyse de la course au sol, le ski alpin et la détection et l’évaluation du bowling de cricket.
Suivi de la pose multi-joueurs
À l’aide d’algorithmes de vision par ordinateur, la pose et le mouvement de plusieurs joueurs d’équipe peuvent être calculés à partir d’ensembles de données vidéo sportives monoculaires (images à une seule caméra) et multi-vues (images de plusieurs caméras). L’utilisation potentielle de l’estimation de la pose 2D ou 3D des joueurs dans le sport est large et comprend l’analyse des performances, la capture de mouvement et de nouvelles applications dans les médias audiovisuels et immersifs.
Reconnaissance des coups
Les applications de vision par ordinateur peuvent être utilisées pour détecter et classer les coups (par exemple pour classer les coups au tennis de table). La reconnaissance ou la classification des mouvements implique d’autres interprétations et prédictions étiquetées de l’instance identifiée (par exemple, différencier les coups de tennis en coup droit ou en revers). La reconnaissance des AVC vise à fournir des outils aux enseignants, aux entraîneurs et aux joueurs pour analyser les jeux de tennis de table et améliorer les compétences sportives plus efficacement.
Coaching En Temps Quasi Réel
L’analyse sportive basée sur la Vision par ordinateur aide à améliorez l’efficacité des ressources et réduisez les temps de rétroaction pour les tâches contraintes de temps. Les entraîneurs et les athlètes impliqués dans des tâches de notation chronophages, y compris l’analyse de la course après la natation, peuvent bénéficier d’une rétroaction objective rapide avant la prochaine course dans le programme de l’événement.
Analyse des comportements des équipes sportives
Les analystes du sport d’équipe professionnel effectuent régulièrement des analyses pour obtenir des informations stratégiques et tactiques sur le comportement des joueurs et de l’équipe (identifier les faiblesses, évaluer les performances et les potentiels d’amélioration). Cependant, l’analyse vidéo manuelle est généralement un processus fastidieux, où les analystes doivent mémoriser et annoter des scènes. Les techniques de vision par ordinateur peuvent être utilisées pour extraire des données de trajectoire à partir de matériel vidéo et appliquer des techniques d’analyse des mouvements pour dériver des mesures analytiques pertinentes du sport d’équipe pour l’analyse de la région, de la formation de l’équipe, de l’événement et des joueurs (par exemple dans l’analyse des sports d’équipe de football).
Couverture médiatique automatisée
La technologie de vision par IA peut utiliser des séquences vidéo pour interpréter des jeux sportifs et les transmettre aux médias sans nécessairement y aller avec des caméras physiques. Par exemple, le baseball a acquis cet avantage au cours des dernières années avec l’automatisation de la couverture des actualités des jeux.
Suivi de balle
Les données de trajectoire de balle sont l’une des informations les plus fondamentales et utiles dans l’évaluation des performances des joueurs et l’analyse des stratégies de jeu. Par conséquent, le suivi du mouvement de la balle est une application d’apprentissage profond et automatique pour détecter puis suivre la balle dans des images vidéo. Le suivi du ballon est important dans les sports avec de grands terrains (par exemple le football) pour aider les présentateurs de nouvelles et les analystes à interpréter et analyser un jeu sportif et des tactiques plus rapidement.
Technologie de la ligne de but
Des systèmes basés sur des caméras peuvent être utilisés pour déterminer si un but a été marqué ou non pour soutenir la prise de décision des arbitres. Différente des capteurs, la méthode basée sur la vision est non invasive et ne nécessite pas de modifications des appareils de football typiques. Ces systèmes de technologie de ligne de but sont basés sur des caméras à grande vitesse dont les images sont utilisées pour trianguler la position du ballon. Un algorithme de détection de balle qui analyse les régions de balle candidates afin de reconnaître le motif de balle.
Détection d’événements dans le sport
Le Deep Learning peut être utilisé pour détecter des événements complexes à partir de vidéos non structurées, comme marquer un but dans un match de football, des quasi-incidents ou d’autres parties passionnantes d’un match qui n’aboutissent pas à un score. Cette technologie peut être utilisée pour la détection d’événements en temps réel dans les émissions sportives, applicable à un large éventail de sports de terrain.
Rétroaction sur l’auto-entraînement
Les systèmes d’auto-entraînement basés sur la vision par ordinateur pour l’exercice sportif sont un sujet de recherche récemment émergent. Alors que l’auto-entraînement est essentiel dans l’exercice sportif, un praticien peut progresser dans une mesure limitée sans l’instruction d’un entraîneur. Par exemple, une application d’auto-entraînement au yoga vise à demander au praticien d’effectuer correctement les poses de yoga, d’aider à corriger les mauvaises postures et de prévenir les blessures. Un système d’auto-entraînement donne des instructions sur la façon d’ajuster la posture du corps.
Génération automatique de points forts
Produire des points forts sportifs est un travail à forte intensité de main-d’œuvre qui nécessite un certain degré de spécialisation, en particulier dans les sports avec un ensemble complexe de règles qui se jouent plus longtemps (par exemple. Cricket). Un exemple d’application est la génération automatique de points forts de cricket utilisant des fonctionnalités axées sur les événements et basées sur l’excitation pour reconnaître et couper les événements importants dans un match de cricket. Une autre application est la conservation automatique des faits saillants du golf en utilisant des fonctionnalités d’excitation multimodèles avec vision par ordinateur.
Notation de l’Activité sportive
Des méthodes d’apprentissage profond peuvent être utilisées pour la notation de l’activité sportive pour évaluer la qualité de l’action des athlètes (Caractéristiques profondes pour la notation de l’Activité Sportive). La notation automatique des activités sportives peut être utilisée en plongée, en patinage artistique ou en saut (ScoringNet est une application du réseau CNN en 3D pour la notation des activités sportives). Par exemple, une application de notation de plongée fonctionne en évaluant le score de qualité d’une performance de plongée d’un athlète: Il importe que les pieds de l’athlète soient ensemble et que leurs orteils soient pointés tout au long du processus de plongée.
La vision par ordinateur dans les soins de santé
Détection du cancer
L’apprentissage automatique est intégré dans les industries médicales à des fins telles que la détection du cancer du sein et de la peau. La détection d’images permet aux scientifiques de déceler de légères différences entre les images cancéreuses et non cancéreuses, et de diagnostiquer les données provenant des scanners d’imagerie par résonance magnétique (IRM) et des photos saisies comme malignes ou bénignes.
Diagnostic du COVID-19
La vision par ordinateur peut être utilisée pour le contrôle du coronavirus. Il existe plusieurs modèles de vision par ordinateur en apprentissage profond pour le diagnostic COVID-19 basé sur les rayons X. Le plus populaire pour la détection des cas de COVID-19 avec des images de radiographie thoracique numérique (CXR) s’appelle COVID-Net et a été développé par Darwin AI, Canada.
Classification des cellules
L’apprentissage automatique dans des cas d’utilisation médicale a été utilisé pour classer les lymphocytes T contre les cellules épithéliales du cancer du côlon avec une grande précision. Le ML devrait accélérer considérablement le processus d’identification de la maladie concernant le cancer du côlon de manière efficace et peu ou pas coûteuse après la création.
Analyse du mouvement
Les maladies neurologiques et musculo-squelettiques telles que les accidents vasculaires cérébraux, les problèmes d’équilibre et de démarche peuvent être détectées à l’aide de modèles d’apprentissage en profondeur et de vision par ordinateur, même sans analyse médicale. Les applications de vision par ordinateur d’estimation de pose qui analysent les mouvements du patient aident les médecins à diagnostiquer un patient avec facilité et une précision accrue.
Détection de masque
La reconnaissance faciale masquée est utilisée pour détecter l’utilisation de masques et d’équipements de protection afin de limiter la propagation du coronavirus. Les systèmes de vision par ordinateur aident les pays à mettre en œuvre des masques en tant que stratégie de contrôle pour contenir la propagation de la maladie à coronavirus. Des entreprises privées telles qu’Uber ont créé des fonctionnalités de vision par ordinateur à implémenter dans leurs applications mobiles pour détecter si les passagers portent ou non un masque. Des programmes comme celui-ci rendent les transports en commun plus sûrs pendant la pandémie de coronavirus.
Détection de tumeurs
Les tumeurs cérébrales peuvent être observées par IRM et sont souvent détectées à l’aide de réseaux neuronaux profonds. Un logiciel de détection de tumeurs utilisant l’apprentissage en profondeur est crucial pour l’industrie médicale car il peut détecter les tumeurs avec une grande précision pour aider les médecins à poser leurs diagnostics. De nouvelles méthodes sont constamment développées pour améliorer la précision de ces diagnostics.
Score de progression de la maladie
La vision par ordinateur peut être utilisée pour identifier les patients gravement malades afin de diriger les soins médicaux (dépistage des patients critiques). Les personnes infectées par le COVID-19 ont une respiration plus rapide. L’apprentissage en profondeur avec des caméras de profondeur peut être utilisé pour identifier les schémas respiratoires anormaux afin d’effectuer un dépistage précis et discret mais à grande échelle des personnes infectées par le virus COVID-19.
Soins de santé et réadaptation
La physiothérapie est importante pour l’entraînement à la récupération des survivants d’AVC et des patients souffrant de blessures sportives. Étant donné que la supervision par un professionnel fourni par un hôpital ou une agence médicale est coûteuse, une formation à domicile avec une application de réadaptation basée sur la vision est préférée car elle permet aux gens de pratiquer la formation au mouvement de manière privée et économique. En thérapie assistée par ordinateur ou en réadaptation, l’évaluation de l’action humaine peut être appliquée pour aider les patients à s’entraîner à domicile, les guider pour effectuer correctement les actions et les prévenir de nouvelles blessures.
Formation aux compétences médicales
Les applications de vision par ordinateur sont utilisées pour évaluer le niveau de compétence des apprenants experts sur des plates-formes d’auto-apprentissage. Par exemple, des plates-formes de formation chirurgicale basées sur la simulation ont été développées pour l’éducation chirurgicale. La technique d’évaluation de la qualité d’action permet de développer des approches de calcul qui évaluent automatiquement les performances des étudiants en chirurgie. Par conséquent, des informations de rétroaction significatives peuvent être fournies aux individus et les guider pour améliorer leurs niveaux de compétences.
Vision par ordinateur dans l’agriculture
Surveillance des cultures
Le rendement et la qualité des cultures importantes telles que le riz et le blé déterminent la stabilité de la sécurité alimentaire. Traditionnellement, le suivi de la croissance des cultures repose principalement sur un jugement humain subjectif et n’est ni opportun ni précis. Les applications de vision par ordinateur permettent de surveiller de manière continue et non destructive la croissance des plantes et la réponse aux besoins en nutriments. Par rapport aux opérations manuelles, la surveillance en temps réel de la croissance des cultures par l’application de la technologie de vision par ordinateur peut détecter les changements subtils dans les cultures dus à la malnutrition beaucoup plus tôt et peut fournir une base fiable et précise pour une régulation en temps opportun. Les applications de vision par ordinateur peuvent être utilisées pour mesurer les indicateurs de croissance des plantes ou pour déterminer le stade de croissance.
Détection de la floraison
La date de titre du blé est l’un des paramètres les plus importants pour les cultures de blé. Un système d’observation automatique par vision par ordinateur peut être utilisé pour déterminer la période de cap du blé. La technologie de vision par ordinateur présente les avantages d’un faible coût, d’une faible erreur, d’un rendement élevé et d’une bonne robustesse et peut être analysée de manière dynamique et continue.
Surveillance des plantations
Dans l’agriculture intelligente, le traitement d’images par drone peut être utilisé pour surveiller les plantations d’huile de palme à distance. Avec les orthophotos géospatiaux, il est possible d’identifier quelle partie des terres de plantation est fertile pour les cultures plantées. Il a également été possible d’identifier des zones moins fertiles en termes de croissance, ainsi qu’une partie du champ de plantation qui ne pousse pas du tout.
Détection des insectes
La reconnaissance et le comptage rapides et précis des insectes volants sont d’une grande importance, en particulier pour la lutte antiparasitaire. L’identification et le comptage manuels traditionnels des insectes volants sont inefficaces et demandent beaucoup de travail. Les systèmes basés sur la vision permettent le comptage et la reconnaissance des insectes volants (basés sur la détection et la classification des objets You Only Look Once (YOLO)).
Détection des maladies des plantes
Une estimation automatique et précise de la gravité de la maladie est essentielle pour la sécurité alimentaire, la gestion des maladies et la prévision des pertes de rendement. La méthode d’apprentissage en profondeur évite l’ingénierie des fonctionnalités à forte intensité de main-d’œuvre et la segmentation d’images basée sur des seuils. Une estimation automatique de la gravité des maladies des plantes basée sur des images à l’aide d’applications de réseau neuronal convolutif profond (CNN) a été développée, par exemple pour identifier la pourriture noire du pommier.
Désherbage automatique
Les mauvaises herbes sont considérées comme des plantes nuisibles en agronomie car elles sont en concurrence avec les cultures pour obtenir l’eau, les minéraux et autres nutriments du sol. La pulvérisation de pesticides uniquement à l’emplacement exact des mauvaises herbes réduit considérablement le risque de contamination des cultures, des humains, des animaux et des ressources en eau. La détection et l’élimination intelligentes des mauvaises herbes sont essentielles au développement de l’agriculture. Un système de vision par ordinateur basé sur un réseau de neurones peut être utilisé pour identifier les plants de pommes de terre et trois mauvaises herbes différentes pour une pulvérisation spécifique sur place.
Récolte automatique
Dans l’agriculture traditionnelle, il y a une dépendance aux opérations mécaniques, avec la récolte manuelle comme pilier, ce qui se traduit par des coûts élevés et une faible efficacité. Ces dernières années, avec l’application continue de la technologie de vision par ordinateur, des machines de récolte agricoles intelligentes haut de gamme, telles que les machines de récolte et les robots de cueillette basés sur la technologie de vision par ordinateur, ont émergé dans la production agricole, ce qui constitue une nouvelle étape dans la récolte automatique des cultures. L’objectif principal des opérations de récolte est d’assurer la qualité du produit pendant la récolte afin de maximiser la valeur marchande. Les applications de vision par ordinateur incluent la cueillette automatique des concombres dans un environnement de serre ou l’identification automatique des cerises dans un environnement naturel.
Tests de qualité des produits agricoles
La qualité des produits agricoles est l’un des facteurs importants affectant les prix du marché et la satisfaction des clients. Par rapport aux inspections manuelles, la vision par ordinateur offre un moyen d’effectuer des contrôles de qualité externes et d’atteindre des degrés élevés de flexibilité et de répétabilité à un coût relativement faible et avec une grande précision. Des systèmes basés sur la vision industrielle et la vision par ordinateur sont utilisés pour tester rapidement les dommages causés par le citron doux ou pour évaluer la qualité non destructive des pommes de terre.
Gestion de l’irrigation
La gestion des sols basée sur l’utilisation de la technologie pour améliorer la productivité des sols par la culture, la fertilisation ou l’irrigation a un impact notable sur la production agricole moderne. En obtenant des informations utiles sur la croissance des cultures horticoles à travers des images, le bilan hydrique du sol peut être estimé avec précision pour une planification précise de l’irrigation. Les applications de vision par ordinateur fournissent des informations précieuses sur le bilan hydrique de la gestion de l’irrigation. Un système basé sur la vision peut traiter des images multispectrales prises par des véhicules aériens sans pilote (UAV) et obtenir l’indice de végétation (VI) pour fournir une aide à la décision pour la gestion de l’irrigation.
Surveillance des terres agricoles par UAV
Les informations sur les terres agricoles en temps réel et une compréhension précise de ces informations jouent un rôle fondamental dans l’agriculture de précision. Au cours des dernières années, les DRONES, en tant que technologie en évolution rapide, ont permis l’acquisition d’informations agricoles à haute résolution, à faible coût et à des solutions rapides. Les plates-formes de drones équipées de capteurs d’image fournissent des informations détaillées sur l’économie agricole et les conditions des cultures (par exemple, la surveillance continue des cultures). La télédétection par DRONES a contribué à une augmentation de la production agricole avec une diminution des coûts agricoles.
Évaluation du rendement
Grâce à l’application de la technologie de vision par ordinateur, les fonctions de gestion des sols, de détection de la maturité et d’estimation du rendement des exploitations agricoles ont été réalisées. De plus, la technologie existante peut être bien appliquée à des méthodes telles que l’analyse spectrale et l’apprentissage profond. La plupart de ces méthodes présentent les avantages d’une haute précision, d’un faible coût, d’une bonne portabilité, d’une bonne intégration et évolutivité et peuvent fournir un support fiable pour la prise de décision de gestion. Un exemple est l’estimation du rendement des cultures d’agrumes par détection et comptage des fruits à l’aide de la vision par ordinateur. De plus, le rendement des champs de canne à sucre peut être prédit en traitant des images obtenues à l’aide d’un drone.
Surveillance des animaux
Les animaux peuvent être surveillés à l’aide de nouvelles techniques qui ont été entraînées pour détecter le type d’animal et ses actions. Il est très utile pour la surveillance des animaux en agriculture, où le bétail peut être surveillé à distance pour la détection de maladies, les changements de comportement ou l’accouchement. De plus, les scientifiques de l’agriculture et de la faune peuvent observer les animaux sauvages à distance en toute sécurité.
Automatisation agricole
Les technologies telles que les robots de récolte, d’ensemencement et de désherbage, les tracteurs autonomes et les drones pour surveiller les conditions de la ferme et appliquer des engrais peuvent maximiser la productivité avec des pénuries de main-d’œuvre. L’agriculture peut également être plus rentable lorsque l’empreinte écologique de l’agriculture est minimisée.
Vision par ordinateur dans les Transports
Classification des Véhicules
Applications de Vision par ordinateur pour la classification automatisée des véhicules ont une longue histoire. Les technologies de classification automatisée des véhicules évoluent depuis des décennies. Avec des capteurs abordables en croissance rapide tels que les caméras de télévision en circuit fermé (CCTV), la détection et la télémétrie de la lumière (LiDAR) et même des dispositifs d’imagerie thermique, les véhicules peuvent être détectés, suivis et classés dans plusieurs voies simultanément. La précision de la classification des véhicules peut être améliorée en combinant plusieurs capteurs tels que l’imagerie thermique, l’imagerie LiDAR et les caméras visibles RVB. Il existe plusieurs spécialisations, par exemple, une solution de vision par ordinateur basée sur l’apprentissage en profondeur pour la détection de véhicules de construction a été utilisée à des fins telles que la surveillance de la sécurité, l’évaluation de la productivité et la prise de décision managériale.
Détection des infractions en mouvement
Les organismes d’application de la loi et les municipalités intensifient le déploiement de systèmes de surveillance routière par caméra dans le but de réduire les comportements de conduite dangereux. Les techniques de vision par ordinateur sont de plus en plus utilisées pour automatiser la détection des infractions telles que les excès de vitesse, les feux rouges ou les panneaux d’arrêt, la conduite dans les mauvais sens et les virages illégaux.
Analyse des flux de trafic
L’analyse des flux de trafic a été largement étudiée pour les systèmes de transport intelligents (STI) en utilisant les deux méthodes invasives (tags, serpentins sous la chaussée, etc.) et des méthodes non invasives telles que les caméras. Avec l’essor de la vision par ordinateur et de l’IA, l’analyse vidéo peut désormais être appliquée aux caméras de circulation omniprésentes, ce qui peut générer un impact considérable dans les STI et la ville intelligente. Le flux de trafic peut être observé à l’aide de moyens de vision par ordinateur et mesurer certaines des variables requises par les ingénieurs de la circulation.
Détection de l’occupation du parking
La surveillance visuelle de l’espace de stationnement est utilisée dans le but de détecter l’occupation du parking. Les applications de vision par ordinateur alimentent des solutions décentralisées et efficaces pour la détection visuelle de l’occupation des parkings basées sur un réseau neuronal convolutif profond (CNN). Il existe plusieurs jeux de données pour la détection des parkings tels que PKLot et CNRPark-EXT. De plus, des systèmes de gestion de stationnement basés sur la vidéo ont été mis en œuvre à l’aide d’images stéréoscopiques (3D) ou de caméras thermiques.
Reconnaissance automatisée des plaques d’immatriculation
De nombreux systèmes de transport et de sécurité publique modernes dépendent de la capacité de reconnaître et d’extraire des informations sur les plaques d’immatriculation à partir d’images fixes ou de vidéos. La reconnaissance automatisée des plaques d’immatriculation (ALPR) a transformé à bien des égards les industries de la sécurité publique et des transports, en aidant à mettre en place des solutions de voirie à péage modernes, en réalisant d’énormes économies de coûts opérationnels grâce à l’automatisation, et même en permettant des capacités complètement nouvelles sur le marché (par exemple, unités de lecture de plaques d’immatriculation montées sur un croiseur de police). OpenALPR est une bibliothèque de reconnaissance automatique de plaques d’immatriculation populaire, basée sur la reconnaissance de caractères sur des images ou des flux vidéo de plaques d’immatriculation de véhicules.
Réidentification des véhicules
Grâce aux améliorations apportées à la réidentification des personnes, les systèmes de transport et de surveillance intelligents visent à reproduire cette approche pour les véhicules utilisant la réidentification des véhicules basée sur la vision. Les méthodes classiques pour fournir un identifiant de véhicule unique sont généralement intrusives (étiquette dans le véhicule, téléphone cellulaire ou GPS). Pour les réglages contrôlés tels qu’un poste de péage, la reconnaissance automatique des plaques d’immatriculation (ALPR) est probablement la technologie la mieux adaptée pour une identification précise des véhicules individuels. Cependant, les plaques d’immatriculation sont sujettes à changement et à falsification, et ALPR ne peut pas refléter les spécialités saillantes des véhicules telles que les marques ou les bosses. Les méthodes non intrusives telles que la reconnaissance basée sur l’image ont un potentiel et une demande élevés, mais sont encore loin d’être matures pour une utilisation pratique. La plupart des techniques de réidentification des véhicules basées sur la vision sont basées sur l’apparence du véhicule, comme la couleur, la texture et la forme. À ce jour, la reconnaissance de caractéristiques distinctives subtiles telles que la marque du véhicule ou le modèle de l’année est toujours un défi non résolu.
Détection des piétons
La détection des piétons est cruciale pour les systèmes de transport intelligents, elle va de la conduite autonome à la surveillance des infrastructures, en passant par la gestion du trafic, la sécurité et l’efficacité des transports en commun et l’application de la loi. La détection des piétons implique de nombreux types de capteurs, tels que des caméras CCTV ou IP traditionnelles, des dispositifs d’imagerie thermique, des dispositifs d’imagerie proche infrarouge et des caméras RVB embarquées. Les algorithmes de détection de piétons peuvent être basés sur des signatures infrarouges, des caractéristiques de forme, des caractéristiques de gradient, de l’apprentissage automatique ou des caractéristiques de mouvement. La détection des piétons s’appuyant sur des réseaux neuronaux à convolution profonde a fait des progrès significatifs, même avec la détection de piétons fortement occlus.
Détection des panneaux de signalisation
Les applications de vision par ordinateur sont utilisées pour la détection et la reconnaissance des panneaux de signalisation. Les techniques de vision sont appliquées pour segmenter les panneaux de signalisation à partir de différentes scènes de circulation (en utilisant la segmentation d’images) et utilisent des algorithmes d’apprentissage profond pour la reconnaissance et la classification des panneaux de signalisation.
Systèmes anticollision
La détection de véhicule et la détection de voie font partie intégrante de la plupart des systèmes d’aide à la conduite (ADAS) avancés. Les réseaux neuronaux profonds ont été utilisés récemment pour étudier l’apprentissage profond et son utilisation pour les systèmes autonomes d’évitement de collision.
Surveillance de l’état des routes
Des applications de détection de défauts par vision par ordinateur et d’évaluation de l’état sont développées pour surveiller les infrastructures civiles en béton et en asphalte. L’évaluation de l’état de la chaussée fournit des informations pour prendre des décisions plus rentables et cohérentes concernant la gestion du réseau de chaussée. En général, les inspections de détresse de la chaussée sont effectuées à l’aide de véhicules de collecte de données sophistiqués et / ou d’enquêtes au sol. Une approche d’apprentissage automatique en profondeur pour développer un indice d’état de la chaussée asphaltée a été développée pour fournir un moyen indépendant de l’homme, peu coûteux, efficace et sûr de détection automatisée de la détresse de la chaussée par vision par ordinateur. Une autre application est une application de vision par ordinateur pour détecter les nids-de-poule routiers afin d’allouer l’entretien des routes et de réduire le nombre d’accidents de véhicules connexes.
Évaluation de l’état de l’infrastructure
Pour assurer la sécurité et la facilité d’entretien de l’infrastructure civile, il est essentiel d’inspecter visuellement et d’évaluer son état physique et fonctionnel. Des systèmes d’inspection et de surveillance des infrastructures civiles basées sur la vision par ordinateur sont utilisés pour convertir automatiquement des données d’image et de vidéo en informations exploitables. Les applications d’inspection par vision par ordinateur sont utilisées pour identifier les composants structurels, caractériser les dommages visibles locaux et globaux et détecter les changements à partir d’une image de référence. Ces applications de surveillance comprennent la mesure statique de la déformation et du déplacement et la mesure dynamique du déplacement pour l’analyse modale.
Détection de l’attention du conducteur
La distraction au volant – comme la rêverie, l’utilisation du téléphone portable et le fait de regarder quelque chose à l’extérieur de la voiture – représente une grande proportion des accidents mortels de la route dans le monde. L’intelligence artificielle est utilisée pour comprendre les comportements de conduite, trouver des solutions pour atténuer les incidents de circulation routière. Les technologies de surveillance routière sont utilisées pour observer les violations de l’habitacle, par exemple dans la détection de ceinture de sécurité basée sur l’apprentissage profond dans la surveillance routière. Les technologies de surveillance des conducteurs embarqués se concentrent sur la détection visuelle, l’analyse et la rétroaction. Le comportement du conducteur peut être déduit à la fois directement des caméras orientées vers l’intérieur du conducteur et indirectement des caméras ou capteurs orientés vers l’extérieur. Des techniques basées sur l’analyse vidéo du conducteur détectent le visage et les yeux avec des algorithmes de direction du regard, d’estimation de la pose de la tête et de surveillance de l’expression faciale. Des algorithmes d’apprentissage profond et automatique qui ont reçu des milliers de données sur des visages attentifs et inattentifs peuvent détecter des différences entre des yeux focalisés et non focalisés, ainsi que des signes de conduite sous influence. Il existe plusieurs applications basées sur la vision pour la classification de la posture du conducteur distrait en temps réel avec plusieurs méthodes d’apprentissage profond (RNN et CNN) utilisées dans la détection de la distraction du conducteur.
Vision par ordinateur dans la vente au détail et la fabrication
Suivi des clients
Des dispositifs de comptage placés stratégiquement dans un magasin de détail peuvent collecter des données grâce à des processus d’apprentissage automatique sur l’endroit où les clients passent leur temps et pendant combien de temps. L’analyse des clients peut améliorer la compréhension des interactions avec les consommateurs dans les magasins de détail et améliorer l’optimisation de l’agencement des magasins.
Comptage des personnes
Des algorithmes de vision par ordinateur sont formés avec des exemples de données pour détecter les humains et les compter au fur et à mesure qu’ils sont détectés. Cette technologie de comptage des personnes est utile pour que les magasins collectent des données sur le succès de leurs magasins et peut également être appliquée dans des situations concernant COVID-19 où un nombre limité de personnes est autorisé dans un magasin à la fois.
Détection de vol
Les détaillants peuvent détecter les comportements suspects tels que le flânage ou l’accès à des zones interdites à l’aide d’algorithmes de vision par ordinateur qui analysent de manière autonome la scène.
Analyse du temps d’attente
Pour éviter les clients impatients et les files d’attente interminables, les détaillants mettent en œuvre une technologie de détection des files d’attente. La détection de file d’attente utilise des caméras pour suivre et compter le nombre d’acheteurs dans une ligne. Une fois qu’un seuil de clients a été atteint, le système émet une alerte pour que les commis ouvrent de nouvelles caisses.
Distance sociale
Pour s’assurer que les précautions de sécurité sont respectées, les entreprises utilisent des détecteurs de distance. Une caméra suit les mouvements des employés ou des clients et utilise des capteurs de profondeur pour évaluer la distance qui les sépare. Selon leur position, le système dessine un cercle rouge ou vert autour de la personne.
Analyse de la productivité
L’analyse de la productivité suit l’impact des changements sur le lieu de travail, la manière dont les employés consacrent leur temps et leurs ressources et met en œuvre divers outils. Ces données peuvent fournir des informations précieuses sur la gestion du temps, la collaboration sur le lieu de travail et la productivité des employés.
Gestion de la qualité
Les systèmes de gestion de la qualité garantissent qu’une organisation répond aux exigences des clients en traitant ses politiques, procédures, instructions et processus internes pour atteindre un taux de satisfaction global des consommateurs.
Formation des compétences
Un autre champ d’application des systèmes de vision est l’optimisation des opérations de chaîne de montage dans la production industrielle. L’évaluation de l’action humaine peut aider à construire des modèles d’action standardisés liés aux différentes étapes de l’opération, ainsi qu’à évaluer la performance des travailleurs formés. L’évaluation automatique de la qualité de l’action des travailleurs peut être bénéfique en améliorant la performance au travail, en favorisant l’efficacité productive (optimisation LEAN) et, plus important encore, en découvrant des actions dangereuses avant que des dommages ne surviennent.
Quelle est la prochaine étape ?
La technologie d’apprentissage profond et automatique a été utilisée pour créer des applications de vision par ordinateur de dizaines de façons et pour des industries de tous types.
- Explorez 8 applications de la vision par ordinateur pour le contrôle des coronavirus
- Apprenez tout sur l’Estimation de la pose humaine avec la vision par ordinateur.
- Découvrez notre aperçu complet de la détection d’objets en 2021.
- Lisez l’étude de cas sur une application de vision par ordinateur pour la surveillance des animaux.