Maybaygiare.org

Blog Network

56 beliebteste Computer Vision-Anwendungen im Jahr 2021

Computer Vision ist ein Bereich der künstlichen Intelligenz, der maschinelles und tiefes Lernen verwendet, um Computern das „Sehen“ und Analysieren ihrer Umgebung zu ermöglichen. Computer Vision hat massive Auswirkungen auf Unternehmen aller Branchen, vom Einzelhandel bis zur Landwirtschaft. Es ist besonders nützlich für Probleme, bei denen wir das Auge eines Menschen benötigen, um die Situation zu sehen. Aufgrund der Vielzahl von Problemen, die in diesem Bereich bestehen, wurden Tausende von Anwendungen von Computer Vision noch nicht entdeckt oder erschöpft.

Dieser Artikel wird ein kumulativer Listenbeitrag von schnell wachsenden und fortschrittlichen Computer-Vision-Anwendungen sein, die 2021 von führenden Branchen verwendet werden.

Computer Vision im Sport

Player Pose Tracking

AI Vision kann verwendet werden, um Muster zwischen menschlicher Körperbewegung und Pose über mehrere Frames in Videomaterial oder Echtzeit-Videostreams zu erkennen. Die Schätzung der menschlichen Pose wurde auf reale Videos von Schwimmern angewendet, bei denen einzelne stationäre Kameras über und unter der Wasseroberfläche filmen. Diese Videoaufnahmen können verwendet werden, um die Leistung der Athleten quantitativ zu bewerten, ohne die Körperteile in jedem Videoframe manuell zu kommentieren. Convolutional Neural Networks werden verwendet, um automatisch die erforderlichen Poseninformationen abzuleiten und den Schwimmstil eines Athleten zu erkennen.

Markerless Motion Capture

Kameras können verwendet werden, um die Bewegung des menschlichen Skeletts zu verfolgen, ohne herkömmliche optische Marker und Spezialkameras zu verwenden. Dies ist wichtig bei der Sporterfassung, bei der die Spieler nicht mit zusätzlicher Kleidung oder Geräten zur Leistungserfassung belastet werden können.

Objektive Leistungsbeurteilung des Athleten

Die automatisierte Erkennung und Erkennung sportspezifischer Bewegungen überwindet die Einschränkungen, die mit manuellen Leistungsanalysemethoden verbunden sind. Computer Vision-Dateneingaben können in Kombination mit den Daten von am Körper getragenen Sensoren und Wearables verwendet werden. Beliebte Anwendungsfälle sind Schwimmanalyse, Golfschwunganalyse, Over-Ground-Running-Analyse, alpines Skifahren und die Erkennung und Auswertung von Cricket-Bowling.

Multi-Player-Pose-Tracking

Mithilfe von Computer-Vision-Algorithmen können die Pose und Bewegung mehrerer Teamplayer sowohl aus monokularen (Einzelkamera-Aufnahmen) als auch aus Multi-View-Sportvideodatensätzen (Aufnahmen mehrerer Kameras) berechnet werden. Die potenzielle Verwendung der Schätzung der 2D- oder 3D-Pose von Spielern im Sport ist weitreichend und umfasst Leistungsanalyse, Bewegungserfassung und neuartige Anwendungen in Rundfunk- und immersiven Medien.

Stroke Recognition

Computer-Vision-Anwendungen können verwendet werden, um Schläge zu erkennen und zu klassifizieren (z. B. um Schläge im Tischtennis zu klassifizieren). Die Erkennung oder Klassifizierung von Bewegungen beinhaltet weitere Interpretationen und genaue Vorhersagen der identifizierten Instanz (z. B. Unterscheidung von Tennisschlägen als Vorhand oder Rückhand). Stroke Recognition zielt darauf ab, Lehrern, Trainern und Spielern Werkzeuge zur Verfügung zu stellen, mit denen sie Tischtennisspiele analysieren und ihre sportlichen Fähigkeiten effizienter verbessern können.

Pose Detection Deep Learning Sports Player
Beispiel für Spielerverfolgung mit Deep Learning-basierter Pose-Schätzung
Near-Real-Time-Coaching

Computer Vision-basierte Sportanalysen helfen, die Ressourceneffizienz zu verbessern und Rückmeldungen zu reduzieren zeiten für Zeitbeschränkungsaufgaben. Trainer und Athleten, die an zeitintensiven Notationsaufgaben beteiligt sind, einschließlich der Analyse nach dem Schwimmen, können von einem schnellen objektiven Feedback vor dem nächsten Rennen im Veranstaltungsprogramm profitieren.

Analyse des Verhaltens von Sportteams

Analysten im professionellen Mannschaftssport führen regelmäßig Analysen durch, um strategische und taktische Einblicke in das Spieler- und Teamverhalten zu erhalten (Schwächen identifizieren, Leistung und Verbesserungspotenziale bewerten). Die manuelle Videoanalyse ist jedoch in der Regel ein zeitaufwändiger Prozess, bei dem die Analysten Szenen speichern und kommentieren müssen. Computer Vision-Techniken können verwendet werden, um Trajektoriendaten aus Videomaterial zu extrahieren und Bewegungsanalysetechniken anzuwenden, um relevante mannschaftssportanalytische Maßnahmen für die Region, Teambildung, Ereignis- und Spieleranalyse abzuleiten (z. B. in der Fußballmannschaftssportanalyse).

Automatisierte Medienberichterstattung

Die KI-Vision-Technologie kann Videomaterial verwenden, um Sportspiele zu interpretieren und an die Medienhäuser zu übertragen, ohne unbedingt mit physischen Kameras dorthin zu gehen. Zum Beispiel hat Baseball diesen Vorteil in den letzten Jahren mit der Automatisierung der Spielberichterstattung gewonnen.

Ballverfolgung

Balltrajektoriendaten sind eine der grundlegendsten und nützlichsten Informationen bei der Bewertung der Leistung der Spieler und der Analyse von Spielstrategien. Daher ist die Verfolgung der Ballbewegung eine Anwendung des tiefen und maschinellen Lernens, um den Ball in Videobildern zu erkennen und dann zu verfolgen. Ballverfolgung ist in Sportarten mit großen Feldern (z. B. Fußball) wichtig, um Nachrichtensendern und Analysten zu helfen, ein Sportspiel und Taktiken schneller zu interpretieren und zu analysieren.

Torlinientechnologie

Kamerabasierte Systeme können verwendet werden, um festzustellen, ob ein Tor erzielt wurde oder nicht, um die Entscheidungsfindung von Schiedsrichtern zu unterstützen. Anders als bei Sensoren ist die Vision-basierte Methode nichtinvasiv und erfordert keine Änderungen an den typischen Fußballgeräten. Solche torlinientechnischen Systeme basieren auf Hochgeschwindigkeitskameras, deren Bilder verwendet werden, um die Position des Balls zu triangulieren. Ein Ballerkennungsalgorithmus, der Kandidatenballregionen analysiert, um das Ballmuster zu erkennen.

Ereigniserkennung im Sport

Deep Learning kann verwendet werden, um komplexe Ereignisse aus unstrukturierten Videos zu erkennen, z. B. das Erzielen eines Tores in einem Fußballspiel, Beinaheunfälle oder andere aufregende Teile eines Spiels, die nicht zu einer Punktzahl führen. Diese Technologie kann für die Echtzeit-Ereigniserkennung in Sportübertragungen verwendet werden, die für eine Vielzahl von Feldsportarten anwendbar sind.

Self-Training Feedback

Computer Vision basierte Selbsttrainingssysteme für Sportübungen sind ein kürzlich aufkommendes Forschungsthema. Während Selbsttraining in der Sportübung wesentlich ist, kann ein Praktiker in begrenztem Maße ohne die Anweisung eines Trainers Fortschritte machen. Zum Beispiel zielt eine Yoga-Selbsttrainingsanwendung darauf ab, den Praktiker anzuweisen, Yoga-Posen korrekt auszuführen, schlechte Körperhaltungen zu korrigieren und Verletzungen vorzubeugen. Ein Selbsttrainingssystem gibt Anweisungen zur Anpassung der Körperhaltung.

Automatische Highlight-Generierung

Das Erzeugen von Sport-Highlights ist eine arbeitsintensive Arbeit, die ein gewisses Maß an Spezialisierung erfordert, insbesondere bei Sportarten mit einem komplexen Regelwerk, das über einen längeren Zeitraum gespielt wird (z. Cricket). Ein Anwendungsbeispiel ist die automatische Generierung von Cricket-Highlights mithilfe ereignisgesteuerter und auf Spannung basierender Funktionen, um wichtige Ereignisse in einem Cricket-Match zu erkennen und auszuschneiden. Eine weitere Anwendung ist die automatische Kuration von Golf-Highlights mit Hilfe von Multimodel-Tracking-Funktionen mit Computer Vision.

Sports Activity Scoring

Für das Sports Activity Scoring können Deep-Learning-Methoden zur Beurteilung der Aktionsqualität von Sportlern eingesetzt werden (Deep Features für das Sports Activity Scoring). Die automatische Sportaktivitätsbewertung kann beim Tauchen, Eiskunstlauf oder Voltigieren verwendet werden (ScoringNet ist eine 3D-CNN-Netzwerkanwendung für die Sportaktivitätsbewertung). Zum Beispiel funktioniert eine Tauch-Scoring-Anwendung, indem sie den Qualitätsfaktor einer Tauchleistung eines Athleten bewertet: Es kommt darauf an, ob die Füße des Athleten zusammen sind und seine Zehen während des gesamten Tauchprozesses gerade sind.

Computer Vision im Gesundheitswesen

Krebserkennung

Maschinelles Lernen wird in der medizinischen Industrie für Zwecke wie Brust- und Hautkrebserkennung eingesetzt. Mit der Bilderkennung können Wissenschaftler geringfügige Unterschiede zwischen krebsartigen und nicht krebsartigen Bildern erkennen und Daten aus Magnetresonanztomographen (MRT) und eingegebenen Fotos als bösartig oder gutartig diagnostizieren.

COVID-19-Diagnose

Computer Vision kann zur Coronavirus-Kontrolle verwendet werden. Für die röntgenbasierte COVID-19-Diagnose gibt es mehrere Deep-Learning-Computer-Vision-Modelle. Die beliebteste Methode zur Erkennung von COVID-19-Fällen mit digitalen Röntgenbildern des Brustkorbs (CXR) heißt COVID-Net und wurde von Darwin AI, Kanada, entwickelt.

Zellklassifizierung

Maschinelles Lernen in medizinischen Anwendungsfällen wurde verwendet, um T-Lymphozyten gegen Dickdarmkrebs-Epithelzellen mit hoher Genauigkeit zu klassifizieren. Es wird erwartet, dass ML den Prozess der Krankheitsidentifikation in Bezug auf Darmkrebs erheblich beschleunigt effizient und zu geringen bis gar keinen Kosten nach der Erstellung.

Bewegungsanalyse

Neurologische und muskuloskelettale Erkrankungen wie entgegenkommende Schlaganfälle, Gleichgewichts- und Gangprobleme können mit Deep-Learning-Modellen und Computer Vision auch ohne ärztliche Analyse erkannt werden. Pose Estimation Computer Vision-Anwendungen, die Patientenbewegungen analysieren, unterstützen Ärzte bei der Diagnose eines Patienten mit Leichtigkeit und erhöhter Genauigkeit.

Maskenerkennung

Die maskierte Gesichtserkennung wird verwendet, um die Verwendung von Masken und Schutzausrüstungen zu erkennen, um die Ausbreitung des Coronavirus zu begrenzen. Computer-Vision-Systeme helfen Ländern, Masken als Kontrollstrategie zur Eindämmung der Ausbreitung der Coronavirus-Krankheit umzusetzen. Private Unternehmen wie Uber haben Computer-Vision-Funktionen entwickelt, die in ihren mobilen Apps implementiert werden sollen, um zu erkennen, ob Passagiere Masken tragen oder nicht. Programme wie dieses machen den öffentlichen Verkehr während der Coronavirus-Pandemie sicherer.

Tumorerkennung

Hirntumoren können in MRT-Scans gesehen werden und werden oft mit tiefen neuronalen Netzen erkannt. Tumorerkennungssoftware, die Deep Learning nutzt, ist für die medizinische Industrie von entscheidender Bedeutung, da sie Tumore mit hoher Genauigkeit erkennen kann, um Ärzten bei der Diagnose zu helfen. Es werden ständig neue Methoden entwickelt, um die Genauigkeit dieser Diagnosen zu erhöhen.

Disease Progression Score

Computer Vision kann verwendet werden, um Patienten zu identifizieren, die kritisch krank sind, um medizinische Aufmerksamkeit zu lenken (Critical Patient Screening). Menschen, die mit COVID-19 infiziert sind, atmen schneller. Deep Learning mit Tiefenkameras kann verwendet werden, um abnormale Atemmuster zu identifizieren und ein genaues und unauffälliges, aber groß angelegtes Screening von Personen durchzuführen, die mit dem COVID-19-Virus infiziert sind.

Gesundheit und Rehabilitation

Physiotherapie ist wichtig für das Erholungstraining von Schlaganfallüberlebenden und Sportverletzungspatienten. Da die Aufsicht durch einen Fachmann, der von einem Krankenhaus oder einer medizinischen Einrichtung zur Verfügung gestellt wird, teuer ist, wird ein Heimtraining mit einer sehbasierten Rehabilitationsanwendung bevorzugt, da es den Menschen ermöglicht, Bewegungstraining privat und wirtschaftlich zu üben. In der computergestützten Therapie oder Rehabilitation kann die Bewertung menschlicher Handlungen angewendet werden, um Patienten beim Training zu Hause zu unterstützen, sie zur ordnungsgemäßen Durchführung von Handlungen anzuleiten und sie vor weiteren Verletzungen zu schützen.

Medical Skill Training

Computer Vision-Anwendungen werden zur Beurteilung des Qualifikationsniveaus von Expertenlernenden auf Selbstlernplattformen verwendet. Beispielsweise wurden simulationsbasierte chirurgische Trainingsplattformen für die chirurgische Ausbildung entwickelt. Die Technik der Aktionsqualitätsbewertung ermöglicht es, rechnerische Ansätze zu entwickeln, die die Leistung der chirurgischen Studenten automatisch bewerten. Dementsprechend können Einzelpersonen aussagekräftige Feedback-Informationen zur Verfügung gestellt werden, die sie zur Verbesserung ihrer Fähigkeiten anleiten.

Computer Vision in der Landwirtschaft

Ernteüberwachung

Der Ertrag und die Qualität wichtiger Kulturen wie Reis und Weizen bestimmen die Stabilität der Ernährungssicherheit. Traditionell beruht die Überwachung des Pflanzenwachstums hauptsächlich auf subjektivem menschlichem Urteilsvermögen und ist nicht rechtzeitig oder genau. Computer Vision-Anwendungen ermöglichen es, das Pflanzenwachstum und die Reaktion auf den Nährstoffbedarf kontinuierlich und zerstörungsfrei zu überwachen. Im Vergleich zu manuellen Vorgängen kann die Echtzeitüberwachung des Pflanzenwachstums durch Anwendung der Computer-Vision-Technologie die subtilen Veränderungen der Pflanzen aufgrund von Unterernährung viel früher erkennen und eine zuverlässige und genaue Grundlage für eine rechtzeitige Regulierung bieten. Computer-Vision-Anwendungen können zur Messung von Pflanzenwachstumsindikatoren oder zur Bestimmung des Wachstumsstadiums verwendet werden.

Erkennung der Blüte

Das Blütedatum von Weizen ist einer der wichtigsten Parameter für Weizenkulturen. Ein automatisches Computer-Vision-Beobachtungssystem kann verwendet werden, um die Weizenüberschriftsperiode zu bestimmen. Computer vision technologie hat die vorteile von niedrigen kosten, kleine fehler, hohe effizienz und gute robustheit und kann dynamisch und kontinuierlich analysiert.

Plantagenüberwachung

In der intelligenten Landwirtschaft kann die Bildverarbeitung mit Drohnenbildern verwendet werden, um Palmölplantagen aus der Ferne zu überwachen. Mit geospatial Orthophotos ist es möglich zu identifizieren, welcher Teil des Plantagenlandes für gepflanzte Kulturen fruchtbar ist. Es war auch möglich, Bereiche zu identifizieren, die in Bezug auf das Wachstum weniger fruchtbar sind, und auch einen Teil des Plantagenfeldes, der überhaupt nicht wächst.

Insektendetektion

Eine schnelle und genaue Erkennung und Zählung fliegender Insekten sind insbesondere für die Schädlingsbekämpfung von großer Bedeutung. Die traditionelle manuelle Identifizierung und Zählung fliegender Insekten ist ineffizient und arbeitsintensiv. Vision-basierte Systeme ermöglichen das Zählen und Erkennen von fliegenden Insekten (basierend auf You Only Look Once (YOLO) Objekterkennung und -klassifizierung).

Erkennung von Pflanzenkrankheiten

Die automatische und genaue Abschätzung des Schweregrads von Krankheiten ist für die Ernährungssicherheit, das Krankheitsmanagement und die Vorhersage von Ertragsverlusten unerlässlich. Die Deep-Learning-Methode vermeidet arbeitsintensives Feature-Engineering und schwellwertbasierte Bildsegmentierung. Automatische bildbasierte Abschätzung des Schweregrads von Pflanzenkrankheiten mithilfe von Deep Convolutional Neural Network (CNN) -Anwendungen wurden entwickelt, um beispielsweise Apfelschwarzfäule zu identifizieren.

Automatisches Jäten

Unkräuter gelten in der Agronomie als Schadpflanzen, da sie mit Nutzpflanzen konkurrieren, um Wasser, Mineralien und andere Nährstoffe im Boden zu erhalten. Das Sprühen von Pestiziden nur an den exakten Stellen von Unkräutern verringert das Risiko einer Kontamination von Kulturpflanzen, Menschen, Tieren und Wasserressourcen erheblich. Die intelligente Erkennung und Entfernung von Unkräutern ist entscheidend für die Entwicklung der Landwirtschaft. Ein neuronales Netzwerk-basiertes Computer-Vision-System kann verwendet werden, um Kartoffelpflanzen und drei verschiedene Unkräuter für das spezifische Sprühen vor Ort zu identifizieren.

Automatische Ernte

In der traditionellen Landwirtschaft ist man auf mechanische Operationen angewiesen, wobei die manuelle Ernte die Hauptstütze ist, was zu hohen Kosten und geringer Effizienz führt. In den letzten Jahren sind mit der kontinuierlichen Anwendung der Computer-Vision-Technologie intelligente landwirtschaftliche High-End-Erntemaschinen wie Erntemaschinen und Kommissionierroboter auf der Basis der Computer-Vision-Technologie in der landwirtschaftlichen Produktion entstanden, was ein neuer Schritt bei der automatischen Ernte von Kulturpflanzen war. Das Hauptaugenmerk der Erntevorgänge liegt darauf, die Produktqualität während der Ernte sicherzustellen, um den Marktwert zu maximieren. Computer Vision betriebene Anwendungen umfassen das automatische Pflücken von Gurken in einer Gewächshausumgebung oder die automatische Identifizierung von Kirschen in einer natürlichen Umgebung.

Qualitätsprüfung landwirtschaftlicher Produkte

Die Qualität landwirtschaftlicher Produkte ist einer der wichtigsten Faktoren, die die Marktpreise und die Kundenzufriedenheit beeinflussen. Im Vergleich zu manuellen Inspektionen bietet Computer Vision eine Möglichkeit, externe Qualitätsprüfungen durchzuführen und ein hohes Maß an Flexibilität und Wiederholbarkeit zu relativ geringen Kosten und mit hoher Präzision zu erreichen. Systeme, die auf Machine Vision und Computer Vision basieren, werden zur schnellen Prüfung von Schäden an süßer Zitrone oder zur zerstörungsfreien Qualitätsbewertung von Kartoffeln eingesetzt.

Bewässerungsmanagement

Das Bodenmanagement, das auf dem Einsatz von Technologie zur Steigerung der Bodenproduktivität durch Anbau, Düngung oder Bewässerung basiert, hat einen bemerkenswerten Einfluss auf die moderne landwirtschaftliche Produktion. Durch das Erhalten nützlicher Informationen über das Wachstum von Gartenbaukulturen durch Bilder kann der Bodenwasserhaushalt genau geschätzt werden, um eine genaue Bewässerungsplanung zu erreichen. Computer Vision-Anwendungen liefern wertvolle Informationen über das Bewässerungsmanagement Wasserhaushalt. Ein Vision-basiertes System kann multispektrale Bilder von unbemannten Luftfahrzeugen (UAVs) verarbeiten und den Vegetationsindex (VI) erhalten, um Entscheidungshilfe für das Bewässerungsmanagement zu bieten.

UAV Farmland Monitoring

Echtzeit-Farmlandinformationen und ein genaues Verständnis dieser Informationen spielen eine grundlegende Rolle in der Präzisionslandwirtschaft. In den letzten Jahren hat UAV als schnell fortschreitende Technologie die Erfassung landwirtschaftlicher Informationen mit hoher Auflösung, niedrigen Kosten und schnellen Lösungen ermöglicht. UAV-Plattformen, die mit Bildsensoren ausgestattet sind, liefern detaillierte Informationen über die Agrarökonomie und die Erntebedingungen (z. B. kontinuierliche Ernteüberwachung). Die UAV-Fernerkundung hat zu einer Steigerung der landwirtschaftlichen Produktion bei gleichzeitig sinkenden Agrarkosten beigetragen.

Ertragsbewertung

Durch die Anwendung der Computer-Vision-Technologie wurden die Funktionen Bodenmanagement, Reifedetektion und Ertragsschätzung für landwirtschaftliche Betriebe realisiert. Darüber hinaus kann die vorhandene Technologie gut auf Methoden wie Spektralanalyse und Deep Learning angewendet werden. Die meisten dieser Methoden haben die Vorteile hoher Präzision, niedriger Kosten, guter Portabilität, guter Integration und Skalierbarkeit und können die Entscheidungsfindung des Managements zuverlässig unterstützen. Ein Beispiel ist die Schätzung des Ernteertrags von Zitrusfrüchten durch Fruchterkennung und -zählung mithilfe von Computer Vision. Auch die Ausbeute aus Zuckerrohrfeldern kann durch Verarbeitung von Bildern, die mit UAV erhalten wurden, vorhergesagt werden.

Tierüberwachung

Tiere können mit neuartigen Techniken überwacht werden, die darauf trainiert wurden, die Art des Tieres und seine Handlungen zu erkennen. Es gibt viel Gebrauch für Tierüberwachung in der Landwirtschaft, in der Viehbestand für Krankheitsentdeckung, Änderungen im Verhalten oder Gebären entfernt überwacht werden kann. Darüber hinaus können Landwirtschafts- und Wildtierwissenschaftler wilde Tiere aus der Ferne sicher betrachten.

Farm Automation

Technologien wie Ernte-, Aussaat- und Unkrautroboter, autonome Traktoren und Drohnen zur Überwachung der Farmbedingungen und zum Ausbringen von Düngemitteln können die Produktivität bei Arbeitskräftemangel maximieren. Die Landwirtschaft kann auch rentabler sein, wenn der ökologische Fußabdruck der Landwirtschaft minimiert wird.

Deep Learning Landwirtschaft Objekt Erkennung Verwenden Fall
Landwirtschaft Computer Vision Anwendung für Tier Überwachung

Computer Vision in Transport

Fahrzeug Klassifizierung

Computer Vision anwendungen für automatisierte fahrzeug klassifizierung eine lange Geschichte. Die Technologien zur automatisierten Fahrzeugklassifizierung haben sich über Jahrzehnte weiterentwickelt. Mit schnell wachsenden erschwinglichen Sensoren wie CCTV‐Kameras (Closed Circuit Television), LiDAR-Geräten (Light Detection and Ranging) und sogar Wärmebildgeräten können Fahrzeuge auf mehreren Fahrspuren gleichzeitig erkannt, verfolgt und kategorisiert werden. Die Genauigkeit der Fahrzeugklassifizierung kann durch die Kombination mehrerer Sensoren wie Wärmebild, LiDAR-Bildgebung und RGB-sichtbaren Kameras verbessert werden. Es gibt mehrere Spezialisierungen, zum Beispiel wurde eine Deep-Learning-basierte Computer-Vision-Lösung für die Erkennung von Baufahrzeugen für Zwecke wie Sicherheitsüberwachung, Produktivitätsbewertung und Managemententscheidungen eingesetzt.

Erkennung bewegter Verstöße

Strafverfolgungsbehörden und Kommunen setzen verstärkt kamerabasierte Fahrbahnüberwachungssysteme ein, um unsicheres Fahrverhalten zu reduzieren. Computer‐Vision-Techniken werden zunehmend eingesetzt, um die Erkennung von Verstößen wie Geschwindigkeitsüberschreitungen, rote Ampeln oder Stoppschilder, Falschfahrten und illegale Abbiegungen zu automatisieren.

Verkehrsflussanalyse

Die Analyse des Verkehrsflusses wurde ausführlich für intelligente Transportsysteme (ITS) mit beiden invasiven Methoden (Tags, Unterfahrschutzspulen usw.) untersucht.) und nicht-invasive Methoden wie Kameras. Mit dem Aufkommen von Computer Vision und KI kann Videoanalyse nun auf die allgegenwärtigen Verkehrskameras angewendet werden, die enorme Auswirkungen auf ITS und Smart City haben können. Der Verkehrsfluss kann mit Computer-Vision-Mitteln beobachtet werden und einige der von Verkehrsingenieuren benötigten Variablen messen.

Parkplatzbelegungserkennung

Die visuelle Parkraumüberwachung wird mit dem Ziel der Parkplatzbelegungserkennung eingesetzt. Computer Vision-Anwendungen ermöglichen dezentrale und effiziente Lösungen zur visuellen Parkplatzbelegungserkennung auf Basis eines Deep Convolutional Neural Network (CNN). Es gibt mehrere Datensätze für die Parkplatzerkennung wie PKLot und CNRPark-EXT. Darüber hinaus wurden videobasierte Parkmanagementsysteme mit stereoskopischer Bildgebung (3D) oder Wärmebildkameras implementiert.

Automatische Kennzeichenerkennung

Viele moderne Transportmittel und öffentliche Sicherheitssysteme sind auf die Fähigkeit angewiesen, Kennzeicheninformationen aus Standbildern oder Videos zu erkennen und zu extrahieren. Die automatisierte Kennzeichenerkennung (ALPR) hat die öffentliche Sicherheits‐ und Transportindustrie in vielerlei Hinsicht verändert und dazu beigetragen, moderne mautpflichtige Straßenlösungen zu ermöglichen, enorme Betriebskosteneinsparungen durch Automatisierung zu erzielen und sogar völlig neue Funktionen auf dem Markt zu ermöglichen (z. B. auf Polizeikreuzern montierte Kennzeichenlesegeräte). OpenALPR ist eine beliebte automatische Nummernschilderkennungsbibliothek, die auf der Zeichenerkennung von Bildern oder Video-Feeds von Fahrzeugkennzeichen basiert.

Fahrzeug-Re-Identifikation

Mit Verbesserungen bei der Personen-Re-Identifikation wollen intelligente Transport- und Überwachungssysteme diesen Ansatz für Fahrzeuge mit Vision-basierter Fahrzeug-Re-Identifikation replizieren. Herkömmliche Methoden zur Bereitstellung einer eindeutigen Fahrzeug-ID sind in der Regel aufdringlich (In-Vehicle-Tag, Mobiltelefon oder GPS). Für kontrollierte Einstellungen wie an einer Mautstelle ist die automatische Kennzeichenerkennung (ALPR) wahrscheinlich die am besten geeignete Technologie zur genauen Identifizierung einzelner Fahrzeuge. Nummernschilder können jedoch geändert und gefälscht werden, und ALPR kann keine hervorstechenden Besonderheiten der Fahrzeuge wie Markierungen oder Dellen widerspiegeln. Non-intrusive Methoden wie die bildbasierte Erkennung haben ein hohes Potenzial und eine hohe Nachfrage, sind aber noch lange nicht ausgereift für den praktischen Einsatz. Die meisten bestehenden Vision-basierten Fahrzeug-Re-Identifikationstechniken basieren auf dem Erscheinungsbild des Fahrzeugs wie Farbe, Textur und Form. Die Erkennung subtiler Unterscheidungsmerkmale wie Fahrzeugmarke oder Baujahr ist bis heute eine ungelöste Herausforderung.

Fußgängererkennung

Die Erkennung von Fußgängern ist für intelligente Verkehrssysteme von entscheidender Bedeutung, sie reicht vom autonomen Fahren über die Überwachung der Infrastruktur, das Verkehrsmanagement, die Sicherheit und Effizienz des Transits bis hin zur Strafverfolgung. Die Fußgängererkennung umfasst viele Arten von Sensoren, z. B. herkömmliche CCTV‐ oder IP-Kameras, Wärmebildgeräte, Nahinfrarot-Bildgebungsgeräte und integrierte RGB-Kameras. Fußgängererkennungsalgorithmen können auf Infrarotsignaturen, Formmerkmalen, Gradientenmerkmalen, maschinellem Lernen oder Bewegungsmerkmalen basieren. Fußgängererkennung, die sich auf neuronale Netze mit tiefer Faltung stützt, hat erhebliche Fortschritte erzielt, selbst bei der Erkennung stark verdeckter Fußgänger.

Verkehrszeichenerkennung

Computer-Vision-Anwendungen werden zur Verkehrszeichenerkennung und -erkennung verwendet. Vision-Techniken werden angewendet, um Verkehrszeichen aus verschiedenen Verkehrsszenen zu segmentieren (mittels Bildsegmentierung) und Deep-Learning-Algorithmen zur Erkennung und Klassifizierung von Verkehrszeichen einzusetzen.

Kollisionsvermeidungssysteme

Fahrzeugerkennung und Spurerkennung sind integraler Bestandteil der fortschrittlichsten Fahrerassistenzsysteme (ADAS). Tiefe neuronale Netze wurden kürzlich verwendet, um tiefes Lernen und dessen Verwendung für autonome Kollisionsvermeidungssysteme zu untersuchen.

Straßenzustandsüberwachung

Anwendungen für die computer Vision-basierte Fehlererkennung und Zustandsbewertung werden entwickelt, um die zivile Infrastruktur von Beton und Asphalt zu überwachen. Die Bewertung des Fahrbahnzustands liefert Informationen, um kostengünstigere und konsistentere Entscheidungen in Bezug auf das Management des Straßennetzes zu treffen. Im Allgemeinen werden Straßenbelagsinspektionen mit ausgeklügelten Datenerfassungsfahrzeugen und / oder Bodenuntersuchungen durchgeführt. Ein Deep-Machine-Learning-Ansatz zur Entwicklung eines Asphaltpflasterzustandsindex wurde entwickelt, um eine vom Menschen unabhängige, kostengünstige, effiziente und sichere Möglichkeit zur automatisierten Erkennung von Straßenbelägen über Computer Vision bereitzustellen. Eine weitere Anwendung ist eine Computer-Vision-Anwendung zur Erkennung von Schlaglöchern, um die Straßeninstandhaltung zuzuordnen und die Anzahl der damit verbundenen Fahrzeugunfälle zu reduzieren.

Bewertung des Zustands der Infrastruktur

Um die Sicherheit und Funktionsfähigkeit der zivilen Infrastruktur zu gewährleisten, ist es unerlässlich, ihren physischen und funktionalen Zustand visuell zu überprüfen und zu bewerten. Systeme für die Computer Vision-basierte Inspektion und Überwachung ziviler Infrastruktur werden verwendet, um Bild- und Videodaten automatisch in verwertbare Informationen umzuwandeln. Computer Vision Inspection-Anwendungen werden verwendet, um strukturelle Komponenten zu identifizieren, lokale und globale sichtbare Schäden zu charakterisieren und Änderungen an einem Referenzbild zu erkennen. Solche Überwachungsanwendungen umfassen die statische Messung von Dehnung und Weg sowie die dynamische Messung von Weg für die Modalanalyse.

Aufmerksamkeitserkennung des Fahrers

Abgelenktes Fahren – wie Tagträumen, Handynutzung und Blick auf etwas außerhalb des Autos – macht weltweit einen großen Anteil der Verkehrstoten aus. Künstliche Intelligenz wird verwendet, um das Fahrverhalten zu verstehen und Lösungen zur Minderung von Verkehrsstörungen zu finden. Straßenüberwachungstechnologien werden eingesetzt, um Verstöße im Fahrgastraum zu beobachten, beispielsweise bei der Deep-Learning-basierten Gurterkennung bei der Straßenüberwachung. Fahrerüberwachungstechnologien im Fahrzeug konzentrieren sich auf visuelle Erfassung, Analyse und Rückmeldung. Das Fahrerverhalten kann sowohl direkt von nach innen gerichteten Kameras als auch indirekt von nach außen gerichteten Kameras oder Sensoren abgeleitet werden. Techniken, die auf der Videoanalyse des Fahrers basieren, erkennen Gesicht und Augen mit Algorithmen für die Blickrichtung, die Schätzung der Kopfhaltung und die Überwachung des Gesichtsausdrucks. Tiefe und maschinelle Lernalgorithmen, die Tausende von Daten von aufmerksamen und unaufmerksamen Gesichtern erhalten haben, können Unterschiede zwischen fokussierten und unfokussierten Augen sowie Anzeichen von Fahren unter dem Einfluss erkennen. Es gibt mehrere Vision-basierte Anwendungen für die Echtzeit-Klassifizierung der abgelenkten Fahrerhaltung mit mehreren Deep-Learning-Methoden (RNN und CNN), die bei der Erkennung von Fahrerablenkungen verwendet werden.

Computer-Vision-Anwendung zum Zählen von Fahrzeugen
Computer-Vision-Anwendung zum Zählen von Fahrzeugen

Computer Vision im Einzelhandel und in der Fertigung

Kundenverfolgung

Strategisch platzierte Zählgeräte in store kann durch maschinelle Lernprozesse Daten darüber sammeln, wo und wie lange Kunden ihre Zeit verbringen. Kundenanalysen können das Verständnis der Verbraucherinteraktion in Einzelhandelsgeschäften verbessern und die Optimierung des Ladenlayouts verbessern.

Personenzählung

Computer-Vision-Algorithmen werden mit Datenbeispielen trainiert, um Menschen zu erkennen und sie zu zählen, wenn sie erkannt werden. Eine solche Personenzähltechnologie ist für Geschäfte nützlich, um Daten über den Erfolg ihrer Geschäfte zu sammeln, und kann auch in Situationen in Bezug auf COVID-19 angewendet werden, in denen eine begrenzte Anzahl von Personen gleichzeitig in einem Geschäft zugelassen ist.

Diebstahlerkennung

Einzelhändler können verdächtiges Verhalten wie Herumlungern oder den Zugriff auf Bereiche, die gesperrt sind, mithilfe von Computer-Vision-Algorithmen erkennen, die die Szene autonom analysieren.

Analyse der Wartezeit

Um ungeduldige Kunden und endlose Warteschlangen zu vermeiden, implementieren Einzelhändler eine Technologie zur Erkennung von Warteschlangen. Die Warteschlangenerkennung verwendet Kameras, um die Anzahl der Käufer in einer Zeile zu verfolgen und zu zählen. Sobald eine Schwelle von Kunden erreicht ist, ertönt das System eine Warnung für Angestellte, um neue Kassen zu öffnen.

Soziale Distanz

Um sicherzustellen, dass Sicherheitsvorkehrungen befolgt werden, verwenden Unternehmen Distanzdetektoren. Eine Kamera verfolgt Mitarbeiter- oder Kundenbewegungen und verwendet Tiefensensoren, um den Abstand zwischen ihnen zu beurteilen. Abhängig von ihrer Position zeichnet das System einen roten oder grünen Kreis um die Person.

Produktivitätsanalysen

Produktivitätsanalysen Verfolgen Sie die Auswirkungen von Arbeitsplatzveränderungen, wie Mitarbeiter ihre Zeit und Ressourcen verbringen und implementieren Sie verschiedene Tools. Solche Daten können wertvolle Einblicke in das Zeitmanagement, die Zusammenarbeit am Arbeitsplatz und die Produktivität der Mitarbeiter geben.

Qualitätsmanagement

Qualitätsmanagementsysteme stellen sicher, dass ein Unternehmen die Anforderungen des Kunden erfüllt, indem es seine Richtlinien, Verfahren, Anweisungen und internen Prozesse anspricht, um eine allgemeine Verbraucherzufriedenheitsrate zu erreichen.

Skilltraining

Ein weiteres Anwendungsgebiet von Bildverarbeitungssystemen ist die Optimierung des Fließbandbetriebs in der industriellen Produktion. Die Bewertung menschlichen Handelns kann dabei helfen, standardisierte Handlungsmodelle für verschiedene Arbeitsschritte zu erstellen und die Leistung ausgebildeter Mitarbeiter zu bewerten. Die automatische Bewertung der Handlungsqualität von Arbeitnehmern kann von Vorteil sein, indem die Arbeitsleistung verbessert, die Produktionseffizienz gefördert (LEAN-Optimierung) und, was noch wichtiger ist, gefährliche Handlungen entdeckt werden, bevor Schäden auftreten.

Was kommt als nächstes?

Deep- und Machine-Learning-Technologie wurde verwendet, um Computer-Vision-Anwendungen auf Dutzende von Arten und für Branchen aller Art zu erstellen.

  • Entdecken Sie 8 Anwendungen von Computer Vision zur Coronavirus-Kontrolle
  • Erfahren Sie alles über die Schätzung der menschlichen Pose mit Computer Vision.
  • Sehen Sie sich unseren vollständigen Überblick über die Objekterkennung im Jahr 2021 an.
  • Lesen Sie die Fallstudie über eine Computer-Vision-Anwendung für die Tierüberwachung.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.