computer vision to sektor sztucznej inteligencji, który wykorzystuje Maszyny i głębokie uczenie, aby umożliwić komputerom „zobaczenie” i analizę otoczenia. Wizja komputerowa ma ogromny wpływ na Firmy wszystkich branż, od handlu detalicznego po rolnictwo. Jest to szczególnie przydatne w przypadku problemów, w których potrzebujemy ludzkiego oka, aby zobaczyć sytuację. Ze względu na dużą ilość problemów, które istnieją w tych kryteriach, tysiące zastosowań widzenia komputerowego nie zostały jeszcze odkryte lub wyczerpane.
Ten artykuł będzie zbiorczą listą szybko rozwijających się i progresywnych aplikacji komputerowych vision używanych przez prominentne branże w 2021 roku.
widzenie komputerowe w sporcie
śledzenie pozycji gracza
widzenie AI może być używane do rozpoznawania wzorców między ruchem ludzkiego ciała a pozą na wielu klatkach w materiałach wideo lub strumieniach wideo w czasie rzeczywistym. Oszacowanie pozycji człowieka zostało zastosowane do rzeczywistych filmów pływaków, w których pojedyncze kamery stacjonarne filmują nad i pod powierzchnią wody. Te nagrania wideo można wykorzystać do ilościowej oceny wyników sportowców bez ręcznego opisywania części ciała w każdej klatce wideo. Konwolucyjne Sieci neuronowe są używane do automatycznego wyciągania wymaganych informacji o pozie i wykrywania stylu pływania sportowca.
Markerless Motion Capture
Kamery Mogą być używane do śledzenia ruchu ludzkiego szkieletu bez użycia tradycyjnych znaczników optycznych i specjalistycznych kamer. Jest to niezbędne w przechwytywaniu sportowym, gdzie gracze nie mogą być obciążeni dodatkowym strojem lub urządzeniami do przechwytywania wydajności.
obiektywna ocena wyników sportowców
Automatyczne wykrywanie i rozpoznawanie specyficznych dla sportu ruchów pokonuj ograniczenia związane z ręcznymi metodami analizy wyników. Komputerowe wejścia danych wizyjnych mogą być używane w połączeniu z danymi czujników noszonych na ciele i urządzeń do noszenia. Popularne przypadki użycia to analiza pływania, analiza swingu golfowego, analiza biegania naziemnego, narciarstwo alpejskie oraz wykrywanie i ocena kręgli krykieta.
Multi-Player Pose Tracking
korzystając z algorytmów widzenia komputerowego, pozę i ruch wielu graczy zespołowych można obliczyć zarówno z monokularu (Materiał Z Jednej Kamery), jak i z wielu widoków (materiał z wielu kamer) sportowych zestawów danych wideo. Potencjalne wykorzystanie szacowania pozy 2D lub 3D graczy w sporcie jest szeroko zakrojone i obejmuje analizę wydajności, przechwytywanie ruchu i nowatorskie aplikacje w mediach nadawczych i immersyjnych.
Rozpoznawanie uderzeń
aplikacje komputerowe mogą być używane do wykrywania i klasyfikacji uderzeń (na przykład do klasyfikacji uderzeń w tenisie stołowym). Rozpoznawanie lub klasyfikacja ruchów wiąże się z dalszymi interpretacjami i oznaczonymi przewidywaniami zidentyfikowanej instancji (na przykład różnicowanie uderzeń tenisowych jako forehand lub backhand). Funkcja rozpoznawania uderzeń ma na celu zapewnienie nauczycielom, trenerom i graczom narzędzi do analizy gier w tenisa stołowego i skuteczniejszego podnoszenia umiejętności sportowych.
Coaching w czasie zbliżonym do rzeczywistego
Analiza sportowa oparta na wizji komputerowej pomaga poprawić oszczędność zasobów i skrócenie czasu przekazywania informacji zwrotnych w przypadku zadań z ograniczeniami czasowymi. Trenerzy i sportowcy zaangażowani w czasochłonne zadania notacyjne, w tym analizę wyścigu po pływaniu, mogą skorzystać z szybkiej, obiektywnej informacji zwrotnej przed kolejnym wyścigiem w programie imprezy.
analiza zachowań drużyn sportowych
analitycy w profesjonalnym sporcie zespołowym regularnie przeprowadzają analizy, aby uzyskać strategiczny i taktyczny wgląd w zachowania zawodników i zespołów (zidentyfikować słabości, ocenić wydajność i potencjał poprawy). Jednak ręczna analiza wideo jest zazwyczaj czasochłonnym procesem, w którym analitycy muszą zapamiętywać i opisywać sceny. Techniki widzenia komputerowego można wykorzystać do wyodrębnienia danych trajektorii z materiału wideo i zastosowania technik analizy ruchu w celu uzyskania odpowiednich środków analizy sportu zespołowego dla regionu, formacji zespołu, zdarzeń i analizy gracza (na przykład w analizie sportów drużynowych).
zautomatyzowana obsługa medialna
technologia AI vision może wykorzystywać materiał wideo do interpretacji gier sportowych i przesyłania ich do domów mediowych bez konieczności korzystania z kamer fizycznych. Na przykład baseball zyskał tę przewagę w ciągu ostatnich kilku lat dzięki automatyzacji wiadomości o grach.
śledzenie piłki
dane trajektorii piłki są jedną z najbardziej podstawowych i przydatnych informacji w ocenie wydajności graczy i analizie strategii gry. W związku z tym śledzenie ruchu piłki jest zastosowaniem głębokiego i maszynowego uczenia się do wykrywania, a następnie śledzenia piłki w klatkach wideo. Śledzenie piłki jest ważne w sporcie o dużych polach (np. Piłka nożna), aby pomóc dziennikarzom i analitykom w szybszej interpretacji i analizie gry sportowej i taktyki.
Technologia linii bramkowej
Systemy oparte na kamerach mogą być używane do określania, czy bramka została zdobyta, czy nie, aby wspierać podejmowanie decyzji przez sędziów. W odróżnieniu od czujników, metoda wizyjna jest nieinwazyjna i nie wymaga zmian w typowych urządzeniach piłkarskich. Takie systemy technologii linii bramkowej oparte są na szybkich kamerach, których obrazy są wykorzystywane do triangulacji pozycji piłki. Algorytm wykrywania piłki, który analizuje kandydujące regiony piłki w celu rozpoznania wzorca piłki.
wykrywanie zdarzeń w sporcie
Deep Learning może być używany do wykrywania złożonych zdarzeń z nieustrukturyzowanych filmów, takich jak zdobywanie bramki w meczu piłki nożnej, bliskie pudła lub inne ekscytujące części gry, które nie dają wyniku. Technologia ta może być używana do wykrywania zdarzeń w czasie rzeczywistym w transmisjach sportowych, mających zastosowanie do szerokiej gamy sportów terenowych.
informacje zwrotne na temat samokształcenia
Systemy samokształcenia oparte na wizji komputerowej do ćwiczeń sportowych to niedawno rozwijający się temat badawczy. Podczas gdy samokształcenie jest niezbędne w ćwiczeniach sportowych, praktykujący może rozwijać się w ograniczonym stopniu bez instrukcji trenera. Na przykład, aplikacja do samodzielnego treningu jogi ma na celu pouczenie praktykującego, aby prawidłowo wykonywał pozy jogi, pomagając w prostowaniu złej postawy i zapobiegając urazom. System samotreningowy daje instrukcje, jak dostosować postawę ciała.
Automatyczne generowanie podświetlenia
Tworzenie podświetlenia sportowego jest pracochłonną pracą, która wymaga pewnego stopnia specjalizacji, szczególnie w sporcie z złożonym zestawem zasad, które są rozgrywane przez dłuższy czas (np. Krykieta). Przykładem zastosowania jest automatyczne generowanie podświetlenia krykieta za pomocą funkcji opartych na zdarzeniach i emocjach, aby rozpoznać i przycinać ważne wydarzenia w meczu krykieta. Inną aplikacją jest automatyczne dobieranie pasemek golfowych przy użyciu funkcji multimodelowych z widzeniem komputerowym.
ocena aktywności sportowej
metody głębokiego uczenia mogą być stosowane do oceny aktywności sportowej w celu oceny jakości działania sportowców (Głębokie cechy punktacji aktywności sportowej). Automatyczna ocena aktywności sportowej może być używana w nurkowaniu, łyżwiarstwie figurowym lub sklepieniu (ScoringNet to aplikacja sieciowa CNN 3D do punktowania aktywności sportowej). Na przykład, aplikacja scoring działa poprzez ocenę wyniku jakości wyników nurkowania sportowca: ma znaczenie, czy stopy sportowca są razem, a palce są skierowane prosto przez cały proces nurkowania.
widzenie komputerowe w opiece zdrowotnej
Wykrywanie Raka
Uczenie maszynowe jest wykorzystywane w przemyśle medycznym do celów takich jak wykrywanie raka piersi i skóry. Wykrywanie obrazu pozwala naukowcom wybrać niewielkie różnice między obrazami nowotworowymi i nienowotworowymi, a także diagnozować dane z obrazowania metodą rezonansu magnetycznego (MRI) i wprowadzanych zdjęć jako złośliwe lub łagodne.
diagnostyka COVID-19
widzenie komputerowe może być używane do kontroli koronawirusa. Istnieje wiele modeli głębokiego uczenia komputerowego do diagnostyki COVID-19 opartej na promieniowaniu rentgenowskim. Najbardziej popularny do wykrywania przypadków COVID – 19 za pomocą cyfrowych obrazów rentgenowskich klatki piersiowej (CXR) nosi nazwę COVID-Net i został opracowany przez Darwin AI w Kanadzie.
Klasyfikacja komórek
Uczenie maszynowe w przypadkach zastosowań medycznych zostało wykorzystane do sklasyfikowania limfocytów T przeciwko komórkom nabłonkowym raka jelita grubego z dużą dokładnością. Oczekuje się, że ML znacznie przyspieszy proces identyfikacji choroby w odniesieniu do raka jelita grubego skutecznie i przy niewielkim lub zerowym koszcie post-creation.
Analiza ruchu
choroby neurologiczne i mięśniowo-szkieletowe, takie jak nadchodzące udary, problemy z równowagą i chodem można wykryć za pomocą modeli głębokiego uczenia i widzenia komputerowego, nawet bez analizy lekarza. Pose Estimation computer vision aplikacje, które analizują ruch pacjenta, pomagają lekarzom w diagnozowaniu pacjenta z łatwością i zwiększoną dokładnością.
wykrywanie Maski
maskowane Rozpoznawanie twarzy służy do wykrywania użycia masek i sprzętu ochronnego w celu ograniczenia rozprzestrzeniania się koronawirusa. Komputerowe systemy wizyjne pomagają krajom wdrożyć maski jako strategię kontroli w celu powstrzymania rozprzestrzeniania się koronawirusa. Prywatne firmy, takie jak Uber, stworzyły funkcje wizji komputerowej, które mają być zaimplementowane w swoich aplikacjach mobilnych, aby wykryć, czy pasażerowie mają maski, czy nie. Takie programy czynią transport publiczny bezpieczniejszym podczas pandemii koronawirusa.
wykrywanie guza
guzy mózgu mogą być widoczne w obrazach MRI i są często wykrywane za pomocą głębokich sieci neuronowych. Oprogramowanie do wykrywania nowotworów wykorzystujące głębokie uczenie jest kluczowe dla branży medycznej, ponieważ może wykrywać guzy z wysoką dokładnością, aby pomóc lekarzom w stawianiu diagnoz. Stale opracowywane są nowe metody, aby zwiększyć dokładność tych diagnoz.
wynik progresji choroby
widzenie komputerowe może być wykorzystane do identyfikacji pacjentów, którzy są krytycznie chorzy w celu skierowania pomocy medycznej (krytyczne badanie przesiewowe pacjenta). U osób zakażonych COVID-19 występuje szybsze oddychanie. Głębokie uczenie za pomocą kamer głębinowych można wykorzystać do identyfikacji nieprawidłowych wzorców oddechowych, aby przeprowadzić dokładne i dyskretne, a jednocześnie zakrojone na szeroką skalę badania przesiewowe osób zakażonych wirusem COVID-19.
Opieka zdrowotna i rehabilitacja
fizykoterapia jest ważna dla szkolenia odzyskiwania po udarze mózgu i pacjentów z urazami sportowymi. Ponieważ nadzór przez specjalistę zapewniany przez szpital lub agencję medyczną jest drogi, preferowane jest szkolenie w domu z aplikacją rehabilitacji opartej na wizji, ponieważ pozwala ludziom ćwiczyć trening ruchowy prywatnie i ekonomicznie. W terapii wspomaganej komputerowo lub rehabilitacji ocena działania człowieka może być stosowana, aby pomóc pacjentom w szkoleniu w domu, poprowadzić ich do prawidłowego wykonywania czynności i zapobiec dalszym urazom.
trening umiejętności medycznych
aplikacje komputerowe służą do oceny poziomu umiejętności ekspertów na platformach samouczących się. Na przykład, symulacja oparte chirurgiczne platformy szkoleniowe zostały opracowane dla edukacji chirurgicznej. Technika oceny jakości działania umożliwia opracowanie metod obliczeniowych, które automatycznie oceniają wydajność studentów chirurgii. W związku z tym, istotne informacje zwrotne mogą być dostarczane do osób i poprowadzić ich do poprawy ich poziomu umiejętności.
wizja komputerowa w rolnictwie
monitorowanie upraw
wydajność i jakość ważnych upraw, takich jak ryż i pszenica, determinują stabilność bezpieczeństwa żywnościowego. Tradycyjnie monitorowanie wzrostu roślin opiera się głównie na subiektywnej ocenie ludzkiej i nie jest terminowe ani dokładne. Aplikacje wizyjne pozwalają na ciągłe i nieniszczące monitorowanie wzrostu roślin i reakcji na zapotrzebowanie na składniki odżywcze. W porównaniu z operacjami ręcznymi, monitorowanie wzrostu roślin w czasie rzeczywistym za pomocą technologii komputerowej wizji może wykryć subtelne zmiany w uprawach z powodu niedożywienia znacznie wcześniej i może zapewnić niezawodną i dokładną podstawę do terminowej regulacji. Aplikacje komputerowe wizyjne mogą być wykorzystywane do pomiaru wskaźników wzrostu roślin lub określenia etapu wzrostu.
wykrywanie kwitnienia
Data kwitnienia pszenicy jest jednym z najważniejszych parametrów dla upraw pszenicy. Automatyczny komputerowy system obserwacji może być używany do określania okresu pozycji pszenicy. Technologia wizji komputerowej ma zalety niskiego kosztu, małego błędu, wysokiej wydajności i dobrej wytrzymałości i może być dynamicznie i stale analizowana.
monitorowanie plantacji
w inteligentnym rolnictwie przetwarzanie obrazu za pomocą obrazów z dronów może być używane do zdalnego monitorowania plantacji oleju palmowego. Dzięki ortofotom geoprzestrzennym można określić, która część ziemi plantacyjnej jest żyzna dla nasadzeń. Udało się również zidentyfikować obszary mniej żyzne pod względem wzrostu, a także część pola plantacyjnego, która w ogóle nie rośnie.
wykrywanie owadów
szybkie i dokładne rozpoznawanie i liczenie owadów latających ma ogromne znaczenie, szczególnie w przypadku zwalczania szkodników. Tradycyjna ręczna identyfikacja i liczenie owadów latających jest nieefektywna i pracochłonna. Systemy wizyjne umożliwiają zliczanie i rozpoznawanie owadów latających (w oparciu o wykrywanie i klasyfikację obiektów You Only Look Once (YOLO)).
wykrywanie chorób roślin
Automatyczne i dokładne oszacowanie nasilenia choroby jest niezbędne dla bezpieczeństwa żywnościowego, zarządzania chorobą i przewidywania utraty plonów. Metoda głębokiego uczenia pozwala uniknąć pracochłonnej inżynierii funkcji i segmentacji obrazu opartej na progach. Opracowano automatyczną ocenę nasilenia choroby roślin opartą na obrazie za pomocą aplikacji Deep convolutional neural network (CNN), na przykład w celu identyfikacji czarnej zgnilizny jabłek.
automatyczne pielenie
chwasty są uważane za szkodliwe rośliny w agronomii, ponieważ konkurują z uprawami w celu uzyskania wody, minerałów i innych składników odżywczych w glebie. Rozpylanie pestycydów tylko w dokładnych miejscach chwastów znacznie zmniejsza ryzyko skażenia upraw, ludzi, zwierząt i zasobów wodnych. Inteligentne wykrywanie i usuwanie chwastów ma kluczowe znaczenie dla rozwoju rolnictwa. Komputerowy system wizyjny oparty na sieci neuronowej może być używany do identyfikacji roślin ziemniaka i trzech różnych chwastów do opryskiwania na miejscu.
automatyczne zbiory
w tradycyjnym rolnictwie istnieje zależność od operacji mechanicznych, a ręczne zbiory są podstawą, co skutkuje wysokimi kosztami i niską wydajnością. W ostatnich latach, dzięki ciągłemu stosowaniu technologii wizyjnej, w produkcji rolnej pojawiły się wysokiej klasy inteligentne maszyny do zbioru rolniczego, takie jak Maszyny do zbioru i roboty zbierające oparte na technologii wizyjnej, co było nowym krokiem w automatycznym zbieraniu upraw. Głównym celem operacji żniwnych jest zapewnienie jakości produktu podczas zbiorów, aby zmaksymalizować wartość rynkową. Aplikacje oparte na wizji komputerowej obejmują automatyczne zbieranie ogórków w środowisku szklarniowym lub automatyczną identyfikację wiśni w środowisku naturalnym.
Badanie jakości produktów rolnych
jakość produktów rolnych jest jednym z ważnych czynników wpływających na ceny rynkowe i zadowolenie klientów. W porównaniu z inspekcjami ręcznymi, System Computer Vision umożliwia przeprowadzanie zewnętrznych kontroli jakości oraz uzyskanie wysokiego stopnia elastyczności i powtarzalności przy stosunkowo niskich kosztach i wysokiej precyzji. Systemy oparte na wizji maszynowej i komputerowej służą do szybkiego badania uszkodzeń cytryny słodkiej lub nieniszczącej oceny jakości ziemniaków.
Zarządzanie nawadnianiem
zarządzanie glebą oparte na wykorzystaniu technologii w celu zwiększenia wydajności gleby poprzez uprawę, nawożenie lub nawadnianie ma znaczący wpływ na nowoczesną produkcję rolną. Uzyskując przydatne informacje na temat wzrostu upraw ogrodniczych za pomocą obrazów, bilans wodny gleby można dokładnie oszacować, aby uzyskać dokładne planowanie nawadniania. Aplikacje komputerowe wizyjne dostarczają cennych informacji na temat zarządzania bilansem wodnym nawadniania. System wizyjny może przetwarzać wielospektralne obrazy wykonane przez bezzałogowe statki powietrzne (UAV) i uzyskać wskaźnik wegetacji (VI), aby zapewnić wsparcie decyzyjne w zarządzaniu nawadnianiem.
monitorowanie gruntów rolnych za pomocą UAV
informacje na temat gruntów rolnych w czasie rzeczywistym i dokładne ich zrozumienie odgrywają podstawową rolę w rolnictwie precyzyjnym. W ostatnich latach UAV, jako szybko rozwijająca się technologia, umożliwiła pozyskiwanie informacji rolniczych o wysokiej rozdzielczości, niskich kosztach i szybkich rozwiązaniach. Platformy UAV wyposażone w czujniki obrazu dostarczają szczegółowych informacji na temat Ekonomiki Rolnictwa i warunków uprawy (na przykład ciągłe monitorowanie upraw). Teledetekcja UAV przyczyniła się do wzrostu produkcji rolnej wraz ze spadkiem kosztów rolnictwa.
ocena plonów
dzięki zastosowaniu technologii wizyjnej zrealizowano funkcje gospodarowania glebą, wykrywania dojrzałości i szacowania plonów w gospodarstwach rolnych. Co więcej, istniejąca technologia może być dobrze stosowana do metod takich jak analiza spektralna i głębokie uczenie. Większość z tych metod ma zalety wysokiej precyzji, niskich kosztów, dobrej przenośności, dobrej integracji i skalowalności i może zapewnić niezawodne wsparcie w podejmowaniu decyzji zarządczych. Przykładem jest oszacowanie plonów owoców cytrusowych poprzez wykrywanie i liczenie owoców za pomocą wizji komputerowej. Również wydajność z pól trzciny cukrowej można przewidzieć, przetwarzając obrazy uzyskane za pomocą UAV.
monitorowanie zwierząt
zwierzęta mogą być monitorowane przy użyciu nowych technik, które zostały wyszkolone do wykrywania rodzaju zwierzęcia i jego działań. Istnieje wiele zastosowań do monitorowania zwierząt w rolnictwie, gdzie zwierzęta mogą być zdalnie monitorowane w celu wykrycia choroby, zmian w zachowaniu lub porodu. Ponadto naukowcy zajmujący się rolnictwem i dziką przyrodą mogą bezpiecznie obserwować dzikie zwierzęta z dużej odległości.
Automatyzacja gospodarstwa
technologie takie jak roboty do zbioru, siewu i pielenia, autonomiczne ciągniki i drony do monitorowania warunków w gospodarstwie i stosowania nawozów mogą zmaksymalizować wydajność przy niedoborach siły roboczej. Rolnictwo może być również bardziej opłacalne, gdy zminimalizowany zostanie ślad ekologiczny rolnictwa.
widzenie komputerowe w transporcie
klasyfikacja pojazdów
widzenie komputerowe aplikacje do automatycznej klasyfikacji pojazdów mają długą historię. Technologie automatycznej klasyfikacji pojazdów ewoluowały przez dziesięciolecia. Dzięki szybko rosnącym, przystępnym cenowo czujnikom, takim jak kamery telewizji przemysłowej (CCTV), LiDAR (Light detection and ranging), a nawet urządzenia do obrazowania termicznego, pojazdy mogą być wykrywane, śledzone i klasyfikowane na wielu pasach jednocześnie. Dokładność klasyfikacji pojazdów można poprawić, łącząc wiele czujników, takich jak obrazowanie termowizyjne, obrazowanie LiDAR i Kamery RGB. Istnieje wiele specjalizacji, na przykład oparte na głębokim uczeniu komputerowe rozwiązanie wizyjne do wykrywania pojazdów budowlanych zostało wykorzystane do celów takich jak monitorowanie bezpieczeństwa, ocena wydajności i podejmowanie decyzji menedżerskich.
wykrywanie naruszeń ruchu
organy ścigania i Gminy zwiększają wdrażanie systemów monitorowania dróg opartych na kamerach w celu zmniejszenia niebezpiecznego zachowania podczas jazdy. Coraz częściej stosuje się komputerowe techniki wizyjne do automatyzacji wykrywania naruszeń, takich jak przekroczenie prędkości, przejechanie na czerwonych światłach lub znaki stopu, jazda w niewłaściwą stronę i wykonywanie nielegalnych zakrętów.
Analiza przepływu ruchu
analiza przepływu ruchu została szeroko zbadana dla inteligentnych systemów transportowych (ITS) przy użyciu obu metod inwazyjnych (tagi, cewki pod chodnikiem itp.) i nieinwazyjnych metod takich jak aparaty fotograficzne. Wraz z rozwojem wizji komputerowej i sztucznej inteligencji, analityka wideo może być teraz stosowana do wszechobecnych kamer drogowych, które mogą generować ogromny wpływ w swoim i inteligentnym mieście. Przepływ ruchu może być obserwowany za pomocą komputerowych środków wizyjnych i mierzyć niektóre zmienne wymagane przez inżynierów ruchu.
wykrywanie zajętości parkingu
wizualny monitoring miejsca parkingowego służy do wykrywania zajętości parkingu. Aplikacje wizyjne zasilają zdecentralizowane i wydajne rozwiązania do wizualnego wykrywania zajętości parkingu w oparciu o głęboką sieć neuronową (CNN). Istnieje wiele zestawów danych do wykrywania parkingu, takich jak PKLot i CNRPark-EXT. Ponadto wdrożono systemy zarządzania parkingiem oparte na wideo z wykorzystaniem obrazowania stereoskopowego (3D) lub kamer termowizyjnych.
Automatyczne rozpoznawanie tablic rejestracyjnych
wiele nowoczesnych systemów transportu i bezpieczeństwa publicznego zależy od umiejętności rozpoznawania i wydobywania informacji o tablicach rejestracyjnych z nieruchomych zdjęć lub filmów. Zautomatyzowane rozpoznawanie tablic rejestracyjnych (ALPR) pod wieloma względami zmieniło sektor bezpieczeństwa publicznego i transportu, pomagając w tworzeniu nowoczesnych rozwiązań w zakresie płatnych dróg, zapewniając ogromne oszczędności kosztów operacyjnych dzięki automatyzacji, a nawet umożliwiając zupełnie nowe możliwości na rynku (np. jednostki odczytu tablic rejestracyjnych montowane na policyjnym krążowniku). OpenALPR jest popularną biblioteką automatycznego rozpoznawania tablic rejestracyjnych, opartą na rozpoznawaniu znaków na obrazach lub kanałach wideo tablic rejestracyjnych pojazdów.
ponowna identyfikacja pojazdów
dzięki udoskonaleniom w zakresie ponownej identyfikacji osób, Inteligentne Systemy Transportu i nadzoru mają na celu powielenie tego podejścia w przypadku pojazdów wykorzystujących ponowną identyfikację pojazdów opartą na wizji. Konwencjonalne metody dostarczania unikalnego identyfikatora pojazdu są zwykle inwazyjne (tag w pojeździe, telefon komórkowy lub GPS). Automatyczne rozpoznawanie tablic rejestracyjnych (ALPR) jest prawdopodobnie najlepszą technologią umożliwiającą precyzyjną identyfikację poszczególnych pojazdów w sterowanych Ustawieniach, np. w punkcie poboru opłat drogowych. Jednak tablice rejestracyjne mogą ulec zmianie i fałszerstwu, a ALPR nie może odzwierciedlać istotnych specjalności pojazdów, takich jak znaki lub wgniecenia. Nieinwazyjne metody, takie jak rozpoznawanie oparte na obrazie, mają duży potencjał i popyt, ale nadal nie są Dojrzałe do praktycznego zastosowania. Większość istniejących technik ponownej identyfikacji pojazdów opartych na wizji opiera się na wyglądzie pojazdu, takim jak kolor, tekstura i kształt. Na dzień dzisiejszy uznanie subtelnych cech charakterystycznych, takich jak marka pojazdu lub model roku, jest nadal nierozwiązanym wyzwaniem.
wykrywanie pieszych
wykrywanie pieszych ma kluczowe znaczenie dla inteligentnych systemów transportowych, od autonomicznej jazdy po Nadzór infrastruktury, zarządzanie ruchem, Bezpieczeństwo i wydajność tranzytu oraz egzekwowanie prawa. Wykrywanie pieszych obejmuje wiele rodzajów czujników, takich jak tradycyjne kamery CCTV lub IP, urządzenia do obrazowania termowizyjnego, urządzenia do obrazowania w bliskiej podczerwieni i wbudowane kamery RGB. Algorytmy wykrywania pieszych mogą być oparte na sygnaturze podczerwieni, cechach kształtu, cechach gradientu, uczeniu maszynowym lub funkcjach ruchu. Wykrywanie pieszych polegające na głębokich splotach sieci neuronowych poczyniło znaczne postępy, nawet przy wykrywaniu silnie zatkanych pieszych.
wykrywanie znaków drogowych
aplikacje komputerowe wizyjne są używane do wykrywania i rozpoznawania znaków drogowych. Techniki wizyjne są stosowane do segmentacji znaków drogowych z różnych scen drogowych (z wykorzystaniem segmentacji obrazu) i wykorzystują algorytmy głębokiego uczenia do rozpoznawania i klasyfikacji znaków drogowych.
Systemy unikania kolizji
Detekcja pojazdu i detekcja pasa ruchu stanowią integralną część najbardziej zaawansowanych systemów wspomagania kierowcy (ADAS). Głębokie sieci neuronowe zostały niedawno wykorzystane do zbadania uczenia głębokiego i wykorzystania go do autonomicznych systemów unikania kolizji.
monitorowanie stanu dróg
aplikacje do komputerowego wykrywania wad wzroku i oceny stanu zostały opracowane w celu monitorowania betonowej i asfaltowej infrastruktury cywilnej. Ocena stanu nawierzchni dostarcza informacji umożliwiających podejmowanie bardziej opłacalnych i spójnych decyzji dotyczących zarządzania siecią chodnikową. Ogólnie rzecz biorąc, inspekcje nawierzchni są przeprowadzane przy użyciu zaawansowanych pojazdów zbierających dane i/lub badań naziemnych. Opracowano podejście do głębokiego uczenia maszynowego w celu opracowania wskaźnika stanu nawierzchni asfaltowej, aby zapewnić niezależny od człowieka, niedrogi, wydajny i bezpieczny sposób automatycznego wykrywania zagrożenia nawierzchnią za pomocą wizji komputerowej. Inną aplikacją jest aplikacja wizyjna do wykrywania wybojów drogowych w celu przydzielenia konserwacji dróg i zmniejszenia liczby powiązanych wypadków samochodowych.
ocena stanu infrastruktury
aby zapewnić bezpieczeństwo i łatwość użytkowania infrastruktury cywilnej, niezbędna jest kontrola wzrokowa i ocena jej stanu fizycznego i funkcjonalnego. Systemy do komputerowej kontroli i monitorowania infrastruktury cywilnej oparte na wizji są wykorzystywane do automatycznego przekształcania danych obrazu i wideo w informacje, które można wykorzystać w praktyce. Aplikacje do komputerowej kontroli wizyjnej służą do identyfikacji elementów konstrukcyjnych, scharakteryzowania lokalnych i globalnych widocznych uszkodzeń oraz wykrywania zmian na podstawie obrazu referencyjnego. Takie zastosowania monitorowania obejmują statyczny pomiar odkształceń i przemieszczeń oraz dynamiczny pomiar przemieszczeń do analizy modalnej.
wykrywanie uwagi kierowcy
rozproszona Jazda – taka jak marzenia na jawie, korzystanie z telefonu komórkowego i patrzenie na coś poza samochodem – stanowi dużą część śmiertelnych wypadków drogowych na całym świecie. Sztuczna inteligencja służy do zrozumienia zachowań kierowców, znajdowania rozwiązań łagodzących zdarzenia drogowe. Technologie nadzoru drogowego są wykorzystywane do obserwacji naruszeń przedziału pasażerskiego, na przykład w detekcji pasów bezpieczeństwa opartej na głębokim uczeniu w nadzorze drogowym. Technologie monitorowania kierowców w pojazdach koncentrują się na wykrywaniu wizualnym, analizie i sprzężeniu zwrotnym. Zachowanie kierowcy można wywnioskować zarówno bezpośrednio z wewnętrznych kamer skierowanych do kierowcy, jak i pośrednio z zewnętrznych kamer lub czujników skierowanych do sceny. Techniki oparte na analizie wideo skierowanej do kierowcy wykrywają twarz i oczy za pomocą algorytmów do określania kierunku spojrzenia, szacowania pozycji głowy i monitorowania mimiki twarzy. Algorytmy uczenia głębokiego i maszynowego, które otrzymały tysiące danych o uważnych i nieuważnych twarzach, mogą wykryć różnice między oczami, które są skupione i nieostre, a także oznaki jazdy pod wpływem. Istnieje wiele aplikacji opartych na wizji do klasyfikacji postawy rozproszonego kierowcy w czasie rzeczywistym z wieloma metodami głębokiego uczenia (RNN i CNN) stosowanymi w wykrywaniu rozproszenia kierowcy.
wizja komputerowa w handlu detalicznym i produkcji
śledzenie klientów
strategicznie rozmieszczone urządzenia liczące w całym sklepie detalicznym mogą gromadzić dane za pomocą procesów uczenia maszynowego o tym, gdzie klienci spędzają czas i jak długo. Analiza Klientów może poprawić zrozumienie interakcji z konsumentami przez sklepy detaliczne i poprawić optymalizację układu sklepu.
liczenie ludzi
komputerowe algorytmy wizyjne są szkolone z przykładami danych do wykrywania ludzi i liczenia ich w miarę ich wykrywania. Taka technologia liczenia ludzi jest przydatna dla sklepów do zbierania danych o sukcesie ich sklepów i może być również stosowana w sytuacjach dotyczących COVID-19, w których ograniczona liczba osób jest dozwolona w sklepie na raz.
wykrywanie kradzieży
sprzedawcy detaliczni mogą wykryć podejrzane zachowania, takie jak włóczenie się lub uzyskiwanie dostępu do obszarów niedostępnych za pomocą algorytmów wizji komputerowej, które autonomicznie analizują scenę.
analiza czasu oczekiwania
aby zapobiec niecierpliwym klientom i niekończącym się kolejkom, sprzedawcy detaliczni wdrażają technologię wykrywania kolejek. Wykrywanie kolejek wykorzystuje kamery do śledzenia i liczenia liczby kupujących w linii. Po osiągnięciu progu klientów system wyświetla alert dla urzędników, aby otworzyć nowe kasy.
odległość społeczna
aby zapewnić bezpieczeństwo, firmy używają czujników odległości. Kamera śledzi ruchy pracowników lub klientów i wykorzystuje czujniki głębokości do oceny odległości między nimi. W zależności od ich pozycji, System rysuje czerwony lub zielony okrąg wokół osoby.
Analiza produktywności
Analiza produktywności śledzi wpływ zmian w miejscu pracy, sposób, w jaki pracownicy spędzają swój czas i zasoby oraz wdraża różne narzędzia. Takie dane mogą zapewnić cenny wgląd w zarządzanie czasem, współpracę w miejscu pracy i produktywność pracowników.
zarządzanie jakością
Systemy Zarządzania Jakością zapewniają, że organizacja osiąga wymagania klienta, realizując swoje polityki, procedury, instrukcje, wewnętrzne procesy, aby osiągnąć ogólny wskaźnik zadowolenia konsumentów.
szkolenie umiejętności
kolejnym obszarem zastosowań systemów wizyjnych jest optymalizacja pracy linii montażowej w produkcji przemysłowej. Ocena działania człowieka może pomóc w skonstruowaniu znormalizowanych modeli działania związanych z różnymi etapami działania, a także w ocenie wydajności wyszkolonych pracowników. Automatyczna ocena jakości działania pracowników może być korzystna poprzez poprawę wydajności pracy, promowanie wydajności produkcyjnej (optymalizacja LEAN) i, co ważniejsze, odkrywanie niebezpiecznych działań przed wystąpieniem szkody.
co dalej?
Technologia głębokiego i maszynowego uczenia została wykorzystana do tworzenia aplikacji komputerowych wizji na dziesiątki sposobów i dla wszystkich rodzajów przemysłu.
- poznaj 8 zastosowań widzenia komputerowego w kontroli koronawirusa
- dowiedz się wszystkiego o szacowaniu pozy ludzkiej za pomocą widzenia komputerowego.
- Zobacz nasz kompletny przegląd detekcji obiektów w 2021 roku.
- przeczytaj case study o aplikacji komputerowej do monitorowania zwierząt.