Jemný Úvod do Počítačové Vidění

Tweet share Podělte

Naposledy Aktualizován dne 5. července 2019

Počítačové Vidění, často zkráceně CV, je definována jako obor, který se snaží rozvíjet techniky, které pomáhají počítače „vidět“ a rozumět obsahu digitálních obrazů, jako jsou fotografie a videa.

problém počítačového vidění se jeví jako jednoduchý, protože je triviálně řešen lidmi, dokonce i velmi malými dětmi. Nicméně, je to do značné míry zůstává nevyřešený problém, jak na základě omezené chápání biologické vidění a kvůli složitosti vidění vnímání v dynamické a téměř nekonečně různé fyzickém světě.

v tomto příspěvku objevíte jemný úvod do oblasti počítačového vidění.

po přečtení tohoto příspěvku budete vědět:

cíl pole počítačového vidění a jeho odlišnost od zpracování obrazu.
co dělá problém počítačového vidění náročným.
typické problémy nebo úkoly sledované v počítačovém vidění.

nastartujte svůj projekt s mou novou knihou hluboké učení pro počítačové vidění, včetně podrobných tutoriálů a souborů zdrojového kódu Pythonu pro všechny příklady.

začněme.

Jemný Úvod do Počítačové Vidění
Photo by Axel Kristinsson, některá práva jsou vyhrazena.

přehled

Tento výukový program je rozdělen do čtyř částí; jsou:

Touha po Počítače
Co Je Počítačové Vidění
Úkolem Počítačového Vidění
Úkoly v Počítačové Vidění

Touha pro Počítače

Jsme se topí v obrazech.

smartphony mají fotoaparáty a pořizování fotografií nebo videa a jejich sdílení nebylo nikdy snazší, což vedlo k neuvěřitelnému růstu moderních sociálních sítí, jako je Instagram.

YouTube může být druhým největším vyhledávačem a každou minutu se nahrávají stovky hodin videa a každý den se sledují miliardy videí.

internet se skládá z textu a obrázků. Indexování a vyhledávání textu je relativně jednoduché, ale pro indexování a vyhledávání obrázků musí algoritmy vědět, co obrázky obsahují. Nejdéle zůstal obsah obrázků a videa neprůhledný, nejlépe popsaný pomocí meta popisů poskytnutých osobou, která je nahrála.

abychom získali maximum z obrazových dat, potřebujeme, aby počítače“ viděly “ obrázek a porozuměly obsahu.

to je triviální problém pro člověka, dokonce i pro malé děti.

osoba může popsat obsah fotografie, kterou jednou viděla.
člověk může shrnout video, které viděl pouze jednou.
člověk může rozpoznat obličej, který předtím viděl pouze jednou.

potřebujeme alespoň stejné funkce z počítačů, abychom mohli odemknout naše obrázky a videa.

chcete výsledky s hlubokým učením pro počítačové vidění?

Vezměte si zdarma 7denní e-mailový rychlokurz (se vzorovým kódem).

kliknutím se zaregistrujete a také získáte zdarma PDF Ebook verzi kurzu.

Stáhněte si zdarma Mini-kurz

co je počítačové vidění?

počítačové vidění je obor zaměřený na problém pomoci počítačům vidět.

na abstraktní úrovni je cílem problémů s počítačovým viděním použít pozorovaná obrazová data k odvození něčeho o světě.

— – Strana 83, Computer Vision: Models, Learning, and Inference, 2012.

je To multidisciplinární obor, který může obecně být nazýván podpole umělé inteligence a strojového učení, které mohou zahrnovat použití speciálních metod a využít obecné algoritmy učení.

Přehled Vztah Umělé Inteligence a Počítačového Vidění.

Jako multidisciplinární oblast, obor, to může vypadat chaotický, s techniky, které si půjčil a znovu použít z řady různorodých inženýrství a počítačové vědy pole.

jeden konkrétní problém ve vidění lze snadno řešit ručně vytvořenou statistickou metodou, zatímco jiný může vyžadovat velký a složitý soubor zobecněných algoritmů strojového učení.

počítačové vidění jako pole je intelektuální hranicí. Jako každá hranice, je to vzrušující a neuspořádané, a často neexistuje spolehlivá autorita, na kterou by se dalo odvolat. Mnoho užitečných nápadů nemá teoretické základy a některé teorie jsou v praxi zbytečné, rozvinuté oblasti jsou široce rozptýleny a často vypadají úplně nepřístupné od druhého.

— – Page xvii, Computer Vision: A Modern Approach, 2002.

cílem počítačového vidění je porozumět obsahu digitálních obrazů. Obvykle to zahrnuje vývoj metod, které se pokoušejí reprodukovat schopnost lidského vidění.

Pochopení obsahu digitálních obrazů může zahrnovat získávání popis od obrazu, který může být objekt, textový popis, trojrozměrný model, a tak dále.

počítačové vidění je automatizovaná extrakce informací z obrazů. Informace mohou znamenat cokoli od 3D modelů, polohy kamery, detekce a rozpoznávání objektů až po seskupování a vyhledávání obsahu obrazu.

— – stránka ix, programování počítačového vidění s Pythonem, 2012.

počítačové vidění a zpracování obrazu

počítačové vidění se liší od zpracování obrazu.

zpracování obrazu je proces vytváření nového obrazu z existujícího obrazu, obvykle nějakým způsobem zjednodušuje nebo vylepšuje obsah. Jedná se o typ digitálního zpracování signálu a nezajímá se o pochopení obsahu obrazu.

daný systém počítačového vidění může vyžadovat použití zpracování obrazu na surový vstup, např. předzpracování obrazu.

příklady zpracování obrazu zahrnují:

normalizace fotometrických vlastností obrazu, jako je jas nebo barva.
oříznutí hranic obrazu, například Centrování objektu na fotografii.
odstranění digitálního šumu z obrazu, jako jsou digitální artefakty z nízké úrovně osvětlení.

výzva počítačového vidění

pomáhat počítačům vidět se ukazuje jako velmi těžké.

cílem počítačového vidění je extrahovat užitečné informace z obrázků. To se ukázalo jako překvapivě náročný úkol; za poslední čtyři desetiletí obsadila tisíce inteligentních a kreativních myslí, a navzdory tomu jsme stále daleko od toho, abychom dokázali postavit univerzální „stroj na vidění“.“

— Strana 16, Computer Vision: Models, Learning, and Inference, 2012.

počítačové vidění se zdá snadné, možná proto, že je pro člověka tak snadné.

Zpočátku, to bylo věřil být triviálně jednoduchý problém, který by mohl být řešen studentský připojení fotoaparátu k počítači. Po desetiletích výzkumu zůstává „počítačové vidění“ nevyřešeno, alespoň pokud jde o splnění schopností lidského vidění.

vytvoření počítače bylo něco, o čem si přední odborníci v oblasti umělé inteligence mysleli, že je na úrovni obtížnosti letního studentského projektu již v šedesátých letech. O čtyřicet let později je úkol stále nevyřešen a zdá se být impozantní.

— – Page xi, Multiple View Geometry in Computer Vision, 2004.

jedním z důvodů je, že nemáme silné pochopení toho, jak funguje lidské vidění.

studium biologického vidění vyžaduje pochopení orgánů vnímání, jako jsou oči, stejně jako interpretace vnímání v mozku. Bylo dosaženo velkého pokroku, a to jak v mapování procesu, tak v objevování triků a zkratek používaných systémem, i když jako každá studie, která zahrnuje mozek, je ještě dlouhá cesta.

Percepční psychologové strávili desítky let snaží pochopit, jak vizuální systém funguje, a i když mohou vymyslet optické iluze šprýmaři odděleně, některé z jeho zásad, kompletní řešení tohoto puzzle zůstává nepolapitelný

— Stránka 3, Počítačového Vidění: Algoritmy a Aplikace, 2010.

dalším důvodem, proč se jedná o tak náročný problém, je složitost vlastní vizuálnímu světu.

daný objekt může být viděn z jakékoli orientace, za jakýchkoli světelných podmínek, s jakýmkoli typem okluze z jiných objektů atd. Skutečný systém vidění musí být schopen „vidět“ v kterékoli z nekonečného počtu scén a stále extrahovat něco smysluplného.

počítače fungují dobře pro úzce omezené problémy, ne otevřené neomezené problémy, jako je vizuální vnímání.

úkoly v počítačovém vidění

přesto došlo v této oblasti k pokroku, zejména v posledních letech s komoditními systémy pro optické rozpoznávání znaků a detekci obličeje v kamerách a chytrých telefonech.

počítačové vidění je v mimořádném bodě svého vývoje. Samotný předmět existuje již od šedesátých let, ale teprve nedávno bylo možné vytvořit užitečné počítačové systémy pomocí nápadů z počítačového vidění.

— – Page xviii, Computer Vision: A Modern Approach, 2002.

V roce 2010 učebnice počítačové vidění s názvem „Počítačové Vidění: Algoritmy a Aplikace“ poskytuje seznam některých high-level problémů, kde jsme zaznamenali úspěch s počítačovým viděním.

Optické rozpoznávání znaků (OCR)
Pratelné kontrola
Maloobchodní (např. automatických pokladen)
3D model objektu (fotogrammetrie)
zobrazovací
Automobilový průmysl bezpečnost
Zápas přesunout (např. (mocap)
sledování
rozpoznávání otisků prstů a biometrie

Jedná se o širokou oblast studia s mnoha specializovanými úkoly a technikami, jakož i specializacemi na cílové aplikační domény.

počítačové vidění má širokou škálu aplikací, jak starých (např. navigace mobilních robotů, průmyslová inspekce a vojenské zpravodajství), tak nových (např., interakce člověka s počítačem, vyhledávání obrazu v digitálních knihovnách, lékařská analýza obrazu a realistické Vykreslování syntetických scén v počítačové grafice).

— – Page xvii, Computer Vision: A Modern Approach, 2002.

může být užitečné přiblížit některé z jednodušších úkolů počítačového vidění, s nimiž se pravděpodobně setkáte nebo máte zájem o řešení vzhledem k obrovskému počtu veřejně dostupných digitálních fotografií a videí.

mnoho populárních aplikací počítačového vidění zahrnuje pokus o rozpoznání věcí na fotografiích; například:

Klasifikace objektů: jaká široká kategorie objektů je na této fotografii?
identifikace objektu: jaký typ daného objektu je na této fotografii?
ověření objektu: je objekt na fotografii?
detekce objektů: kde jsou objekty na fotografii?
detekce orientačního bodu objektu: jaké jsou klíčové body objektu na fotografii?
segmentace objektů: jaké pixely patří k objektu v obraze?
rozpoznávání objektů: jaké objekty jsou na této fotografii a kde jsou?

další běžné příklady se týkají vyhledávání informací; například: Hledání obrázků, jako je obrázek nebo obrázky, které obsahují objekt.

další čtení

tato část poskytuje více zdrojů k tématu, pokud chcete jít hlouběji.

knihy

počítačové vidění: modely, učení a Inference, 2012.
programování počítačového vidění s Pythonem, 2012.
Multiple View Geometry in Computer Vision, 2004.
počítačové vidění: algoritmy a aplikace, 2010.
počítačové vidění: moderní přístup, 2002.

články

počítačové vidění, Wikipedia.
strojové vidění, Wikipedia.
digitální zpracování obrazu, Wikipedia.

shrnutí

v tomto příspěvku jste objevili jemný úvod do oblasti počítačového vidění.

konkrétně jste se dozvěděli:

cíl pole počítačového vidění a jeho odlišnost od zpracování obrazu.
co dělá problém počítačového vidění náročným.
typické problémy nebo úkoly sledované v počítačovém vidění.

máte nějaké dotazy?
zeptejte se v komentářích níže a já se budu snažit odpovědět.

rozvíjejte modely hlubokého učení pro vizi ještě dnes!

Hluboké Učení pro Počítačové Vidění

Rozvíjet Své Vlastní Vidění Modely v Minutách

…s jen pár řádků v pythonu kód,

Zjistit, jak můj nový Ebook:
Hluboké Učení pro Počítačové Vidění

To poskytuje self-studovat návody na témata, jako jsou:
klasifikace, detekce objektů (yolo a rcnn), face recognition (vggface a facenet), příprava dat a mnohem více…

konečně přinést hluboké učení do svých projektů vize

přeskočit akademiky. Jen Výsledky.

podívejte se, co je uvnitř

Tweet Sdílet Sdílet

Maybaygiare.org