Maybaygiare.org

Blog Network

Een zachte introductie tot Computer Vision

Tweet Share Share

laatst bijgewerkt op 5 juli 2019

Computer Vision, vaak afgekort als CV, wordt gedefinieerd als een studiegebied dat probeert technieken te ontwikkelen om computers te helpen de inhoud van digitale afbeeldingen zoals foto ’s en video’ s te “zien” en te begrijpen.

het probleem van computerzicht lijkt eenvoudig omdat het triviaal wordt opgelost door mensen, zelfs zeer jonge kinderen. Niettemin blijft het grotendeels een onopgelost probleem, dat zowel gebaseerd is op het beperkte begrip van het biologische gezichtsvermogen als op de complexiteit van de visuele waarneming in een dynamische en bijna oneindig variërende fysieke wereld.

in dit bericht ontdekt u een zachte introductie tot het gebied van computervisie.

na het lezen van dit bericht, zult u weten:

  • het doel van het gezichtsveld van de computer en zijn onderscheidbaarheid met beeldverwerking.
  • Wat maakt het probleem van computervisie uitdagend.
  • typische problemen of taken uitgevoerd in computer vision.

start uw project met mijn nieuwe boek Deep Learning for Computer Vision, inclusief stap-voor-stap tutorials en de Python broncode bestanden voor alle voorbeelden.

laten we beginnen.

een zachte introductie tot Computer Vision

Een Zachte introductie tot Computer Vision
Foto door Axel Kristinsson, enkele rechten voorbehouden.

overzicht

Deze tutorial is verdeeld in vier delen; ze zijn:

  1. verlangen voor Computers om
  2. Wat is Computer Vision
  3. uitdaging van Computer Vision
  4. taken in Computer Vision

verlangen voor Computers om

te zien we zijn overspoeld in afbeeldingen.

Smartphones hebben camera ‘ s en het maken van een foto of video en het delen ervan is nog nooit zo eenvoudig geweest, wat resulteerde in de ongelooflijke groei van moderne sociale netwerken zoals Instagram.

YouTube is misschien de op een na grootste zoekmachine en elke minuut worden honderden uren video ’s geüpload en elke dag worden miljarden video’ s bekeken.

het internet bestaat uit tekst en afbeeldingen. Het is relatief eenvoudig om tekst te indexeren en te zoeken, maar om afbeeldingen te indexeren en te zoeken, moeten algoritmen weten wat de afbeeldingen bevatten. Voor de langste tijd, de inhoud van afbeeldingen en video is ondoorzichtig gebleven, best beschreven met behulp van de meta-Beschrijvingen die door de persoon die ze geüpload.

om het meeste uit beeldgegevens te halen, hebben we computers nodig om een afbeelding te “zien” en de inhoud te begrijpen.

Dit is een triviaal probleem voor een mens, zelfs jonge kinderen.

  • een persoon kan de inhoud van een foto beschrijven die hij één keer heeft gezien.
  • een persoon kan een video samenvatten die hij slechts één keer heeft gezien.
  • een persoon kan een gezicht herkennen dat hij slechts één keer eerder heeft gezien.

we hebben minstens dezelfde mogelijkheden van computers nodig om onze afbeeldingen en video ‘ s te ontgrendelen.

wilt u resultaten met Deep Learning voor Computer Vision?

neem nu mijn gratis 7-daagse e-mail spoedcursus (met voorbeeldcode).

Klik om u aan te melden en ontvang ook een gratis PDF Ebook versie van de cursus.

download uw gratis minicursus

Wat Is Computer Vision?

Computer vision is een studiegebied dat zich richt op het probleem van het helpen van computers om te zien.

op een abstract niveau is het doel van computerzichtproblemen om de waargenomen beeldgegevens te gebruiken om iets over de wereld af te leiden.

– Page 83, Computer Vision: Models, Learning, and Inference, 2012.

het is een multidisciplinair gebied dat in grote lijnen een subveld van kunstmatige intelligentie en machine learning zou kunnen worden genoemd, waarbij gebruik kan worden gemaakt van gespecialiseerde methoden en gebruik kan worden gemaakt van algemene leeralgoritmen.

Overview of the Relationship of Artificial Intelligence and Computer Vision

Overview of the Relationship of Artificial Intelligence and Computer Vision

als multidisciplinair studiegebied kan het er rommelig uitzien, met technieken die geleend en hergebruikt zijn uit een reeks uiteenlopende technische en computerwetenschappelijke gebieden.

een bepaald probleem in het gezichtsvermogen kan gemakkelijk worden aangepakt met een handgemaakte statistische methode, terwijl een ander een groot en complex geheel van gegeneraliseerde machine learning-algoritmen kan vereisen.

Computer vision as a field is a intellectual frontier. Net als elke grens is het spannend en ongeorganiseerd, en er is vaak geen betrouwbare autoriteit om een beroep op te doen. Veel nuttige ideeën hebben geen theoretische aarding, en sommige theorieën zijn nutteloos in de praktijk; ontwikkelde gebieden zijn wijd verspreid, en vaak lijkt de een volledig ontoegankelijk van de andere.

— Page xvii, Computer Vision: a Modern Approach, 2002.

Het doel van computer vision is om de inhoud van digitale beelden te begrijpen. Typisch, dit impliceert het ontwikkelen van methoden die proberen om het vermogen van menselijke visie te reproduceren.

het begrijpen van de inhoud van digitale afbeeldingen kan inhouden dat een beschrijving uit de afbeelding wordt gehaald, wat een object, een tekstbeschrijving, een driedimensionaal model, enzovoort kan zijn.

Computer vision is de geautomatiseerde extractie van informatie uit afbeeldingen. Informatie kan van alles betekenen, van 3D-modellen, camerapositie, objectdetectie en herkenning tot het groeperen en zoeken naar beeldinhoud.

– Page ix, Programming Computer Vision with Python, 2012.

Computer Vision en beeldverwerking

Computer vision onderscheidt zich van beeldverwerking.

beeldverwerking is het proces van het maken van een nieuwe afbeelding van een bestaande afbeelding, meestal vereenvoudigen of verbeteren van de inhoud op een bepaalde manier. Het is een soort digitale signaalverwerking en houdt zich niet bezig met het begrijpen van de inhoud van een beeld.

een bepaald computervisiesysteem kan vereisen dat beeldverwerking wordt toegepast op ruwe invoer, bijvoorbeeld voorbewerking van beelden.

voorbeelden van beeldverwerking zijn:

  • het normaliseren van fotometrische eigenschappen van de afbeelding, zoals helderheid of kleur.
  • de grenzen van de afbeelding bijsnijden, zoals een object centreren in een foto.
  • het verwijderen van digitale ruis uit een afbeelding, zoals digitale artefacten van lage lichtniveaus.

uitdaging van Computer Vision

het helpen van computers om te zien blijkt erg moeilijk.

Het doel van computer vision is het extraheren van nuttige informatie uit afbeeldingen. Dit is een verrassend uitdagende taak gebleken; het heeft duizenden intelligente en creatieve geesten bezet in de afgelopen vier decennia, en ondanks dit zijn we nog lang niet in staat om een algemene “seeing machine te bouwen.”

— Page 16, Computer Vision: Models, Learning, and Inference, 2012.

Computervision lijkt gemakkelijk, misschien omdat het zo moeiteloos is voor mensen.

aanvankelijk werd aangenomen dat het een triviaal eenvoudig probleem was dat kon worden opgelost door een student die een camera met een computer verbond. Na decennia van onderzoek, “computer vision” blijft onopgelost, in ieder geval in termen van het voldoen aan de mogelijkheden van de menselijke visie.

een computer laten zien was iets dat toonaangevende experts op het gebied van kunstmatige intelligentie dachten te zijn op het niveau van de moeilijkheid van een zomer student project terug in de jaren zestig. Veertig jaar later is de taak nog steeds onopgelost en lijkt formidabel.

– Page xi, Multiple View Geometry in Computer Vision, 2004.

een reden is dat we geen goed begrip hebben van hoe menselijk zicht werkt.voor het bestuderen van het biologisch gezichtsvermogen is inzicht nodig in de waarnemingsorganen zoals de ogen en de interpretatie van de waarneming in de hersenen. Er is veel vooruitgang geboekt, zowel in het in kaart brengen van het proces als in termen van het ontdekken van de trucs en snelkoppelingen die door het systeem worden gebruikt, hoewel er, zoals elke studie die de hersenen betreft, nog een lange weg te gaan is.

perceptuele psychologen hebben tientallen jaren geprobeerd te begrijpen hoe het visuele systeem werkt en, hoewel ze optische illusies kunnen bedenken om enkele van zijn principes uit elkaar te halen, blijft een complete oplossing voor deze puzzel ongrijpbaar

— Page 3, Computer Vision: Algorithms and Applications, 2010.

een andere reden waarom het zo ‘ n uitdagend probleem is, is vanwege de complexiteit die inherent is aan de visuele wereld.

een gegeven object kan worden gezien vanuit elke oriëntatie, in elke lichtomstandigheden, met elk type occlusie van andere objecten, enzovoort. Een waarheidsgetrouw zichtsysteem moet in staat zijn om in een oneindig aantal scènes te “zien” en toch iets zinvols te extraheren.

Computers werken goed voor strak beperkte problemen, niet voor open onbegrensde problemen zoals visuele waarneming.

taken in Computer Vision

niettemin is er vooruitgang op dit gebied, met name in de afgelopen jaren met commodity systemen voor optische karakterherkenning en gezichtsherkenning in camera ‘ s en smartphones.

Computer vision bevindt zich op een buitengewoon punt in zijn ontwikkeling. Het onderwerp zelf bestaat al sinds de jaren zestig, maar pas sinds kort is het mogelijk om bruikbare computersystemen te bouwen met behulp van ideeën uit computervisie.

— Page xviii, Computer Vision: a Modern Approach, 2002.

het tekstboek over computer vision uit 2010, getiteld “Computer Vision: Algorithms and Applications”, geeft een lijst van enkele problemen op hoog niveau waar we succes hebben gezien met computer vision.

  • Optical character recognition (OCR)
  • machineinspectie
  • Retail (bijv. geautomatiseerde kassa’s)
  • 3D-Modelbouw (fotogrammetrie)
  • medische beeldvorming
  • veiligheid van motorvoertuigen
  • Match move (bijv. samenvoegen van CGI met live acteurs in films)
  • Motion capture (mocap)
  • Surveillance
  • vingerafdrukherkenning en Biometrie

het is een breed studiegebied met veel gespecialiseerde taken en technieken, evenals specialisaties om toepassingsdomeinen aan te pakken.

Computer vision heeft een breed scala aan toepassingen, zowel oude (bijv. mobiele robotnavigatie, industriële inspectie en militaire inlichtingen) als nieuwe (bijv., menselijke computerinteractie, beeldherstel in digitale bibliotheken, medische beeldanalyse en de realistische weergave van synthetische scènes in computergrafieken).

— Page xvii, Computer Vision: a Modern Approach, 2002.

Het kan nuttig zijn om in te zoomen op enkele van de eenvoudiger computervisietaken die u waarschijnlijk zult tegenkomen of waarvoor u geïnteresseerd bent, gezien het grote aantal beschikbare digitale foto ’s en video’ s.

veel populaire computervisietoepassingen omvatten het proberen om dingen in foto ‘ s te herkennen; bijvoorbeeld:

  • Objectclassificatie: welke brede categorie van object is op deze foto?
  • Objectidentificatie: welk type object staat op deze foto?
  • Objectverificatie: staat het object op de foto?
  • objectdetectie: waar zijn de objecten op de foto?
  • object Landmark detectie: wat zijn de belangrijkste punten voor het object op de foto?
  • Objectsegmentatie: welke pixels behoren tot het object in de afbeelding?
  • objectherkenning: welke objecten bevinden zich op deze foto en waar zijn ze?

andere veelvoorkomende voorbeelden zijn gerelateerd aan het ophalen van informatie; bijvoorbeeld: het vinden van afbeeldingen zoals een afbeelding of afbeeldingen die een object bevatten.

verder lezen

Deze sectie biedt meer bronnen over het onderwerp als u dieper wilt gaan.

Books

  • Computer Vision: Models, Learning, and Inference, 2012.
  • Programming Computer Vision with Python, 2012.
  • Multiple View Geometry in Computer Vision, 2004.
  • Computer Vision: Algorithms and Applications, 2010.
  • Computer Vision: a Modern Approach, 2002.

Articles

  • Computer vision, Wikipedia.
  • Machine vision, Wikipedia.
  • digitale beeldverwerking, Wikipedia.

samenvatting

in dit bericht ontdekte u een zachte introductie tot het veld van computervisie.

specifiek leerde u:

  • het doel van het gezichtsveld van de computer en het onderscheid dat het maakt met beeldverwerking.
  • Wat maakt het probleem van computervisie uitdagend.
  • typische problemen of taken uitgevoerd in computer vision.

heeft u vragen?
Stel uw vragen in de opmerkingen hieronder en Ik zal mijn best doen om te beantwoorden.

ontwikkel Deep Learning modellen voor visie vandaag!

Deep Learning for Computer Vision

Ontwikkel uw eigen Visiemodellen in minuten

…met slechts een paar regels python code

ontdek hoe in mijn nieuwe Ebook:
Deep Learning for Computer Vision

Het zelfstudie tutorials biedt over onderwerpen als:
classificatie, object detectie (yolo en rcnn), gezichtsherkenning (vggface en facenet), data voorbereiding en nog veel meer…

breng eindelijk diep leren naar uw Visieprojecten

sla de academici over. Alleen Resultaten.

bekijk wat er in

Tweet Share Share

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.