Maybaygiare.org

Blog Network

En Mild Introduksjon til Datasyn

Tweet Share Share

Sist Oppdatert 5. juli 2019

Datasyn, ofte forkortet SOM CV, er definert som et fagområde som søker å utvikle teknikker for å hjelpe datamaskiner til å «se» og forstå innholdet i digitale bilder som fotografier og videoer.

problemet med datasyn ser enkelt ut fordi det er trivielt løst av mennesker, selv svært små barn. Likevel forblir det i stor grad et uløst problem basert både på den begrensede forståelsen av biologisk syn og på grunn av kompleksiteten av visjonsoppfattelsen i en dynamisk og nesten uendelig varierende fysisk verden.

i dette innlegget vil du oppdage en mild introduksjon til feltet av datasyn.

etter å ha lest dette innlegget, vil du vite:

  • målet med feltet datasyn og dets distinkthet fra bildebehandling.
  • Hva gjør problemet med datasyn utfordrende.
  • Typiske problemer eller oppgaver som forfølges i datasyn.Kick-start prosjektet med Min nye bok Deep Learning For Computer Vision, inkludert trinn-for-trinn tutorials og Python kildekodefiler for alle eksempler.

    La oss komme i gang.

    En Mild Introduksjon til Datasyn

    En Mild Introduksjon til Datasyn
    Foto Av Axel Kristinsson, noen rettigheter reservert.

    Oversikt

    denne opplæringen er delt inn i fire deler; de er:

    1. Ønske Om At Datamaskiner Skal Se
    2. Hva Er Datasyn
    3. Utfordring Av Datasyn
    4. Oppgaver I Datasyn

    Ønske Om At Datamaskiner Skal Se

    Vi er oversvømt i bilder.Smarttelefoner har kameraer, og å ta et bilde eller en video og dele det har aldri vært enklere, noe som resulterer i den utrolige veksten av moderne sosiale nettverk som Instagram.YouTube Kan være den nest største søkemotoren og hundrevis av timer med video lastes opp hvert minutt og milliarder av videoer blir sett hver dag.

    internett består av tekst og bilder. Det er relativt enkelt å indeksere og søke tekst, men for å indeksere og søke bilder, algoritmer trenger å vite hva bildene inneholder. I lengst tid har innholdet i bilder og video vært ugjennomsiktig, best beskrevet ved hjelp av meta-beskrivelsene gitt av personen som lastet dem opp.

    for å få mest mulig ut av bildedata trenger vi datamaskiner for å «se» et bilde og forstå innholdet.

    dette er et trivielt problem for et menneske, selv små barn.

    • en person kan beskrive innholdet i et fotografi de har sett en gang.
    • en person kan oppsummere en video som de bare har sett en gang.
    • en person kan gjenkjenne et ansikt som de bare har sett en gang før.

    Vi krever minst de samme funksjonene fra datamaskiner for å låse opp våre bilder og videoer.

    Vil Du Ha Resultater Med Dyp Læring for Datasyn?

    Ta min gratis 7-dagers e-lynkurs nå (med eksempelkode).

    Klikk for å registrere deg og få også en GRATIS Pdf Ebook-versjon av kurset.

    Last Ned Ditt Gratis Minikurs

    Hva Er Datasyn?

    computer vision er et fagområde fokusert på problemet med å hjelpe datamaskiner til å se.

    på et abstrakt nivå er målet med datasynproblemer å bruke de observerte bildedataene til å utlede noe om verden.

    — Side 83, Datasyn: Modeller, Læring og Slutning, 2012.Det er et tverrfaglig felt som i stor grad kan kalles et underfelt av kunstig intelligens og maskinlæring, som kan innebære bruk av spesialiserte metoder og bruk av generelle læringsalgoritmer.

    Oversikt Over Forholdet Mellom Kunstig Intelligens og Datasyn

    Oversikt Over Forholdet Mellom Kunstig Intelligens og Datasyn

    som et tverrfaglig studieområde kan det se rotete ut, med teknikker lånt og gjenbrukt fra en rekke ulike ingeniør-og datavitenskapsfelt.Et spesielt problem i synet kan lett løses med en håndlaget statistisk metode, mens en annen kan kreve et stort og komplekst ensemble av generaliserte maskinlæringsalgoritmer.

    datasyn som et felt er en intellektuell grense. Som enhver grense er det spennende og uorganisert, og det er ofte ingen pålitelig myndighet å appellere til. Mange nyttige ideer har ingen teoretisk jording, og noen teorier er ubrukelige i praksis; utviklede områder er vidt spredt, og ofte ser man helt utilgjengelig ut fra den andre.

    — p > – Side xvii, Datasyn: En Moderne Tilnærming, 2002.

    målet med datasyn er å forstå innholdet i digitale bilder. Vanligvis innebærer dette å utvikle metoder som forsøker å reprodusere evnen til menneskesyn.Å Forstå innholdet i digitale bilder kan innebære å trekke ut en beskrivelse fra bildet, som kan være et objekt, en tekstbeskrivelse, en tredimensjonal modell og så videre.

    datasyn er automatisert utvinning av informasjon fra bilder. Informasjon kan bety ALT FRA 3D-modeller, kameraposisjon, objektgjenkjenning og gjenkjenning til gruppering og søking av bildeinnhold.

    – side ix, Programmering Av Datasyn med Python, 2012.

    Datasyn og Bildebehandling

    datasyn er forskjellig fra bildebehandling.

    Bildebehandling er prosessen med å skape et nytt bilde fra et eksisterende bilde, vanligvis forenkle eller forbedre innholdet på noen måte. Det er en type digital signalbehandling og er ikke opptatt av å forstå innholdet i et bilde.

    et gitt datasynsystem kan kreve at bildebehandling brukes på raw-inngang, f. eks. forbehandling av bilder.Eksempler på bildebehandling er:

    • Normalisering av fotometriske egenskaper for bildet, for eksempel lysstyrke eller farge.
    • Beskjærer grensene for bildet, for eksempel sentrering av et objekt i et fotografi.
    • Fjerner digital støy fra et bilde, for eksempel digitale artefakter fra svake lysnivåer.

    Utfordring Av Datasyn

    Å Hjelpe datamaskiner til å se viser seg å være veldig vanskelig.

    målet med datasyn er å trekke ut nyttig informasjon fra bilder. Dette har vist seg en overraskende utfordrende oppgave; det har okkupert tusenvis av intelligente og kreative sinn i løpet av de siste fire tiårene, og til tross for dette er vi fortsatt langt fra å være i stand til å bygge en generell » seeing machine.»

    — Side 16, Datasyn: Modeller, Læring og Slutning, 2012.Datasyn virker lett, kanskje fordi det er så enkelt for mennesker.I Utgangspunktet ble det antatt å være et trivielt enkelt problem som kunne løses av en student som koblet et kamera til en datamaskin. Etter flere tiår med forskning forblir» datasyn » uløst, i hvert fall når det gjelder å møte evnen til menneskesyn.

    Å lage en datamaskin se var noe som ledende eksperter innen Kunstig Intelligens trodde å være på vanskelighetsgraden av en sommerstudents prosjekt tilbake på sekstitallet. Førti år senere er oppgaven fortsatt uløst og virker formidabel.

    — side xi, Multiple View Geometri I Datasyn, 2004. En grunn er at vi ikke har en sterk forståelse av hvordan menneskesyn fungerer.Å Studere biologisk syn krever en forståelse av oppfatningsorganene som øynene, samt tolkningen av oppfatningen i hjernen. Mye fremgang har blitt gjort, både i kartlegging prosessen og i form av å oppdage triks og snarveier som brukes av systemet, men som enhver studie som involverer hjernen, det er en lang vei å gå.

    Perseptuelle psykologer har brukt flere tiår på å prøve å forstå hvordan det visuelle systemet fungerer, og selv om de kan tenke ut optiske illusjoner for å erte hverandre noen av sine prinsipper, en komplett løsning på dette puslespillet er fortsatt unnvikende

    — Side 3, Computer Vision: Algorithms and Applications, 2010.En annen grunn til at det er et så utfordrende problem er på grunn av kompleksiteten som ligger i den visuelle verden.

    et gitt objekt kan ses fra hvilken som helst retning, i alle lysforhold, med noen form for okklusjon fra andre objekter, og så videre. Et sant visjonssystem må kunne » se » i et uendelig antall scener og fortsatt trekke ut noe meningsfylt.Datamaskiner fungerer godt for tett begrensede problemer, ikke åpne ubegrensede problemer som visuell oppfatning.

    Oppgaver I Datasyn

    likevel har det vært fremgang i feltet, spesielt de siste årene med råvaresystemer for optisk tegngjenkjenning og ansiktsgjenkjenning i kameraer og smarttelefoner.

    datasyn er på et ekstraordinært punkt i utviklingen. Faget selv har eksistert siden 1960-tallet, men bare nylig har det vært mulig å bygge nyttige datasystemer ved hjelp av ideer fra datasyn.

    — Side xviii, Datasyn: En Moderne Tilnærming, 2002.2010-læreboken om datasyn med tittelen «Computer Vision: Algorithms and Applications» gir en liste over noen problemer på høyt nivå der vi har sett suksess med datasyn.

    • OPTISK tegngjenkjenning (OCR)
    • Maskininspeksjon
    • Detaljhandel (f. eks. automatiserte kasser)
    • 3d-modellbygging (fotogrammetri)
    • Medisinsk bildebehandling
    • bilsikkerhet
    • Matchflytting (f. eks. motion capture (mocap)
    • Overvåking
    • Fingeravtrykk anerkjennelse og biometri

    Det er et bredt område av studien med mange spesialiserte oppgaver og teknikker, samt spesialiseringer å målrette søknad domener.

    datasyn har et bredt spekter av applikasjoner, både gamle (f. eks. mobil robotnavigasjon, industriell inspeksjon og militær etterretning) og nye (f. eks., menneskelig datamaskininteraksjon, bildeinnhenting i digitale biblioteker, medisinsk bildeanalyse og realistisk gjengivelse av syntetiske scener i datagrafikk).

    — p > – Side xvii, Datasyn: En Moderne Tilnærming, 2002. Det kan være nyttig å zoome inn på noen av de enklere datasynsoppgavene som du sannsynligvis vil støte på eller være interessert i å løse, gitt det store antallet offentlig tilgjengelige digitale fotografier og videoer som er tilgjengelige.

    Mange populære datasynsapplikasjoner innebærer å prøve å gjenkjenne ting i fotografier; for eksempel:

    • Objektklassifisering: hvilken bred objektkategori er i dette bildet?
    • Objektidentifikasjon: Hvilken type objekt finnes i dette bildet?
    • Object Verification: Er objektet på bildet?
    • Objektdeteksjon: Hvor er objektene i bildet?
    • Object Landmark Detection: hva er de viktigste punktene for objektet i fotografiet?
    • Objekt Segmentering: hvilke piksler tilhører objektet i bildet?
    • Objektgjenkjenning: hvilke objekter er i dette bildet og hvor er de?

    Andre vanlige eksempler er relatert til innhenting av informasjon; for eksempel: finne bilder som et bilde eller bilder som inneholder et objekt.

    Videre Lesing

    denne delen gir flere ressurser om emnet hvis du ønsker å gå dypere.

    Bøker

    • Datasyn: Modeller, Læring og Slutning, 2012.
    • Programmering Av Datasyn med Python, 2012.
    • Multiple View Geometri I Datasyn, 2004.
    • Datasyn: Algoritmer og Applikasjoner, 2010.
    • Computer Vision: En Moderne Tilnærming, 2002.

    Artikler

    • datasyn, Wikipedia.
    • Maskinvisjon, Wikipedia.
    • Digital bildebehandling, Wikipedia.

    Sammendrag

    i dette innlegget oppdaget du en mild introduksjon til datasynet.

    spesifikt lærte du:

    • målet med feltet datasyn og dets distinkthet fra bildebehandling.
    • Hva gjør problemet med datasyn utfordrende.
    • Typiske problemer eller oppgaver som forfølges i datasyn.

    har du noen spørsmål?
    Still dine spørsmål i kommentarfeltet nedenfor, og jeg vil gjøre mitt beste for å svare.

    Utvikle Dype Læringsmodeller For Visjon I Dag!

    Dyp Læring for Datasyn

    Utvikle Dine Egne Visjonsmodeller på Få Minutter

    …Med bare noen få linjer med python kode

    Oppdag hvordan i min Nye Ebok: Deep Learning For Computer Vision

    Det gir selvstudium tutorials på emner som: klassifisering, objekt deteksjon (yolo og rcnn), ansiktsgjenkjenning (vggface og facenet), data forberedelse og mye mer…

    Endelig Få Dyp Læring Til Dine Visjonsprosjekter

    Hopp Over Akademikerne. Bare Resultater.

    Se Hva Som Er Inni

    Tweet Share Share

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert.