maskininlärning är kul! Del 4: Modern ansiktsigenkänning med Deep Learning

ansiktsigenkänning — steg för steg

Låt oss ta itu med detta problem ett steg i taget. För varje steg lär vi oss om en annan maskininlärningsalgoritm. Jag kommer inte att förklara varje enskild algoritm helt för att hålla detta från att bli en bok, men du lär dig de viktigaste ideerna bakom var och en och du lär dig hur du kan bygga ditt eget ansiktsigenkänningssystem i Python med OpenFace och dlib.

Steg 1: Hitta alla ansikten

det första steget i vår pipeline är ansiktsigenkänning. Självklart måste vi hitta ansikten på ett fotografi innan vi kan försöka skilja dem åt!

Om du har använt någon kamera under de senaste 10 åren har du förmodligen sett ansiktsigenkänning i aktion:

det här kan verka som en slumpmässig sak att göra, men det finns en riktigt bra anledning att ersätta pixlarna med gradienter. Om vi analyserar pixlar direkt kommer riktigt mörka bilder och riktigt ljusa bilder av samma person att ha helt olika pixelvärden. Men genom att bara överväga riktningen som ljusstyrkan ändras kommer både riktigt mörka bilder och riktigt ljusa bilder att få samma exakta representation. Det gör problemet mycket lättare att lösa!

men att spara lutningen för varje enskild pixel ger oss alldeles för mycket detaljer. Vi saknar skogen för träden. Det skulle vara bättre om vi bara kunde se det grundläggande flödet av ljushet/mörker på en högre nivå så att vi kunde se bildens grundläggande mönster.

för att göra detta bryter vi upp bilden i små rutor på 16×16 pixlar vardera. I varje kvadrat räknar vi upp hur många lutningar som pekar i varje huvudriktning (hur många pekar upp, pekar upp-höger, pekar rätt, etc…). Då ersätter vi den rutan i bilden med pilriktningarna som var starkast.

slutresultatet är att vi förvandlar originalbilden till en mycket enkel representation som fångar grundstrukturen i ett ansikte på ett enkelt sätt: