Apprendimento automatico è divertente! Parte 4: Riconoscimento facciale moderno con Deep Learning

Riconoscimento facciale-Passo dopo passo

Affrontiamo questo problema un passo alla volta. Per ogni passaggio, impareremo a conoscere un diverso algoritmo di apprendimento automatico. Non ho intenzione di spiegare completamente ogni singolo algoritmo per evitare che questo si trasformi in un libro, ma imparerai le idee principali dietro ognuno e imparerai come puoi costruire il tuo sistema di riconoscimento facciale in Python usando OpenFace e dlib.

Punto 1: Trovare tutti i volti

Il primo passo nella nostra pipeline è il rilevamento dei volti. Ovviamente abbiamo bisogno di individuare i volti in una fotografia prima di poter provare a distinguerli!

Se avete usato qualsiasi fotocamera, negli ultimi 10 anni, probabilmente avete visto il rilevamento del viso in azione:

il rilevamento del Viso è una grande caratteristica per le telecamere. Quando la fotocamera può selezionare automaticamente i volti, può assicurarsi che tutti i volti siano a fuoco prima di scattare l’immagine. Ma lo useremo per uno scopo diverso: trovare le aree dell’immagine che vogliamo passare al passaggio successivo nella nostra pipeline.

Face detection è diventato mainstream nei primi anni 2000 quando Paul Viola e Michael Jones hanno inventato un modo per rilevare i volti che era abbastanza veloce da funzionare su fotocamere economiche. Tuttavia, esistono soluzioni molto più affidabili ora. Useremo un metodo inventato nel 2005 chiamato Istogramma di gradienti orientati – o semplicemente HOG in breve.

Per trovare i volti in una foto, inizieremo facendo la nostra immagine in bianco e nero, perché non abbiamo bisogno di colore dati per trovare facce:

Poi vedremo ogni singolo pixel della nostra immagine, uno alla volta. Per ogni singolo pixel, vogliamo guardare i pixel che lo circondano direttamente:

Il nostro obiettivo è quello di capire come dark pixel corrente viene confrontato con i pixel direttamente circostante. Quindi vogliamo disegnare una freccia che mostra in quale direzione l’immagine sta diventando più scura: