contatore visite

domenica 11 giugno 2023

Il cervello dei sapiens (e di altre specie ad essa vicine) si è evoluto per gestire le situazioni di incertezza.

Caratteristica generale nell’evoluzione umana è che i volti devono poter esser riconosciuti da lontano per stabilire se si tratti di amici o nemici: di conseguenza si rende necessario decodificare pure le immagini sfocate o degradate.

I nostri progenitori, osservando una sagoma lontana, dovevano velocemente rendersi conto se si trattasse di un pericolo o di un’opportunità, e quindi scegliere tra “fight or flight” (combattere o scappare).

Abbiamo ereditato questa capacità: guardando da lontano, o semplicemente socchiudendo gli occhi, attiviamo un diverso processo di riconoscimento visivo (a minor definizione) e siamo così in grado di riconoscere il nostro Albert incravattato.




Altra “capacità” selezionata dall’evoluzione è il cosiddetto “funzionamento vicario” (condiviso con la maggior parte dei sistemi biologici, ad es gli uccelli migratori).
Per riconoscere gli oggetti in situazioni di incertezza quali diverse condizioni di illuminazione, situazioni e contesti, il cervello usa molteplici percorsi: quando fallisce in uno ne imbocca uno diverso.

Ciò che ci permette di riconoscere un volto di una persona conosciuta è in genere la forma di occhi, naso e bocca, ma spesso effettuiamo correttamente il riconoscimento anche disponendo di informazioni più limitate (basti pensare alle caricature: pochi tratti di matita bastano a farci riconoscere il personaggio rappresentato).

Riconosciamo un viso anche quando parti di esso sono coperte o mal rappresentate: in tal caso il cervello cambia strategia ed utilizza caratteristiche esterne, quali forma del viso e capelli.
Esempio è la foto nel primo commento: vi riconosciamo subito Clinton e Gore, ma guardandola con più attenzione … scopriamo che il viso è sempre quello di Clinton!



Il nostro cervello ha utilizzato informazioni diverse nel riconoscimento dei due volti rappresentati, quali la pettinatura, la forma della testa e - non ultimi - la posizione dei corpi (davanti il presidente e dietro il suo vice) e la memoria di immagini simili dei due soggetti viste in precedenza (dove però i visi erano diversi).
Le strategie di riconoscimento ottico usate dalle AI sono completamente differenti e soggette ad errori di tipo diverso rispetto a quelli in cui incorrono i cervelli biologici.

Un esempio è il riconoscimento di scuola bus americani: un foglio attraversato da strisce orizzontali alternate gialle e nere viene interpretato come uno scuola bus.

Questo errore ci informa come l’analisi da parte della rete neurale profonda avesse individuato, quale caratteristica distintiva degli scuola bus, un elemento grafico che si riscontra nelle foto di tutti gli scuolabus USA: l’alternanza di barre gialle e nere.

il limite del riconoscimento ottico delle AI sta nel fatto che esse non possiedano un modello della realtà oggettiva (non sanno ad esempio a cosa serva uno scuola bus, cosa significhi muoversi su una strada o cosa siano i bambini).

Quando si parla di “black box” a proposito delle AI basate sul deep learning si intende proprio questo: esse identificano spesso correttamente gli oggetti rappresentati in foto ma non sappiamo come facciano, e cioè spesso non siamo consapevoli di quali caratteristiche la rete profonda abbia selezionato per indicare che in una foto sia rappresentato un determinato oggetto.

Un racconto - una probabile leggenda metropolitana - aiuta tuttavia a comprender meglio l’affermazione precedente:

“… L'esercito degli Stati Uniti addestrò una rete neurale a distinguere un carro armato russo da uno statunitense.
Come di consueto, venne usata una cospicua serie di dati con foto dei carri armati; la rete venne addestrata su una metà e testata sull'altra.
Alla fine, essa riusciva a padroneggiare il test con un'accuratezza del 100 per cento.
Ma quando fu usata nel mondo reale, fece fiasco.
Solo in seguito ci si rese conto che i carri armati statunitensi erano stati fotografati in una giornata di sole e quelli russi in una giornata nuvolosa.
La rete intelligente aveva trovato l'indizio perfetto: le nubi…"



Nessun commento:

Posta un commento

Elenco posts

 Elenco dei miei posts scritti nel periodo dal 28/3/18 all'11/04/24:                                                    ( su FB ) - vide...