Home » Tecnologie » AI, Machine Learning e Deep Learning: quali sviluppi nell’industria

Cosa sono Intelligenza Artificiale, Machine Learning e Deep Learning? E a cosa servono? La domanda non così banale, perché spesso e volentieri, dietro a questi concetti si cela un mondo che ai più è poco conosciuto e che in ogni caso è piuttosto complesso dal punto di vista tecnologico. Per provare a fare chiarezza proponiamo quanto illustrato da un esperto del settore: Simone Calderara, docente di deep learning all’UniMore – Università degli Studi di Modena e Reggio Emilia in occasione di LUMI Expo, in un convegno dedicato all’AI.

Non c’è una definizione standard per Intelligenza Artificiale. In letteratura tendo a scegliere quella secondo cui un sistema è intelligente nel momento in cui riesce a compiere un compito di pertinenza umana. La definizione diviene dinamica, si sposta nel tempo perché man mano che l’ambito applicativo si evolve si sposta la frontiera sempre più in là. Quindi, nessuno può dire cosa sia intelligente da parte di un calcolatore, non è definibile. È intelligente ciò che noi riteniamo essere tale. L’AI quindi è un grande contenitore di tecniche, di soluzioni, di applicazioni”.

AI, Machine learning e deep learning

All’interno di questo macrocosmo si svolge l’attività di Calderara, che segue principalmente l’ambito di machine learning applicata al settore industriale ovvero “svolgere compiti ritenuti ‘intelligenti’ senza dire esplicitamente al calcolatore come svolgerli, ma lasciando che, partendo da esempi, dai dati, riesca a trovare delle regole da applicare per risolvere il problema in completa autonomia”.

Al suo interno, c’è il deep learning, insieme di tecniche che utilizza le reti neurali per estrarre dai dati le regole utili a risolvere un compito. Potremmo tradurlo in “apprendimento automatico”.

La nuova frontiera del Machine Learning o Learning Machine

Calderara spiega quale sia la nuova frontiera attesa, ovvero contare su un calcolatore “quasi umano”, mentre la scienza punta ad altro. Vuole un sistema di elaborazione che sia migliorativo rispetto alle performance umane. “L’intelligenza generata dal calcolatore è il risultato di conti, sotto forma di moltiplicazioni, funzioni, ma che di intelligente come noi pensiamo non ha nulla. I data scientist progettano come devono essere svolti questi conti, la loro struttura, i processi migliori”.

Nel caso del machine learning o learning machine, a un determinato problema si cerca una risoluzione attraverso l’impiego di un data set, ovvero una collezione di esempi di questo problema e di come vorremmo il calcolatore possa risolverlo. Il problema, basato su dati e osservazioni concrete, viene trasformato, grazie al data scientist, in determinati numeri che servano da input per il calcolatore.  Esso “raccoglie i numeri e, tramite algoritmi di ottimizzazione, tenta di risolverlo, sulla base degli esempi forniti – spiega sempre Calderara – Ogni volta che sbaglia, cambia qualcosa e a forza di provare migliora fino ad arrivare al punto in cui si dice che il sistema è stato allenato e quindi in teoria dovrebbe essere pronto a risolvere un problema analogo con dati simili. Il deep learning agisce differentemente: parte dal fatto che se si hanno molti più esempi non c’è bisogno di codificare questi elementi mettendovi dentro la nostra conoscenza del dominio”.

AI più intelligente dell’uomo?

Il calcolatore opera unicamente sui dati, utilizzandoli in modo più grezzo, meno condizionati dalla nostra conoscenza sul processo, per lasciare all’algoritmo di ottimizzazione di scegliere le caratteristiche che meglio per esso caratterizza questo determinato processo. “Si perde controllo su quello che succede, ma guadagniamo la possibilità di acquisire caratteristiche che per noi non sono ovvie ma che portano a risultati decisamente migliori. Questo perché nel momento in cui fissiamo alcune caratteristiche determinanti per un determinato processo stiamo anche fissando una soglia sulle performance dell’algoritmo che può avere a partire da queste informazioni. Se lasciamo al calcolatore di cercare nei dati nuove correlazioni e informazioni possono emergere caratteristiche magari trascurate”. Tutto questo è possibile perché oggi la stragrande maggioranza dei dati è digitalizzato e la quantità prodotta è sufficientemente grande per andare a scoprire correlazioni statisticamente significative perché cadano su un campione che ha comunque la sua validità”.

Le reti neurali alla base del Machine Learning

Da lì il docente passa a illustrare cosa sia una rete neurale, un modello computazionale basato su una interconnessione di nodi (neuroni) artificiali. “Il neurone digitale è un classificatore lineare che ha il compito in un piano di separare determinati punti e lo fa scegliendo la retta migliore per svolgere questo compito. In una rete neurale abbiamo più neuroni collegati in strati. In questo caso il compito di un neurone non è più trovare una retta separatrice, ma una superficie molto più complicata che separi in uno spazio complesso gli elementi tra di loro”.

Usando delle immagini, è interessante notare come, andando a vedere strato per strato cosa impara un modello di questo tipo, si costruisca una rappresentazione astratta di quello che si vuole risolvere. Per esempio, una rete che deve riconoscere dei volti impara a costruirli a partire da pattern di basso livello (bianco/nero, chiaro/scuro) presente nelle immagini dei volti a partire dai quali costruisce i volti e prototipi.

Pensiero umano e computazionale

Anche in questo caso sono fortemente differenti i criteri analitici tra pensiero umano e computazionale: l’esempio del riconoscimento di volti è chiarificatore. “Per noi un volto è composto da tratti caratteristici come occhi, naso e bocca; per il calcolatore tali fattori sono a un livello di astrazione molto più alto rispetto ai dati che noi forniamo. Le reti neurali costruiscono una rappresentazione interna gerarchica del problema completamente scelto dalla macchina, ritenendolo il migliore per essa, non a logica umana”.

Ma posto questo, che processi possono essere modellati? “Un modello di questo tipo è capace di processi anche contro intuitivi a quelli cognitivi umani, come quello di attenzione”.

Processi cognitivi

L’essere umano, mentre guarda qualcosa, viene colpito da alcuni elementi particolari frutto di un processo puramente biologico. Non esiste una formula matematica che modella questo processo ma qualcosa di molto affine c’è. “Da esperimenti raccolti da centinaia di persone cui veniva chiesto di guardare alcune immagini con degli eye tracker, da lì si è chiesto a un modello di riprodurre il processo di comportamento medio. Il risultato è utile per fare un ranking degli elementi che catturano l’attenzione all’interno di una scena, scegliendo anche degli ordini di priorità”. Sarebbe così possibile creare dei ranking utili per fare analisi specifiche o per creare zone illuminate in modo da porre attenzione su un oggetto piuttosto che su un altro. Una soluzione interessante, per esempio, nella guida automobilistica. “Abbiamo registrato centinaia di ore di visualizzazioni durante questo processo e abbiamo poi chiesto a una rete neurale di riprodurlo, segnalando cosa guardare per simulare ciò che fa un automobilista medio. A un’azienda automotive è piaciuto tanto che l’hanno adottato per addestrare chi acquista una determinata auto a guidare in modo corretto”, racconta Calderara, portando un altro esempio: un processo cognitivo ancor più complicato, il pregiudizio. “Abbiamo costruito un modello che fa sì che se due persone dialogano e ne scegliamo una è in grado di darmi una stima del livello di pregiudizio di quella persona nei confronti dell’altra, anche solo partendo da movimenti del corpo”. Il margine di errore è alquanto basso.

Laboratori di ricerca su AI e Deep Learning

Un ultimo processo, analizzato è legato a un videogioco: un ottimo modo per produrre dati per addestrare un sistema a fare riconoscimenti di persone in scenari urbani. A questo posso aggiungere un tracking per aggregare persone. gli esiti sono molto interessanti per le ricerche condotte presso l’AImageLab, di cui Calderara è uno dei coordinatori del laboratorio di ricerca del Dipartimento di Ingegneria “Enzo Ferrari” dell’Università di Modena e Reggio Emilia. È anche un’unità di ricerca del Centro di Ricerca Interdipartimentale in ICT per le Imprese: Softech-ICT del Technopole di Modena.

AImageLab è attualmente impegnata in attività di ricerca sull’interazione uomo-computer basata sulla visione.

I principali progetti di ricerca riguardano: videosorveglianza, visione artificiale e visione robotica, imaging medico, multimedia centrata sull’uomo, recupero basato sul contenuto, rilevamento e tracciamento delle persone, comprensione del comportamento umano, visione egocentrica e sensori incorporati.