ViDi porta il deep learning nel mondo dei visori industriali

di Marco de’ Francesco ♦︎ Cognex, multinazionale Usa dei sistemi di visione, ha realizzato un nuovo software di intelligenza artificiale. La promessa è di far fare un salto quantico a questo promettente settore dell’automazione

«To a great mind, nothing is little», fa dire Arthur Conan Doyle a Sherlock Holmes. Dunque, per analizzare I dettagli, occorrono due cose: buona vista e un cervello potente. Nel mondo industriale i sistemi di visionetelecamere 2D e 3D con funzioni di ispezione, posizionamento, misura, lettura codici e riconoscimento ottico dei caratteri – sono hardware resi intelligenti da algoritmi basati su regole predefinite: faticano pertanto a riconoscere elementi molto diversi da quelli  previsti in origine. Il salto logico lo ha fatto la multinazionale americana Cognex, che ha realizzato ViDiun software basato sul deep learning.







Gli algoritmi sono addestrati con immagini di esempio e pertanto sono più elastici, più sensibili a imperfezioni in apparenza irrilevanti. Minuscole crepe, fili tirati in trame tessili, diventano improvvisamente riconoscibili all’occhio della telecamera. Per rendere il sistema più efficiente, peraltro, si è ricorso al calcolo parallelo: gli algoritmi vengono allenati e processati al contempo da più core grazie all’utilizzo della scheda grafica come coprocessore. Per ora ViDi è solo software, ma l’azienda è intenzionata a realizzare una smart-camera con deep-learning a bordo. Ne abbiamo parlato con Matteo Melli, application engineer manager di Cognex per l’Italia, la Spagna, il Medio oriente e l’Africa.

Matteo Melli, application engineer manager di Cognex per l’Italia, la Spagna, il Medio oriente e l’Africa

Blue, Red, Green, tool operativi in ambito industriale abilitati dal deep learning di ViDi

Secondo Melli «ViDi è una suite di deep learning per applicazioni di visione artificiale». È un software che rende “intelligenti” tool operativi in ambito industriale. Il primo, ViDi Blue, serve per trovare gli oggetti (o i caratteri) e ad esaminarli. Ad esempio, riesce e reperire e a contare file mediche di vetro traslucido su un vassoio, e ad eseguire il controllo di qualità. Il secondo, ViDi Red, analizza i difetti sezioni particolari dei prodotti, identificando graffi su superfici complesse, ma anche assemblaggi incompleti o non corretti e problemi di tessitura. Il sistema apprende l’aspetto normale di un oggetto, considerando le variazioni significative ma tollerabili: esclude, cioè, le alterazioni non compatibili con gli standard qualitativi dell’azienda produttrice. ViDi Green, invece, separa diverse classi in base a una raccolta di immagini etichettate. Addestrando sulle tolleranze accettabili, identifica i prodotti in base alla loro confezione, classifica la qualità delle cuciture di saldatura e separa le anomalie accettabili o inaccettabili. Ora, i sistemi di visione in ambito industriale sono già generalmente assistiti da algoritmi; perché ricorrere al deep learning? «Ad esempio, una saldatura effettuata su superfici lavorate riflettenti è difficilmente analizzabile grazie a comuni algoritmi “geometrici”, basati cioè sulla forma tipica delle cose. Che forma standard ha una saldatura? In tutti i casi in cui comuni algoritmi non consentono di riconoscere forme troppo diverse tra di loro, occorrono analisi più sofisticate, basate sul deep learning». In pratica, come vedremo, se l’algoritmo è basato su regole, è intrinsecamente limitato nella sua operatività dalle definizioni che gli sono state fornite; se, come col deep learning, è basato su esempi a partire dai quali è stata allenata una rete neurale, è molto più elastico e quindi in grado di interpretare situazioni diverse.

Cognex ViDi

Il deep learning imita il funzionamento del cervello umano, ma in ambito industriale è molto più efficiente

Ma cos’è il deep learning? È un metodo di apprendimento che rientra nel più vasto concetto di intelligenza artificiale (argomento già trattato da Industria Italiana, ad esempio in questo articolo e in questo). Si basa su diversi livelli di rappresentazione, corrispondenti a gerarchie di caratteristiche di concetti, dove quelli di alto livello sono definiti sulla base di quelli di basso rango. In pratica, l’output del livello precedente viene utilizzato come input per quello successivo. L’intelligenza che emerge in procedimenti di questo tipo è il frutto di un movimento “diffuso”, e non centralizzato in una singola unità. Una delle architetture tipiche dell’apprendimento profondo è quella che utilizza le reti neurali. Queste sono funzioni matematiche che imitano il meccanismo del cervello umano. I neuroni artificiali replicano il funzionamento di quelli biologici, piccole componenti del cervello che ci consentono di ragionare. Come nel caso del cervello umano, il modello artificiale è costituito da interconnessioni di informazioni. Ora, in un normale contesto informatico, le informazioni vengono immagazzinate in una memoria centrale ed elaborate in un luogo definito: con la rete neurale, invece, si cerca simulare il comportamento dei neuroni con connessioni analoghe alle sinapsi di un neurone biologico tramite una funzione di attivazione, che stabilisce quando il neurone invia un segnale. In pratica, le informazioni sono distribuite in tutti i nodi della rete. Come accade nel cervello umano. Ma nell’ispezione e nell’analisi di componenti e prodotti industriali i sistemi artificiali sono molto più veloci ed efficienti delle persone.

I passaggi compiuti da Cognex ViDi

L’ottimizzazione della rete neurale: il calcolo parallelo

C’è un problema con le reti neurali. Secondo Melli «tipicamente sono un po’ pesanti: occorre una grande potenza di calcolo». Come si è agito per attenuare questo fattore? «Anzitutto con l’ottimizzazione degli algoritmi; e poi, soprattutto, con il calcolo parallelo». Quest’ultimo consiste nell’esecuzione simultanea del codice sorgente (il “testo” di un algoritmo scritto in linguaggio di programmazione); viene diviso e processato su più microprocessori o su più core (nuclei elaborativi). È come se un problema fosse spezzettato, e le varie parti fossero risolte al contempo da più cervelli elettronici. È un sistema molto efficiente: la maggior parte dei supercomputer recenti è basata su una architettura parallela. «Si riesce così ad ottenere il massimo da un Pc industriale; e si possono fornire agli algoritmi immagini 2D, 3D e termografiche al contempo». Il lavoro viene svolto con l’ausilio di una unità di elaborazione grafica multicore Cuda.

La rete neurale va addestrata

Un’altra differenza rispetto ad un comune sistema IT, è che la rete neuronale non dispone di un grado di “intelligenza” definito una volta per tutte. Va “allenata”. E lo si fa nutrendola di esempi, analizzando i quali impara. Secondo Cognex ViDi consente ai tecnici di addestrare un modello basato sull’apprendimento profondo in pochi minuti, fornendo solo un piccolo set di immagini di esempio. Sempre per Cognex, una volta configurata l’applicazione, ViDi offre risultati rapidi e salva le immagini per il controllo del processo. «Una tecnologia che apprende grazie ad esempi anziché tramite regole è sempre quella più semplice per l’utilizzatore» – afferma Melli.

Robert Willet, presidente e ceo Cognex

Anche l’occhio vuole la sua parte: i sistemi di visione

Naturalmente il software di deep learning e i tool sono funzionali ad apparati hardware, ai cosiddetti sistemi di visione. Questi sono in genere delle telecamere 2D e 3D, con funzioni di ispezione, posizionamento, misura, lettura codici e Ocr (riconoscimento ottico dei caratteri). Dell’argomento Industria Italiana si è occupata in questo articolo. Che riporta, peraltro, considerazioni emerse allo Smart Vision Forum di Bologna di qualche settimana fa. L’evento era nato dalla collaborazione tra AIdAM (associazione italiana di automazione meccatronica) e Anie Automazione, e organizzato dall’operatore globalizzato di fiere Messe Frankfurt. Nell’occasione si erano messe a confronto le tre tecnologie per l’acquisizione di immagini tridimensionali: la triangolazione laser, il tempo di volo o la stereoscopia. Con la prima un laser proietta sull’oggetto una lama che ne disegna il profilo, recepito da sensori; questi sfruttano il principio della triangolazione, che permette di misurare la lunghezza del lato di un triangolo, conoscendo quella degli altri due. Con la seconda, uno strumento che permette di stimare real time la distanza tra la telecamera e gli oggetti inquadrati, misurando il tempo che occorre ad un impulso luminoso per percorrere il tragitto telecamera-oggetto-telecamera (tempo di volo). Con la stereoscopia, associando immagini 2D dello stesso oggetto prese da angoli diversi e combinando le informazioni di posizione degli oggetti, è possibile ricostruire la mappa di distanze 3D. Secondo Melli, «nel prossimo futuro ViDi non sarà soltanto un software, ma una soluzione con una smart-camera e deep-learning a bordo».

Cognex ViDi

Ambiti industriali di applicazione

«Quanto a ViDi – afferma Melli – abbiamo avuto un forte riscontro da parte di tanti settori industriali. Direi però che il software ha assunto un rilievo particolare in comparti come l’automotive e il food. Nel primo, perché è oggettivamente difficile utilizzare i sistemi di visione su superfici di metallo lavorato; nel secondo, perché in questo campo non esiste un prodotto che sia uguale agli altri. Si pensi ai prodotti dell’agricoltura, ma anche a quelli già trattati e confezionati che si trovano al supermercato o nelle macchinette di distribuzione». Secondo l’azienda, un altro importante campo di applicazione è il settore elettronico, dove «l’automazione dei processi produttivi e il miglioramento della qualità sono le due principali esigenze. Tuttavia alcune applicazioni sono troppo complicate, dispendiose in termini di tempo e costose per essere programmate in un algoritmo basato su regole. L’uso di ispettori umani, poi, può anche introdurre errori e rallentare la produzione. ViDi è invece progettato per ottimizzare le applicazioni dell’elettronica che coinvolgono posizione dei componenti, ispezione cosmetica, classificazione e riconoscimento dei caratteri».














Articolo precedenteNei processi decisionali basati su Ai la fiducia è estremamente importate
Articolo successivoFondimpresa supera le 200mila aziende aderenti.






LASCIA UN COMMENTO

Per favore inserisci il tuo commento!
Per favore inserisci il tuo nome qui