Il riconoscimento delle immagini è una branca della visione artificiale, o computer vision, in cui, utilizzando tecniche avanzate di ingegneria, si riescono ad impostare degli algoritmi che ne estraggono numerose informazioni, tra cui tonalità di colore o cambiamenti di luminosità, ma anche determinazione di oggetti e loro contestualizzazione.
Che cos’è il riconoscimento delle immagini?
Il riconoscimento delle immagini, o image recognition in lingua inglese, ha a che fare con l’identificazione di oggetti all’interno di un’immagine, riconoscendo a quale categoria appartengono. Viene molto usato nell’automazione industriale, ma anche in ambiti molto diversi, tra cui, come purtroppo ai giorni d’oggi è cronaca, anche in quello militare.
Quando vediamo visivamente un oggetto o una scena, identifichiamo automaticamente gli oggetti come istanze diverse e li associamo a definizioni individuali. Tuttavia, il riconoscimento visivo è un compito molto complesso da eseguire per le macchine.
Il riconoscimento delle immagini tramite intelligenza artificiale è un problema di vecchia data. Sebbene metodi diversi si siano evoluti nel tempo, l’obiettivo comune è la classificazione degli oggetti rilevati in diverse categorie. Pertanto, è anche chiamato riconoscimento di oggetti.
Negli anni passati, l’apprendimento automatico, in particolare le tecnologie di apprendimento profondo (deep learning), hanno ottenuto grandi successi in molte attività di visione artificiale e comprensione delle immagini, ottenendo migliori risultati in termini di prestazioni e flessibilità.
Significato e definizione
Nella visione artificiale, termini come segmentazione, classificazione, riconoscimento e rilevamento sono spesso usati in modo intercambiabile e le diverse attività si sovrappongono. Sebbene ciò non sia un problema, può in effetti confondere, specialmente quando un lavoro richiede di eseguire specificamente un’attività particolare.
Riconoscimento delle immagini e visione artificiale
I termini riconoscimento delle immagini e visione artificiale sono spesso usati in modo intercambiabile, ma in realtà sono diversi. Infatti, il riconoscimento delle immagini è soltanto una delle molte applicazioni della visione artificiale che include una serie di attività, tra cui il rilevamento di oggetti, l’identificazione delle immagini e la classificazione delle immagini.
Riconoscimento e rilevamento delle immagini
Anche i termini riconoscimento dell’immagine e rilevamento dell’immagine sono spesso usati l’uno al posto dell’altro. Tuttavia, anche in questo caso ci sono importanti differenze tecniche.
Il rilevamento dell’immagine ha infatti il compito di prendere un’immagine in input e trovare vari oggetti al suo interno. Un esempio è il rilevamento dei volti, in cui gli algoritmi mirano a trovare i modelli dei volti nelle immagini, e non interessa se gli oggetti rilevati siano in qualche modo significativi: l’obiettivo è solo quello di distinguere un oggetto da un altro per determinare quante entità distinte sono presenti all’interno dell’immagine.
D’altra parte, il riconoscimento dell’immagine ha il compito di identificare gli oggetti di interesse all’interno di un’immagine e riconoscere a quale categoria o classe appartengono.
Come funziona il riconoscimento delle immagini
Ci sono alcuni passaggi alla base del funzionamento dei sistemi di riconoscimento delle immagini, qualunque sia la tecnologia utilizzata.
Addestramento
I modelli di riconoscimento delle immagini richiedono dati per essere addestrati (video, foto, ecc.). Le reti neurali hanno bisogno di tali dati per creare percezioni dell’aspetto di determinate classi.
Ad esempio, un modello di riconoscimento delle immagini che rileva pose diverse richiederebbe più istanze di diverse pose umane per capire cosa rende le pose uniche l’una dall’altra.
Training delle reti neurali
Le immagini vengono inserite in un algoritmo di rete neurale, che rappresenta l’aspetto di apprendimento automatico della creazione di un modello di riconoscimento delle immagini. L’addestramento di un algoritmo di riconoscimento delle immagini consente al riconoscimento delle immagini di identificare classi specifiche. Esistono diversi framework ben testati ampiamente utilizzati per questi scopi.
Test del modello di intelligenza artificiale
Il modello addestrato deve essere testato con immagini che non fanno parte dei dati di addestramento. Il test ha lo scopo di determinare l’usabilità, le prestazioni e l’accuratezza del modello. Pertanto, circa l’80-90% delle immagini complete vengono utilizzato per l’addestramento del modello, mentre la parte rimanenti viene riservata al test del modello.
Le prestazioni vengono misurate in base a una serie di parametri che indicano la percentuale di affidabilità dell’accuratezza per immagine di test, identificazioni errate e altro ancora.