
Un nuovo apparato di elaborazione e proiezione di immagini
Il DISI intervista uno degli inventori, il Prof. Matteo Poggi.
Pubblicato: 22 luglio 2025 | Innovazione e ricerca
Una serie di interviste dedicate all’innovazione tecnologica e al pensiero progettuale: esploriamo le storie dietro invenzioni e soluzioni che rispondono a sfide reali. Un’occasione per approfondire processi creativi, approcci metodologici e impatti concreti sul mercato e sulla società.
Autrice di questa intervista è Francesca Montuschi, del Settore della comunicazione e informazione del dipartimento.
La capacità di calcolare la profondità (o depth o distanza) di una scena da immagini rappresenta un elemento determinante in molteplici settori innovativi, dalla robotica alla guida autonoma e alla realtà aumentata. Con la stereo vision le macchine possono "vedere" il mondo in modo più simile a quello degli esseri umani, migliorando sicurezza, precisione e funzionalità. La profondità degli oggetti inquadrati in una scena viene misurata con diversi tipi di sensori, divisi principalmente in due categorie: attivi e passivi.
Quelli cosiddetti attivi inviano impulsi di luce o onde radio e misurano la profondità in base al tempo impiegato dal segnale per tornare indietro; i secondi, cosiddetti passivi, per es. i sensori di profondità stereo, utilizzano due telecamere per catturare immagini leggermente diverse della scena. Attraverso algoritmi di elaborazione, come lo stereo matching, questi sistemi stimano la distanza degli oggetti. Entrambi i metodi sono perfettibili. I sistemi stereo passivi, nonostante i progressi apportati dal deep-learning, faticano a trovare corrispondenze visuali in presenza di più oggetti simili tra loro. I sistemi attivi, d'altro canto, utilizzando generalmente proiettori di luce sulla scena, non funzionano a lunga distanza oppure sotto il sole, possono interferire tra loro, presentano limiti con superfici trasparenti.
Parte proprio dallo studio sul miglioramento della stima della profondità il brevetto del gruppo di ricerca composto da Matteo Poggi, Fabio Tosi, Stefano Mattoccia e Luca Bartolomei del Dipartimento di Informatica - Scienza e Ingegneria (DISI). L’invenzione riguarda un metodo per facilitare la corrispondenza visuale in immagini tramite la proiezione di pattern virtuali, ottenuto sostituendo un proiettore di pattern convenzionale con un robusto sensore di profondità, al fine di guidare un algoritmo di stereo matching verso una soluzione più affidabile e corretta.
L’innovazione è caratterizzata dalla combinazione dei punti di forza dei metodi passivi e attivi e dall’uso di un proiettore virtuale e non di luce. Quali sono i vantaggi?
La particolarità del brevetto è di portare di fatto l'informazione che noi riusciamo a ricavare tramite metodi attivi nel dominio delle immagini. In poche parole, utilizziamo la nostra tecnica per arricchire il contenuto delle immagini, utilizzando però le informazioni che provengono dai sensori attivi. Gli algoritmi passivi nelle immagini cercano la posizione dello stesso oggetto: misurando la distanza nelle immagini si riesce a stimare la distanza nella realtà. Trovare, però, queste corrispondenze non è sempre facile, per es. se abbiamo 100 alberi molto simili tra loro. Tramite il supporto di questi sensori attivi, viene di fatto modificata l'immagine, aggiungendo colori molto discriminanti in modo tale che gli alberi, prima tutti uguali, diventino tra loro molto diversi. Andiamo a cambiare i colori in modo coerente nelle immagini, non con un pattern di luce nella scena vera, ma modificando direttamente le immagini acquisite. Possiamo farlo ovunque, perché non abbiamo più bisogno di un proiettore che non sia sensibile alla luce. Serve solo un sensore attivo, anche in grado di generare pochi punti depth e quindi economico, predisposto per lavorare in quell'ambiente.
Anche i brevetti possono essere il frutto di innovazione incrementale. Il suo gruppo di ricerca ha all’attivo 4 brevetti sulla stima della profondità.
Il primo brevetto fondamentalmente combina tecniche attive e passive in relazione alla profondità, e la sua caratteristica principale è di farlo all'interno di un algoritmo passivo, dopo aver identificato un buon punto di contatto con le informazioni che provengono dal sensore attivo. Il brevetto descritto poco fa invece è sempre una tecnica di fusione attiva-passiva ma non agisce all'interno dell'algoritmo bensì agisce sulle immagini. Quindi interveniamo sugli input dell'algoritmo: dal punto di vista quantitativo, nei nostri esperimenti, abbiamo visto che questo modo di procedere, oltre ad essere più semplice da utilizzare, dà anche risultati migliori. Il terzo e quarto brevetto sono legati unicamente a tecniche passive e sono un po' più contestualizzati nell'utilizzo delle reti neurali e nel risolvere loro problemi specifici. Uno, in particolare, è un metodo per far sì che la rete neurale utilizzata per stimare la profondità, durante una qualsiasi applicazione, possa evolvere nel tempo e quindi migliorare, continuando ad apprendere durante il suo utilizzo. L’altro brevetto è inerente all'identificazione degli errori nelle mappe di profondità stimate. Si tratta di una tecnica che, a sua volta, è in grado di migliorare la sua performance durante l'utilizzo.
I finanziamenti di progetti di Proof of Concept (PoC) rappresentano un’opportunità per innalzare il livello di maturità tecnologica delle invenzioni brevettate (TRL). Voi avete proposto progettualità in occasione di bandi di Ateneo e del Ministero delle Imprese e del Made in Italy (MIMIT).
Grazie al finanziamento di un progetto PoC abbiamo perfezionato il brevetto inerente all'identificazione degli errori nelle mappe di profondità stimate da metodi di stereo matching, e vinto il premio per la categoria future mobility all'Intellectual Property Award 2021 del MISE.
I grandi colossi mondiali fanno internamente molta ricerca e sviluppo in computer vision; con i loro potenti mezzi rischiano di monopolizzare il settore e anche a livello di pubblicazioni scientifiche sono molto attivi.
Nell’ambito della computer vision vi sono alcuni settori, per es. la stereo vision, nei quali i gruppi di ricerca universitari possono dire la loro. In termini di visibilità, devo dire che alla CVPR 2025, ovvero la conferenza mondiale di riferimento per la computer vision, abbiamo attratto maggiormente attraverso articolo scientifici sui brevetti più che attraverso i brevetti stessi.
Per quanto riguarda la valorizzazione della proprietà intellettuale (PI) universitaria, appaiono sempre più strategici i livelli nazionali e internazionali. Per es. il MIMIT – Ufficio Brevetti e Marchi (UIBM) ha aperto da poco la piattaforma Knowledge Share, un market place dei brevetti.
La piattaforma permette alle università di condividere e segnalare i risultati della ricerca, rendendoli più visibili a un pubblico più ampio. È importante il lavoro delle reti, dei consorzi, e soprattutto collaborare in modo sinergico tra le Università. In ambito europeo, ad esempio, l'European Laboratory for Learning and Intelligent Systems (ELLIS) è un consorzio che favorisce contatti tra i vari gruppi di ricerca e i vari Atenei nei quali vengono affrontati questi temi di ricerca.