Il gruppo di ricerca della professoressa Boato al lavoro sul dataset TrueFace ©UniTrento - Ph. Alessio Coser

Ricerca

Caccia a chi non esiste

TrueFace è il dataset del Disi che smaschera volti sintetici

10 ottobre 2022
Versione stampabile
Di Betty Balduin e Mirian Soledad Ayala De Chenu Abente
Comunicazione Dipartimento di Ingegneria e Scienza dell'Informazione

TrueFace, il primo dataset che raccoglie volti sia reali sia sintetici elaborati dai social media, è ora a disposizione della comunità scientifica. Lo ha sviluppato il gruppo di ricerca guidato al Disi da Giulia Boato, in collaborazione con la società U-Hopper. L’obiettivo è combattere la diffusione sul web di immagini falsificate.

Negli ultimi anni, è in costante aumento il numero dei volti "sintetici", cioè generati artificialmente attraverso algoritmi o altri strumenti di machine learning. Questi artefatti, talmente realistici da riuscire a ingannare anche l’occhio più esperto, sono spesso associati a false identità con l’obiettivo di truffare, condizionare opinioni e pensieri, o con altri scopi malevoli.

Se l’occhio umano non è in grado di riconoscere il cosiddetto "deepfake", la scienza può dare un grosso aiuto. Attraverso l’intelligenza artificiale, è infatti possibile allenare i computer a riconoscere le tracce digitali lasciate dalle immagini sintetiche, smascherando artifici e contraffazioni.

Fino a oggi, però, i software avevano potuto attingere solo a immagini di archivio, materiale insufficiente per allenarli a riconoscere le manipolazioni sui social media. Quando sono condivise sui social, infatti, le immagini vengono ripetutamente compresse ed elaborate, e questo rende molto più complicato il compito degli algoritmi.

Il gruppo di lavoro guidato dalla professoressa Giulia Boato al Dipartimento di Ingegneria e Scienza dell’Informazione ha lavorato all’interno del progetto TrueBees in collaborazione con la società U-Hopper per realizzare un dataset che raccolga volti sia reali sia sintetici. TrueFace, questo il nome della banca dati nata, è ora a disposizione della comunità scientifica per aiutarla a combattere più efficacemente la diffusione delle immagini falsificate.

«L’importanza di TrueFace – spiega Boato – sta sia nel numero delle immagini raccolte, sia nella loro tipologia: contiene infatti 210mila volti: 80mila reali, 70mila artificiali e, novità rispetto ad altri dataset, 60mila (sia veri, sia falsi) condivisi realmente su Facebook, Telegram e Twitter. Il che significa mettere a disposizione dell’intelligenza artificiale un archivio di dati non solo esteso e diversificato, ma anche rappresentativo di uno scenario estremamente realistico. Questo consente alle macchine un apprendimento molto più efficace e utile».

Il dataset TrueFace è disponibile online a questo indirizzo.

DEEPFAKE
I deepfake sono contenuti digitali (immagini o video) generati artificialmente per mezzo di tecniche basate sull’intelligenza artificiale. Coinvolgono in particolare i volti dei soggetti raffigurati.
La parola è composta dal termine "deep", che sta per "deep learning", e "fake", che significa "falso". Il deep learning è una tecnica avanzata di intelligenza artificiale (IA) che si avvale di algoritmi di machine learning per estrarre informazioni sempre più sofisticate dai dati, tra cui le caratteristiche di un volto umano o i movimenti fisici di una persona.
Questa tecnica viene usata per combinare e sovrapporre immagini e video esistenti con video o immagini originali ed è stata spesso usata per scopi dannosi come creare false identità o fake news, per il revenge porn e anche per fini di propaganda.