Google riconosce oggetti nei Video rendendoli Ricercabili

La nuova Google Cloud Video Intelligence API permetterà agli sviluppatori di creare applicazioni in grado di ricercare elementi all'interno dei video, grazie ai metadati estraibili dai filmati stessi.

Scritto da

Simone Ziggiotto

il

Grazie ai progressi della machine learning, i dispositivi elettronici, soprattutto gli smartphone, stanno diventando sempre più intelligenti. Google partecipa in maniera importante a questo graduale cambiamento, ad esempio con funzionalità automatiche all’interno dell’app Google Foto o le capacità del suo nuovo Assistente. In occasione della conferenza Cloud Next a San Francisco, Google ha annunciato il lancio di una nuova API per l’apprendimento automatico per il riconoscimento automatico degli oggetti nei video, rendendoli anche ricercabili.

La nuova Google Cloud Video Intelligence API permetterà agli sviluppatori di creare applicazioni in grado di ricercare elementi all’interno dei video, grazie ai metadati estraibili dai filmati stessi. Fino ad ora, la tecnologia di machine learning di Google si era limitata a poter riconoscere persone e oggetti all’interno delle immagini statiche, ma grazie a questa nuova API anche gli elementi nei video diventano riconoscibili e ricercabili.

In un pratico esempio, sarà possibile ad esempio chiedere ad un’app che fa uso delle nuove API di trovare i video della vacanza al mare, o i video delle feste di compleanno, i video con tutta la famiglia, i video con cani, e cosi’ via. Come questo puo’ essere possibile? La nuova API Video Intelligence è in grado di riconoscere gli oggetti nei video, li cataloga, e li rende ricercabili. In altre parole, gli strumenti messi a punto da Google sono in grado di estrarre delle informazioni dai video da poter utilizzare come filtri per ricercare i filmati che hanno quelle esatte corrispondenze all’interno del proprio archivio.

Per Google, la nuova API rende possibile cercare in un catalogo di video allo stesso modo in cui si cercano frasi o parole in un documento di testo.

Stando a quanto descritto da Google, la API Video Intelligence "consente agli sviluppatori di estrarre informazioni utili dai file video senza richiedere alcuna conoscenza di machine learning o computer vision" spiegando che la API migliorerà nel tempo, con sempre nuovi concetti che verranno introdotti e la precisione che verrà migliorata.

Big G continua a spiegare poi che la Video Intelligence API "aiuta a capire meglio il contenuto complessivo del vostro catalogo video basato su entità rilevate all’interno dei video, fornendo al contempo la comprensione temporale su cui ogni entità era presente all’interno del video".

Utilizzando la API Video Intelligence, Google dice che le aziende potrebbero identificare la presenza di un elemento in un particolare video, scena o fotogramma. Ad esempio, "trovare l’entità x all’interno della scena Y".

"Grazie alla API Video Intelligence siamo stati in grado di elaborare molto rapidamente e comprendere il contenuto dei video fino al singolo fotogramma (…). Questo rivoluzionerà la gestione dei media e li porterà alla prossima generazione." ha commentato Mikael Wahlberg, VP Product Development di Cantemo.

Alla conferenza Cloud Next a San Francisco, come riportato da Techcrunch, Fei-Fei Li, il capo scienziato di AI e Machine Learning per Google Cloud, ha osservato che "il mondo dei pixel va oltre le immagini. I video sono stati a lungo una sfida per i ricercatori dell’apprendimento automatico. Questo nuovo servizio, però, permette di estrarre informazioni dai video facilmente come si fa lo stesso per le immagini".

I potenziale della tecnologia è praticamente infinito, e oggi siamo solo all’inizio.

Impostazioni privacy