Oppo a CVPR 2022 presenta 7 progetti per migliorare l'IA

Oppo a CVPR 2022 presenta 7 progetti per migliorare l’IA

Oppo, in occasione della Computer Vision and Pattern Recognition Conference (CVPR) 2022, ha presentato nuovi progetti che ha sviluppato nel campo dell'intelligenza artificiale.

Scritto da

Simone Ziggiotto

25 Giugno 2022

In occasione della Computer Vision and Pattern Recognition Conference (CVPR) 2022, il brand Oppo ha proposto 7 progetti che ha sviluppato nel campo dell’Intelligenza Artificiale (IA), tra cui lavori riguardanti l’integrazione delle informazioni multimodali, la ricostruzione del corpo umano in 3D, la personalizzazione dell’esperienza utente in termini di estetica e la distillazione di conoscenze nelle reti neurali per il CVPR di quest’anno. L’azienda è anche riuscita a classificarsi in otto sfide tecniche organizzate nel corso della conferenza – tra cui la Neural Architecture Search (NAS) Challenge, la SoccerNet Challenge, l’ActivityNet Temporal Localization Challenge, la Video Object Segmentation Challenge, l’ACDC Challenge 2022 e la WAD Argoverse2 Motion Forecasting Challenge – aggiudicandosi tre primi posti, un secondo posto e quattro terzi posti.

"Grazie allo sviluppo della tecnologia di deep learning, avvenuta nel corso degli anni, la moderna tecnologia IA oggi è in grado di dimostrare un livello di capacità cognitiva simile a quello degli esseri umani" spiega l’azienda. "La fusione di più modalità, la tecnologia di intelligenza visiva 3D e l’apprendimento automatico stanno diventando argomenti di ricerca fondamentali nel campo dell’IA."

Progetti Oppo portati a CVPR 2022

La tecnologia cross-modale è considerata la chiave per "umanizzare" l’intelligenza artificiale al fine di stabilire un’interazione efficace tra dati di natura diversa. I ricercatori di Oppo hanno proposto un nuovo framework CRIS basato sul modello CLIP per consentire all’IA di comprendere con maggiore precisione testi e immagini, ottenendo una corrispondenza precisa di un frammento di informazione visiva rilevante in un’immagine dopo aver elaborato le complesse descrizioni testuali. La più grande differenza tra l’intelligenza umana e quella artificiale si pensa sia oggi proprio la multimodalità: mentre l’IA trova ancora difficile abbinare con precisione le informazioni derivanti da modalità diverse, gli esseri umani hanno la capacità di comprendere facilmente le informazioni contenute sia nelle parole che nelle immagini e di fare associazioni tra i due tipi di informazioni. Oppo ha quindi presentato un suo progetto che potenzialmente può portare l’IA a comprendere e interpretare realmente il mondo attraverso molteplici forme di informazione come il linguaggio, l’udito, la vista.

Al CVPR 2022, l’azienda ha presentato anche un processo di ricostruzione 3D del corpo umano, con una tecnologia capace di riprodurre non solo le sembianze di un essere umano ma anche dettagli come i loghi o le trame dei tessuti dell’abbigliamento che indossa, fornendo basi tecniche che possono essere utilizzate nei camerini virtuali per lo shopping online o nella creazione di avatar realistici in mondi VR/AR.

L’IA oggi è in grado di identificare con precisione molti oggetti all’interno in un’immagine. Tuttavia, ancora non è in grado di interpretare un’immagine per il suo valore estetico. Infatti, la capacità dell’intelligenza artificiale di valutare le immagini in termini di qualità estetica è spesso fortemente legata ai big data utilizzati per formulare il modello di IA, i quali non tengono conto del gusto soggettivo degli utenti. Per risolvere questo problema, l’Oppo Research Institute, in collaborazione con Leida Li, professore dell’Università di Xidian, ha sviluppato un modello chiamato "Personalized Image Aesthetics Assessment (PIAA)", capace di ottimizzare la valutazione estetica dell’ia combinando le preferenze soggettive degli utenti con valori estetici più generali, in modo da poter creare, in futuro, esperienze più personalizzate per gli utenti.

Inoltre, Oppo ha proposto una soluzione di ricostruzione semantica del piano 3D multi-view sviluppata in collaborazione con l’Università Tsinghua, l’INS-Conv (INcremental Sparse Convolution). Questa tecnologia ha la capacità di analizzare le superfici in un ambiente 3D riconoscendone le diverse caratteristiche, dal terreno ai piani di lavoro, fino alle pareti, con un grado di precisione molto più elevato rispetto all’attuale tecnologia di ricostruzione che utilizza un singolo punto di vista.

Oppo lavora allo sviluppo di tecnologia di IA dal 2015 con un team dedicato nel suo dipartimento di Ricerca e Sviluppo. All’inizio del 2020, l’azienda ha fondato l’Institute of Intelligent Perception per approfondire ulteriormente la propria esplorazione sulle tecnologie IA e, ad oggi, conta oltre 2.650 domande di brevetto a livello globale. Inoltre, grazie a diverse partnership, l’azienda è impegnata nell’integrare sempre più l’intelligenza artificiale nella vita quotidiana delle persone. Nel dicembre 2021, il brand ha lanciato la sua prima NPU dedicata all’imaging, MariSilicon X, mentre alcune sue tecnologie sono state utilizzate per sviluppare prodotti e funzionalità, tra cui la piattaforma AR CybeReal, Oppo Air Glass e le Omoji.