Google presenta Veo 3: il generatore AI di video con audio sincronizzato

Nel corso dell’evento Google I/O 2025, il colosso di Mountain View ha sorpreso il mondo della tecnologia con il lancio di Veo 3, un innovativo modello di intelligenza artificiale capace di generare video accompagnati da audio perfettamente sincronizzato. Questa nuova tecnologia rappresenta un passo avanti epocale nel campo dei contenuti multimediali generati dall’AI, aprendo la strada a creazioni audiovisive più immersive e realistiche.

Dall’era del “video muto” all’audio integrato

Per anni, i sistemi di generazione video basati su AI hanno prodotto immagini di qualità crescente, ma il sonoro rimaneva un limite difficile da superare. Come ha sottolineato Demis Hassabis, CEO di Google DeepMind, Veo 3 rappresenta “il primo modello che permette di uscire dall’era del video muto”, offrendo non solo immagini ma anche suoni, effetti ambientali, musica e dialoghi sincronizzati con i movimenti delle labbra.

Come funziona la generazione audio sincronizzata

Grazie a una sofisticata tecnologia di diffusione che riprende le ricerche di Google nel campo del Video-to-Audio (V2A), Veo 3 riesce a tradurre i pixel in onde sonore realistiche. Il sistema parte da un rumore casuale che viene progressivamente raffinato fino a ottenere suoni coerenti con le immagini, dal rumore di fondo di una strada trafficata alle conversazioni sincronizzate con i personaggi sullo schermo.

Applicazioni rivoluzionarie nel mondo della creatività digitale

Questa integrazione tra video e audio apre nuove possibilità per registi, animatori e creatori di contenuti. Attraverso il nuovo strumento Flow, un ambiente di lavoro AI-based presentato anch’esso da Google, gli utenti possono generare filmati completi con audio personalizzato semplicemente descrivendo a parole cosa desiderano. La tecnologia è già disponibile per gli abbonati a Gemini Ultra negli Stati Uniti, promettendo di cambiare radicalmente il modo in cui si producono video e film digitali.

Sfide e futuro della generazione audiovisiva AI

Nonostante i grandi progressi, la sfida di realismo è ancora aperta, soprattutto per quanto riguarda la sincronizzazione labiale e la naturalezza delle voci generate. Tuttavia, Veo 3 segna un importante avanzamento tecnologico che, combinato con ulteriori ricerche, potrà rivoluzionare il mondo della narrazione digitale e dei media interattivi.


Con Veo 3, Google non solo amplia i confini dell’intelligenza artificiale applicata ai media, ma rende più accessibile a tutti la creazione di contenuti audiovisivi di alta qualità, trasformando in modo radicale la produzione e la fruizione dei video nel prossimo futuro.

CategorieAI
Exit mobile version

Utilizzando il sito, accetti l'utilizzo dei cookie da parte nostra. maggiori informazioni

Questo sito utilizza i cookie per fonire la migliore esperienza di navigazione possibile. Continuando a utilizzare questo sito senza modificare le impostazioni dei cookie o clicchi su "Accetta" permetti al loro utilizzo.

Chiudi