AI-coustics: : l’innovazione che pulisce l’audio con l’IA
28/03/2024
Le registrazioni rumorose di interviste e discorsi sono il tormento degli ingegneri del suono. Ma una startup tedesca spera di risolvere questo problema con un approccio tecnico unico che utilizza l’Intelligenza Artificiale generativa per migliorare la chiarezza delle voci nei video.
Oggi, AI-coustics è emersa dallo stealth con un finanziamento di 1,9 milioni di euro. Secondo il co-fondatore e CEO Fabian Seipel, la tecnologia di AI-coustics va oltre la semplice soppressione del rumore standard per lavorare su qualsiasi dispositivo e altoparlante.
“La nostra missione principale è rendere ogni interazione digitale, che si tratti di una conferenza telefonica, di un dispositivo per consumatori o di un video sui social media, chiaro come una trasmissione da uno studio professionale“, ha detto Seipel in un’intervista a TechCrunch.
Come funziona AI-coustics?
AI-coustics si distingue dalla concorrenza grazie al suo approccio unico nello sviluppo dei meccanismi di Intelligenza Artificiale per la riduzione del rumore. La startup utilizza un modello addestrato su campioni vocali registrati nello studio di AI-coustics a Berlino. Le persone vengono pagate per registrare campioni vocali che vengono poi aggiunti a un set di dati per addestrare il modello di AI-coustics. Durante il processo di addestramento, AI-coustics simula artefatti audio e problemi come il rumore, la riverberazione, la compressione, i microfoni a banda limitata, la distorsione e la clip. Questo approccio permette ad AI-coustics di sviluppare un modello di riduzione del rumore altamente efficace.
Applicazioni
AI-coustics offre attualmente un’app web e un’API per il post-processing di registrazioni audio e video. Inoltre, l’azienda fornisce un SDK che permette di integrare la piattaforma di AI-coustics nei flussi di lavoro, nelle app e nell’hardware esistenti. In futuro, AI-coustics prevede di sviluppare la tecnologia per migliorare la voce in tempo reale, così come l’integrazione nei dispositivi come soundbar, smartphone e cuffie per migliorare automaticamente la chiarezza della voce.
Quali sono i benefici
L’utilizzo della tecnologia di AI-coustics può portare a numerosi benefici. Innanzitutto, migliora la chiarezza delle voci nei video, riducendo al minimo il rumore di fondo e altri artefatti audio indesiderati. Questo rende le registrazioni audio e video più facili da comprendere e da fruire. Inoltre, AI-coustics permette di automatizzare alcune delle attività che richiedono molto tempo, come la pulizia delle registrazioni audio e video. Ciò consente di risparmiare tempo e denaro, consentendo agli studios di produzione di contenuti e ai responsabili della trasmissione di ottimizzare i propri flussi di lavoro.
Bias e diversità in AI-coustics
Un problema comune negli algoritmi di riconoscimento del linguaggio è il rischio di sviluppare bias che possono danneggiare gli utenti. Per affrontare questo problema, AI-coustics si impegna a reclutare contributori di campioni vocali “diversi” per ridurre il rischio di bias. L’azienda ritiene che la dimensione e la diversità del suo set di dati siano fondamentali per eliminare il bias e rendere la tecnologia adatta a tutte le lingue, identità degli speaker, età, accenti e generi.