O CEO da ElevenLabs diz que os modelos de áudio de IA serão ‘comoditizados’ com o tempo

Mati Staniszewski SXSW

O CEO da ElevenLabs diz que os modelos de áudio de IA serão ‘comoditizados’ com o tempo

Empresa de áudio de IA OnzeLabsO cofundador e executivo-chefe Mati Staniszewski acredita que os modelos de IA serão comoditizados ao longo do tempo, um comentário revelador para uma empresa focada hoje em construí-los.

Falando no palco da conferência TechCrunch Disrupt 2025 na terça-feira, o fundador da ElevenLabs estava discutindo suas visões de curto e longo prazo do espaço de áudio de IA.

Staniszewski disse que os pesquisadores de sua empresa conseguiram resolver alguns dos desafios da arquitetura do modelo, e esse foco continuará no espaço de áudio pelos próximos um ou dois anos.

“No longo prazo, ele se transformará em commodity – nos próximos anos”, disse Staniszewski. “Mesmo que haja diferenças – o que penso que será verdade para algumas vozes, algumas línguas – por si só, as diferenças serão menores.”

Questionado sobre por que a ElevenLabs se concentraria na construção de modelos se acreditava que eles seriam comoditizados com o tempo, Staniszewski explicou que, no curto prazo, eles ainda eram a “maior vantagem e a maior mudança radical que você pode ter hoje”.

Por exemplo, se as vozes ou interações da IA ​​não soam bem, ainda é um problema que precisa ser resolvido.

“A única maneira de resolver isso é… construir você mesmo os modelos e então, no longo prazo, haverá outros participantes que resolverão isso também”, disse Staniszewski.

Ele também observou que aqueles que procuram casos de uso confiáveis ​​e escaláveis ​​provavelmente ainda usariam modelos diferentes para casos de uso diferentes.

No entanto, nos próximos um ou dois anos, Staniszewski disse que um número crescente de modelos passará para abordagens multimodais ou fundidas.

“Portanto, você criará áudio e vídeo ao mesmo tempo, ou áudio e LLMs ao mesmo tempo em um ambiente de conversação”, disse ele, apontando o Veo 3 do Google como um exemplo do que pode ser alcançado ao combinar modelos.

O fundador disse que a ElevenLabs planeja lançar parcerias com outras empresas e trabalhar com tecnologias de código aberto para ver se a empresa consegue combinar sua experiência em áudio com parte da experiência de outros modelos.

Para a ElevenLabs, o objetivo é focar tanto na construção de modelos quanto em aplicações para criar valor a longo prazo, disse ele.

“Da mesma forma que o software e o hardware foram a magia para a Apple, acreditamos que o produto e a IA serão a magia para a geração dos melhores casos de uso”, acrescentou.

Share this content:

Publicar comentário