Mirelo levanta US$ 41 milhões da Index e a16z para resolver o problema silencioso do vídeo de IA

Mirelo cofounders CJ Simon-Gabriel and Florian Wenzel

Mirelo levanta US$ 41 milhões da Index e a16z para resolver o problema silencioso do vídeo de IA

A IA permite que qualquer pessoa crie vídeos, mas muitas ferramentas de criação de vídeo com IA não têm suporte para áudio. Mirelo está construindo uma IA que adiciona trilhas sonoras para combinar com a ação do vídeo.

No início deste ano, a startup com sede em Berlim lançou o Mirelo SFX v1.5, um modelo de IA que interpreta vídeos para adicionar efeitos sonoros sincronizados (SFX).

Isso atraiu a atenção dos VCs que se preparavam para um revolução generativa da IA ​​em jogos. A startup alemã de dois anos levantou uma rodada inicial de US$ 41 milhões liderada pela Index Ventures e Andreessen Horowitz, aprendeu exclusivamente o TechCrunch.

Este novo capital ajudará a Mirelo a competir de forma mais eficaz na sua categoria emergente. Embora ainda estivesse em modo furtivo e com recursos limitados, grandes empresas como Sony e Tencent lançaram modelos de vídeo para SFX. O mesmo aconteceu com a Kling AI, de propriedade da Kuaishou, fora da China, e OnzeLabsque também é apoiado por a16z.

Embora Mirelo já se diferencie deles por seu foco mais restrito, vencer esses modelos no longo prazo exige que a startup faça contratações adicionais. Ao todo, a startup espera que sua equipe de 10 pessoas “dobre, senão triplique” o número de funcionários até o final do próximo ano, disse o CEO e cofundador da Mirelo, CJ Simon-Gabriel, ao TechCrunch.

Essas novas contratações apoiarão a P&D da Mirelo, bem como sua estratégia de produto e entrada no mercado. A startup publicou seus modelos no Fal.ai e Replicare espera que o uso da API impulsione a maior parte de sua receita no curto prazo, disse Simon-Gabriel. Mas também está investindo na construção de seu espaço de trabalho para criadores, o Mirelo Studio, que poderá eventualmente suportar o uso totalmente profissional.

À medida que a Mirelo se prepara para crescer, a startup e os seus investidores também antecipam preocupações em torno dos dados de formação que têm perseguido outras empresas de IA generativa. De acordo com Georgia Stevenson, que liderou os investimentos da Index, a Mirelo baseou os seus modelos em bibliotecas de sons públicas e adquiridas e está a assinar parcerias de partilha de receitas que respeitam os direitos dos artistas.

É uma tensão inerente às ferramentas generativas de IA, mas Mirelo não está substituindo músicos e designers de som – pelo menos não ainda. Com um modelo freemium incluindo um plano recomendado para criadores ao preço de 20 euros/mês (aproximadamente US$ 23,50), a startup tem como alvo principalmente amadores e prosumers que desejam ativar o som de vídeos gerados por IA.

De acordo com Simon-Gabriel, os criadores não podem beneficiar totalmente deste novo potencial sem áudio.

“George Lucas disse que o som representa 50% da experiência cinematográfica. Não é um exagero”, disse ele. “Na verdade, é um eufemismo. Você pode tirar exatamente as mesmas imagens e o som criará um ambiente completamente diferente, dependendo do som e da música que você colocar nelas.”

Ele e seu cofundador, Florian Wenzel, são pesquisadores e músicos de IA, e a startup tem a geração de música por IA em seu roteiro. Mas Mirelo está vendo mais atração por efeitos sonoros, em parte porque há menos pesquisas acontecendo do que em outros campos de IA, disse Simon-Gabriel.

“É mais fácil construir um verdadeiro fosso aqui e depois capitalizá-lo”, observou ele.

Isso pode valer a pena para Mirelo. Simon-Gabriel recusou-se a divulgar a sua nova avaliação, mas disse que esta aumentou “muito significativamente” em comparação com a sua ronda de pré-semente anteriormente não divulgada. Essa ronda anterior foi liderada pela empresa Atlantic, sediada em Berlim, que também participou no novo financiamento, elevando o total arrecadado pela Mirelo para 44 milhões de dólares e ajudando a colmatar a sua lacuna de recursos.

A startup também é apoiada por anjos que dão credibilidade à sua tecnologia e podem abrir novas portas, incluindo o CEO da Mistral, Arthur Mensch, o diretor científico da Hugging Face, Thomas Wolf, o cofundador da Fal.ai, Burkay Gur, e outros.

Ainda assim, a equipe está ciente de que os vídeos gerados por IA podem não ficar mudos por muito tempo.

Por exemplo, o gerador de vídeo do Gemini agora incorpora trilhas sonoras alimentadas pelo modelo de vídeo para áudio Veo 3.1 da DeepMind. Mas, na verdade, Simon-Gabriel parece justificado. “Agora, de repente, as pessoas percebem: ‘Oh, talvez devêssemos adicionar som.’ Mas, claro, você deve adicionar alguns. É um pouco como filmes mudos versus filmes falados, certo? Faz muita diferença!”

Share this content:

Publicar comentário