Mati Staniszewski, CEO da ElevenLabs, sobre Darth Vader, competição e prevenção do uso indevido
Qual é a divisão entre seus clientes individuais e empresariais?
Hoje está perto de 60/40, 50/50. Era (anteriormente) menor no lado empresarial. No início de 2024 era 90/10. Muito disso está crescendo no lado empresarial, especialmente agora, à medida que co-construímos e trabalhamos mais profundamente com algumas empresas, como a Deutsche Telekom ou a Epic Games.
A ElevenLabs cria chatbots de IA conversacionais e ferramentas criativas que geram áudio com base em prompts. Qual está se movendo mais rápido?
IA conversacional. A parte do autoatendimento que usa IA conversacional é composta principalmente por desenvolvedores. Há um impulso interessante de espaços muito tradicionais para entrar também nesse segmento de conversação. A Epic Games é um ótimo exemplo. Essa foi provavelmente uma das maiores implantações que já fizemos, para trazer para Fortnite uma experiência onde todos poderiam interagir com Darth Vader. Isso foi feito em parceria com o espólio de James Earl Jones. Mas milhões de jogadores tinham Darth Vader ao vivo, com o qual você poderia jogar na hora. Isso não era algo que você pudesse fazer tradicionalmente, passando de linhas estáticas pré-geradas para personagens dinâmicos. Isso foi enorme. Agora estamos vendo que o suporte ao cliente (campo) está se movendo na direção de uma grande disrupção (graças à) IA conversacional.
Como você pode se manter à frente dos grandes jogadores?
Acho que temos algumas das melhores pessoas. E com o texto em fala, (e) com esse discurso em texto, o próximo grande desafio que todos estão tentando resolver é: você pode treinar um modelo omni – portanto, uma combinação de um LLM (modelo de linguagem grande) e fala, que pode produzir uma conversa muito melhor, ao mesmo tempo que garante que ela não seja apenas emocional e rápida, mas também estável. Temos um protótipo interno que é a maior coisa que estamos tentando criar ainda este ano. Mas o objetivo da IA conversacional como produto e da pesquisa que impulsionará esse produto é passar efetivamente no teste de Turing para uma conversa com um agente de IA. Então você sente que é uma conversa real. Essa é a Estrela do Norte.
Achei que já tínhamos passado no benchmark do teste Turing.
Interações de voz pura, como suporte ao cliente, provavelmente passam no teste de Turing, e acho que fomos um dos primeiros a fazer isso com algumas dessas coisas que estamos fazendo. Mas acho que foi uma consciência contextual emocional e (há um) limiar de inteligência mais elevado numa conversa.
Como você lida com as pessoas que usam indevidamente sua tecnologia?
Construímos salvaguardas. Uma delas é a transparência, ou proveniência, de modo que todo (pedaço de) conteúdo pode ser rastreado até a conta. Em segundo lugar está o lado da moderação, onde moderamos tanto o texto quanto a voz. Portanto, moderamos fraudes e golpes, moderamos a segurança infantil. Do lado da voz, moderamos para verificar se não são mal utilizados. A última parte é como podemos levar a tecnologia às pessoas, para que saibam que estão interagindo com a IA. (Existe) um classificador para que as pessoas possam fazer upload de conteúdo de áudio e obter informações sobre (se é) IA ou não. Estamos fazendo parceria com Oxford, Berkeley, Reality Defender e institutos de segurança de IA nos EUA e no Reino Unido para fornecer um classificador a outras organizações. A grande questão é como podemos fornecer toda a tecnologia aos bons atores e, ao mesmo tempo, prevenir os maus atores. É esse equilíbrio.
Share this content:
Publicar comentário