Com a API Live, os desenvolvedores têm as ferramentas essenciais para criar aplicativos e agentes inteligentes capazes de processar streaming de áudio, vídeo e texto com latência incrivelmente baixa. Essa velocidade é fundamental para criar experiências verdadeiramente interativas, abrindo portas para soluções de suporte ao cliente, plataformas educacionais e serviços de monitoramento em tempo real.
Link to Youtube Video (visible only when JS is disabled)
Recentemente, anunciamos o lançamento da prévia da API Live para modelos Gemini, um passo importante para que os desenvolvedores possam criar aplicativos robustos e escalonáveis em tempo real. Experimente os recursos mais recentes agora mesmo usando a API Gemini no Google AI Studio e na Vertex AI.
Desde nosso lançamento experimental em dezembro, ouvimos atentamente o feedback de vocês e incorporamos novos recursos para tornar a API Live pronta para produção. Veja todos os detalhes na documentação da API Live:
session_resumption
) para reconectar e retomar de onde você parou.GoAway
do servidor indicando quando uma conexão está prestes a ser encerrada, para permitir um tratamento gradual antes do encerramento.activityStart
, activityEnd
) para o controle manual de voltas.speechConfig
.usageMetadata
de mensagens do servidor, separadas por modalidade e fases de prompt/resposta.Para inspirar seu próximo projeto, apresentamos os desenvolvedores que já estão aproveitando o poder da API Live em aplicativos:
A Daily integra o suporte da API Live aos SDKs de código aberto do Pipecat para Web, Android, iOS e C++.
Ao usar o poder da API Live, o Pipecat da Daily criou um jogo de adivinhação de palavras baseado em voz, o Word Wrangler. Teste suas habilidades de descrição nessa versão habilitada por IA dos jogos de palavras clássicos e veja como você mesmo pode criar o seu!
O LiveKit integra o suporte da API Live aos agentes do LiveKit. Esse framework para a criação de agentes de IA de voz fornece uma plataforma totalmente de código aberto para a criação de aplicativos agênticos do lado do servidor.
”Até a API Live, nenhum outro LLM oferecia uma interface para desenvolvedores que pudesse ingerir streaming de vídeo diretamente.”
– Russell d'Sa, CEO
Confira a demonstração para ver como eles criaram um copiloto de IA capaz de navegar pela Internet junto com você enquanto compartilha ideias sobre o que ele pode ver em tempo real.
O Hey Bubba é um aplicativo de IA agêntica que prioriza a voz, desenvolvido especificamente para motoristas de caminhão. Por meio da API Live, ele permite uma comunicação por voz perfeita e multilíngue, permitindo que os motoristas o operem sem o uso das mãos. As principais funcionalidades incluem:
A API Live habilita a interação dos motoristas (utilizando chamadas de função e o armazenamento de contexto em cache para consultas como coletas futuras) e a capacidade de interação do Bubba durante chamadas telefônicas para negociações e agendamentos. Isso faz do Hey Bubba uma ferramenta de IA abrangente para o maior e mais diversificado setor de mão de obra dos EUA.
Link to Youtube Video (visible only when JS is disabled)
A API Live está pronta para habilitar seu próximo aplicativo de voz em tempo real. Para começar:
Agora é só partir para a diversão e começar a programar!