Nova Sonic é a resposta da Amazon à nova geração de modelos conversacionais com voz natural. Além de maior precisão e latência ultrabaixa, modelo estreia com API de streaming e já integra a nova Alexa+.
Nova Sonic é a resposta da Amazon à nova geração de modelos conversacionais com voz natural. Além de maior precisão e latência ultrabaixa, modelo estreia com API de streaming e já integra a nova Alexa+.
Amazon apresenta Nova Sonic, inteligência artificial de voz com fluência quase humana e latência inferior ao GPT-4o
A Amazon revelou o Nova Sonic, um modelo de inteligência artificial com voz nativa que promete revolucionar a interação homem-máquina. Capaz de compreender e responder com fluência natural, o Sonic oferece desempenho superior ao GPT-4o da OpenAI e a soluções da Google — com custo até 80% menor, segundo a empresa.
Integrado à plataforma Amazon Bedrock, o Sonic estreia com uma API de streaming bidirecional que permite interações em tempo real. A latência percebida de apenas 1,09 segundo supera a de seus principais concorrentes, com destaque para sua precisão em múltiplos idiomas e ambientes barulhentos.
Em testes de benchmark como o Multilingual LibriSpeech, o modelo atingiu taxa de erro de palavras (WER) de 4,2%. Em situações desafiadoras, como diálogos com vários interlocutores e ruído de fundo, foi 46,7% mais preciso que o GPT-4o-transcribe.
Segundo Rohit Prasad, líder da divisão de AGI da Amazon, o diferencial do Sonic está na capacidade de orquestrar ações: ele sabe quando acessar dados externos, APIs ou ferramentas específicas. A tecnologia já está presente na nova Alexa+, que ganha robustez e interação mais fluida com o usuário.
Além disso, o Nova Sonic simula pausas naturais, interpreta falas com erros e gera transcrições em tempo real — tornando-o ideal para aplicações corporativas, educacionais e de suporte ao cliente.
O modelo faz parte da estratégia da Amazon rumo à AGI (inteligência artificial geral), com sistemas capazes de executar qualquer tarefa humana no ambiente digital. A linha Nova inclui ainda o Nova Act, com acesso à web e integração com funções como o Buy for Me na Alexa+.
Com o Sonic, a Amazon se posiciona com força na corrida pela IA multimodal, mirando futuros avanços em imagem, vídeo e sensores físicos.
Continue a sua leitura:
O futuro acontece aqui: esteja entre os primeiros a receber insights, tendências e oportunidades que moldam o mercado.
Assine a newsletter do AI Business Journal e receba, toda semana, os principais insights,
movimentos estratégicos e tendências que estão transformando
o mundo dos negócios com inteligência artificial.