DeepSeek lança atualização do seu modelo de IA com capacidade aumentada

Segundo a empresa, versão aprimorada do V3 tem uma janela de contexto mais longa, pode considerar uma quantidade maior de informações para qualquer consulta e permite que ele mantivesse conversas mais longas

Por

Bloomberg — A DeepSeek anunciou uma atualização para seu modelo de inteligência artificial V3 mais antigo na terça-feira (19), declarando que uma versão aprimorada está pronta para testes.

A V3.1 tem uma janela de contexto mais longa, de acordo com uma postagem da DeepSeek em seu grupo oficial do WeChat, o que significa que ela pode considerar uma quantidade maior de informações para qualquer consulta.

Isso poderia permitir que ele mantivesse conversas mais longas com melhor recuperação, por exemplo. A startup sediada em Hangzhou não ofereceu muito mais detalhes sobre a atualização e não publicou documentação nas principais plataformas.

Leia também: Seis meses do abalo da DeepSeek: como as ‘Sete Magníficas’ se reacomodaram

A velocidade e a popularidade dos modelos da DeepSeek desafiaram as empresas estabelecidas nos EUA, como a OpenAI, e demonstraram como as empresas chinesas podem fazer avanços na inteligência artificial aparentemente por uma fração do custo.

Seu modelo R1, que superou o desempenho de vários rivais ocidentais em métricas padronizadas, surpreendeu o mundo quando foi revelado no início deste ano.

Leia também: Ameaça? DeepSeek veio para democratizar o uso de agentes de IA, diz diretor da Nvidia

Os fãs do DeepSeek ainda aguardam o lançamento do R2, o sucessor do R1, com a mídia local culpando o perfeccionismo e as falhas do CEO Liang Wenfeng pelo atraso.

Veja mais em bloomberg.com