


A DeepSeek, empresa chinesa conhecida por disponibilizar modelos avançados de IA com código aberto, anunciou o lançamento do DeepSeek-V3.2-Exp, seu novo modelo experimental de linguagem. Segundo a companhia, esta versão representa uma “etapa intermediária em direção à nossa arquitetura de próxima geração” e traz inovações significativas em eficiência e custo de processamento.
Entre os principais avanços está a introdução do DeepSeek Sparse Attention (DSA), um mecanismo de atenção esparsa de granularidade fina projetado para reduzir drasticamente o custo computacional em aplicações com contextos longos, mantendo a qualidade dos resultados. Essa mudança possibilitou à empresa cortar mais de 50% dos preços da API em cenários de uso intensivo, ampliando o acesso para desenvolvedores e empresas que lidam com grandes volumes de dados.
Outro destaque é a otimização do modelo para hardware nativo chinês, incluindo compatibilidade com chips Ascend da Huawei, além do suporte contínuo a GPUs Nvidia. O DeepSeek-V3.2-Exp oferece contexto de até 128 000 tokens e modos distintos de operação (“Non-thinking” e “Thinking”), que influenciam a forma como o modelo processa e responde às solicitações.
Embora seja uma versão experimental, o desempenho anunciado é comparável ao modelo anterior V3.1-Terminus, com melhorias em custo-benefício e eficiência. A novidade já está disponível para uso via plataforma web, aplicativo e API da DeepSeek, reforçando a estratégia da empresa de acelerar a adoção global de suas tecnologias.
O lançamento do V3.2-Exp sinaliza a ambição da DeepSeek de disputar espaço com os grandes players internacionais de IA, ao mesmo tempo em que fortalece a autonomia tecnológica chinesa — especialmente no uso de hardware local e soluções abertas.