DeepSeek: app chinês de IA destrona ChatGPT na App Store e abala mercado de tech
Modelo chama atenção ao prometer performance similar a tecnologias bilionárias com fração do custo, causando queda nas ações da Nvidia
Uma startup chinesa está sacudindo o mundo da IA: o DeepSeek não só ultrapassou o ChatGPT como app mais baixado da App Store nos EUA, como também levantou questões sobre todo o modelo de negócio do setor ao afirmar que desenvolveu seu modelo por apenas US$ 6 milhões.
🎯 Por que importa: Enquanto gigantes como OpenAI gastam mais de US$ 100 milhões para treinar modelos como GPT-4, a DeepSeek afirma ter conseguido resultados similares com menos recursos e chips – em parte porque as restrições americanas a forçaram a ser mais eficiente.
Código aberto: Diferente dos modelos proprietários dominantes, o DeepSeek-R1 é totalmente open source sob licença MIT – ou seja, pode ser estudado, modificado e usado comercialmente sem restrições. Isso permitiu que desenvolvedores rodassem o modelo em hardware modesto e verificassem suas capacidades independentemente.
🚀 DeepSeek-R1 is here!
— DeepSeek (@deepseek_ai) January 20, 2025
⚡ Performance on par with OpenAI-o1
📖 Fully open-source model & technical report
🏆 MIT licensed: Distill & commercialize freely!
🌐 Website & API are live now! Try DeepThink at https://t.co/v1TFy7LHNy today!
🐋 1/n pic.twitter.com/7BlpWAPu6y
Na prática, o DeepSeek oferece:
- Performance similar a GPT-4 e Claude 3.5
- Código-fonte aberto para escrutínio público
- Foco em tarefas complexas como matemática e programação
- App e web gratuitos para uso geral
- API 50x mais barata que concorrentes
- Possibilidade de rodar localmente em hardware mais simples
💰 Nos números:
- US$ 6 milhões para desenvolver (vs. US$ 100M+ do GPT-4)
- 2.000 chips especializados (vs. 16.000 da concorrência)
- US$ 0,14 por milhão de tokens (vs. US$ 7,5 da OpenAI)
🔬 Nos bastidores: A empresa conseguiu driblar as restrições americanas estocando chips NVIDIA A100 antes do banimento e combinando-os com processadores menos potentes que ainda podem ser importados. A necessidade de ser eficiente com recursos limitados pode ter levado a inovações significativas no treinamento do modelo.
🌐 Contexto: Em 2023, os Estados Unidos proibiram a exportação de chips avançados de IA para a China, incluindo os poderosos processadores da Nvidia utilizados no treinamento de grandes modelos de linguagem. A medida visava manter a liderança americana no desenvolvimento de inteligência artificial, mas acabou forçando empresas chinesas a buscarem alternativas mais eficientes.
📉 Impacto: O sucesso repentino do app causou queda de 12% nas ações da Nvidia, levantando dúvidas sobre projetos bilionários como o Stargate (US$ 500 bilhões).
O que vem por aí: Se as afirmações da DeepSeek se provarem verdadeiras, todo o modelo de negócio das big techs de IA – baseado em data centers caríssimos – pode precisar ser repensado.
Comentários
Sua voz importa aqui no B9! Convidamos você a compartilhar suas opiniões e experiências na seção de comentários abaixo. Antes de mergulhar na conversa, por favor, dê uma olhada nas nossas Regras de Conduta para garantir que nosso espaço continue sendo acolhedor e respeitoso para todos.