Deepseek R1 Explicado Para Uma Criança de Dez Anos

Já se passaram mais de dois anos desde o lançamento do ChatGPT, mas não houve um momento de impacto comparável a este, marcado pela chegada do DeepSeek R1. Neste artigo, vamos explorar o que é o DeepSeek R1, como ele funciona e por que ele causou um alvoroço, especialmente no mercado de ações dos EUA.

O Surgimento do DeepSeek R1

Uma empresa chinesa chamada DeepSeek lançou recentemente um modelo de Inteligência Artificial (IA) denominado R1. Este modelo tem sido completamente disruptivo; em apenas um dia, ele supostamente causou uma queda no mercado de ações dos EUA, retirando um trilhão de dólares em valor de mercado.

O motivo para esse impacto significativo reside na alegação da DeepSeek de que treinaram o DeepSeek R1 por cerca de US$ 5 milhões. Para contextualizar, o modelo mais avançado da OpenAI no momento, o GPT-4o, custou centenas de milhões, senão bilhões, de dólares para ser treinado. Grandes empresas como Google e Meta também estão investindo somas enormes no treinamento de seus modelos.

O fato de uma startup afirmar ter alcançado um desempenho comparável aos melhores modelos disponíveis no mercado com um investimento tão reduzido (US$ 5 milhões) chocou o mundo da tecnologia.

O que é o DeepSeek R1 e Como Ele Funciona?

O DeepSeek R1 pode ser acessado gratuitamente no site chat.deepseek.com. A principal diferença funcional dele em comparação com o ChatGPT padrão reside no processo de resposta:

  • Ao digitar um prompt, em vez de responder imediatamente, o R1 primeiro “pensa” sobre o processo, exibindo essa etapa de raciocínio antes de fornecer a resposta final.

Essa capacidade de raciocínio pode ser complementada com a opção de pesquisa na web, que pode ser ativada no site. Um exemplo prático mostrado foi a solicitação de uma análise sobre a compra de ações da Tesla.

O processo de “pensamento” (a seção cinza no resultado) levou cerca de 15 segundos antes que a resposta fosse gerada (a seção branca). Essa fase de reflexão é crucial.

Raciocínio Avançado (Chain of Thoughts)

O DeepSeek R1 é classificado como um modelo de raciocínio avançado, semelhante ao GPT-4o da OpenAI (que alimenta o ChatGPT Plus, por exemplo). Essa técnica de raciocínio passo a passo é conhecida no mundo da IA como “Chain of Thoughts” (Cadeia de Pensamentos). Nela, a IA simula o processo de pensamento humano antes de responder, o que geralmente requer tempo, podendo levar de dois a três minutos, dependendo da complexidade da pergunta.

Um ponto chave é a integração de funcionalidades:

  • No DeepSeek R1, é possível ativar a pesquisa na web e o raciocínio simultaneamente.
  • No ChatGPT (mesmo nas versões pagas), ao utilizar o raciocínio, a função de pesquisa não está disponível ao mesmo tempo.

Um exemplo de pergunta complexa que exige essa abordagem de raciocínio envolveu a busca por taxas de inflação atuais nos EUA, Reino Unido e Canadá, seguida pela sugestão de qual moeda tenderia a se fortalecer mais até o final do ano, com justificativas.

Modelos de raciocínio como o R1 ou o GPT-4o são ideais para:

  • Tomada de decisões.
  • Resolução de problemas.
  • Raciocínio ético.
  • Fazer previsões futuras.

DeepSeek R1 vs. Modelos Pagos da OpenAI

A OpenAI oferece o modelo GPT-4o para raciocínio dentro do chat.gp.com, mas isso exige um upgrade pago (cerca de US$ 20 por mês), e seu uso é frequentemente limitado. Há também versões mais avançadas como o 01 Pro Mode, acessíveis por até US$ 200 mensais.

Em contraste, o DeepSeek R1, que oferece raciocínio e pesquisa combinados, está 100% gratuito no site da DeepSeek, sem sequer uma opção de pagamento aparente no momento.

Open Source vs. Closed Source

Outro fator de disrupção do DeepSeek R1 é que ele é um modelo de código aberto (open source).

  • Open Source: O código está disponível para download, permitindo que qualquer pessoa o baixe e execute localmente em seu próprio computador, dependendo da capacidade do hardware.
  • Closed Source: Como os modelos da OpenAI, o código é proprietário da empresa. Para utilizá-los, é necessário acessar o site da provedora, muitas vezes mediante pagamento, e não é possível rodá-los localmente.

A capacidade de baixar e rodar localmente um modelo de ponta como o R1 representa uma mudança fundamental no cenário da IA, pois desafia o modelo de negócios baseado em acesso via web pago.

Considerações de Privacidade e Termos de Uso

Devido à empresa ser baseada na China, a política de privacidade e os termos de uso do DeepSeek R1 merecem atenção:

Política de Privacidade

  • Os dados são armazenados em servidores localizados na República Popular da China. Isso pode gerar preocupações para usuários em jurisdições com leis de proteção de dados mais rigorosas (como a União Europeia).
  • Há uma ressalva de que dados armazenados na China podem estar sujeitos à vigilância do governo local.

Termos de Uso

  • Coleta Ampla de Dados: A empresa coleta dados extensivos do usuário, incluindo padrões de pressionamento de teclas, endereços IP, IDs de dispositivos e dados de fontes de terceiros, como anunciantes. A coleta pode ser considerada excessiva para um serviço de chatbot.
  • Retenção de Dados: Os dados são retidos “pelo tempo necessário”, sem um prazo ou limite claro especificado, o que pode levantar preocupações sobre a retenção prolongada de informações pessoais.
  • Ausência de Menção à Criptografia: A política não detalha se informações sensíveis (como senhas ou dados de pagamento) são criptografadas, o que deixa a segurança incerta.

Censura

Notou-se um possível nível de censura em tópicos sensíveis. Ao perguntar sobre eventos politicamente sensíveis (como o ocorrido na Praça da Paz Celestial em 1989), o modelo evitou a questão e redirecionou a conversa para tópicos como matemática, codificação e lógica. Em contrapartida, o ChatGPT forneceu uma resposta para a mesma pergunta.

Para aqueles que desejam evitar essas questões de privacidade, o fato de o R1 ser open source permite que o modelo seja baixado e executado localmente, tirando a dependência do site oficial.

Resumo da Disrupção

O lançamento do DeepSeek R1, um modelo de raciocínio avançado que rivaliza com o GPT-4o da OpenAI, mas treinado por uma fração do custo (US$ 5 milhões) e disponibilizado como código aberto, é um divisor de águas. Isso ameaça o modelo de negócios de empresas que gastam bilhões em infraestrutura e treinamento, pois torna a tecnologia de ponta acessível e executável em hardware local.

Perguntas Frequentes

  • O que é o DeepSeek R1?
    É um modelo de inteligência artificial desenvolvido pela empresa chinesa DeepSeek, projetado para realizar tarefas de raciocínio avançado, comparável aos melhores modelos do mercado.
  • Qual a principal diferença entre o R1 e o ChatGPT padrão?
    O R1 utiliza a técnica “Chain of Thoughts” (Cadeia de Pensamentos), processando o raciocínio passo a passo antes de dar a resposta, ao contrário da resposta imediata do ChatGPT básico.
  • Por que o DeepSeek R1 causou impacto no mercado de ações?
    Devido à alegação de que o modelo foi treinado por apenas US$ 5 milhões, contrastando com os bilhões gastos por grandes concorrentes para desenvolver IAs de desempenho similar.
  • É possível usar o DeepSeek R1 gratuitamente?
    Sim, o acesso ao modelo R1 através do site chat.deepseek.com é oferecido gratuitamente.
  • Como as preocupações de privacidade são abordadas no DeepSeek R1?
    Os dados são armazenados na China e podem estar sujeitos à vigilância governamental local. Além disso, há coleta extensa de dados do usuário e retenção indefinida, com pouca clareza sobre criptografia.
  • Qual a vantagem do código aberto (open source) do R1?
    Permite que o modelo seja baixado e executado localmente no computador do usuário, oferecendo maior controle sobre a privacidade e eliminando a dependência de plataformas web pagas.