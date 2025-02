Confira quais dados e como a DeepSeek os coleta - Foto: Shutterstock

A nova inteligência artificial chinesa, DeepSeek, se tornou um dos apps mais populares do mundo, ocupando a primeira posição em downloads nos Estados Unidos e no Brasil. Porém, mesmo tendo uma ascensão avassaladora, o serviço vive uma polêmica atualmente em relação à sua forma de coletar dados dos usuários.

Em um relatório divulgado pela Wiz, software de segurança em nuvem, na quarta-feira, 29, foram demonstrdos vários vazamentos de informações sensíveis causados pela startup chinesa. De acordo com o documento, a empresa havia deixado um de seus principais bancos de dados expostos na Internet. No todo, mais de um milhão de logins do sistema, envios de prompts e tokens de autenticação de API se tornaram públicos.

Somado a isso, a Itália decidiu suspender os serviços no país na quarta-feira, 29, removendo o aplicativo da Google Play Store e App Store até que a startup de respostas os órgãos reguladores de Roma. Outro país que estuda este caso é a Irlanda que fez questionamentos sobre o tema.

Por que esta coleta acontece?

Toda plataforma digital coleta informações de seus usuários, seja em serviços pagos ou gratuitos, a única coisa que muda, é como cada informação é utilizada. No caso das IAs, isto valendo para todas, não só para a DeepSeek , por padrão, várias informações são utilizadas para criar e agregar novos conjuntos de dados para refinar os modelos da linguagem, somente caso haja uma cláusula dizendo o contrário.

Logo, além de saber quais as preferências de cada usuário, para direcionar melhor cada propaganda, os chatbots podem utilizar padrões de digitação com as expressões preferidas de cada pessoa para aproximar a experiência de cada usuário.

Quais dados a DeepSeek coleta?

As informações que a DeepSeek documenta são bem parecidas com as do ChatGPT, Gemini e Meta AI, sendo separadas em dois tipos de dados: os que são coletados automaticamente, e os que são colhidos com a permissão do usuário.

* cadastrais: nome do usuário, e-mail, endereço, número de telefone, data de nascimento, senha, além de qualquer outra informação preenchida durante o cadastro inicial;

* interações com o bot: todos os tipos de conversa com o DeepSeek é catalogada, armazenada e utilizadas para refinar a inteligência artificial

* dados durante o suporte: caso um usuário esteja relatando algum problema com o DeepSeek e necessite buscar o Suporte ao Usuário, as informações dessas conversão serão armazenadas e estudadas.

Além das informações que são disponibilizadas pelo usuário, o DeepSeek possui ferramentas que coletam dados de forma automática, atuando na parte dos metadados, traçando perfis mais precisos. Segundo os termos de privacidade da DeepSeek, os dados coletados automaticamente são:

* informações técnicas: dados do dispositivo que acessou o serviço, como marca, modelo, sistema operacional, idioma, localização, padrões e ritmo de digitação, IP, DNS, e outros protocolos. Relatórios de erro, crashes e outros bugs também entram nessa categoria;

* informações de uso: todas as formas que a plataforma é utilizada, como criar textos, realizar pesquisas, transcrever ou resumir artigos, e assim por diante;

* cookies: o DeepSeek utiliza cookies e outras tecnologias de rastreamento para coletar informações sobre a atividade do usuário e suas preferências;

* informações de pagamento: caso o usuário faça algum pagamento na plataforma, ela coleta a ordem de pagamento, históricos de transações, além de eventuais interações com equipes de suporte e pós-venda.

Visto que a DeepSeek seja integrada a outras plataformas, como Google, AppStore e outras lojas, os termos descrevem que a ferramenta coleta as informações direcionadas desses parceiros ao realizar o login vinculando as contas. Além disso, anunciantes, empresas de telemetria de tráfego e outros eventuais parceiros também fornecem os dados de usuários cadastrados.

Como a DeepSeek utiliza os dados?

De acordo com a startup, estas informações são utilizadas inicialmente para melhorar as capacidades do serviço. O motivo, é entender quais as principais demandas dos usuários e os pontos mais recorrentes nos chats.

Mas vale lembrar que, quando informações pessoais e sensíveis são compartilhadas, eles são repassados de forma agregada e anônima, sendo impossível a identificação de pessoas específicas. A única exceção é em casos de investigações criminais, principalmente de situações nas quais seja identificado o risco iminente à vida do usuário ou de terceiros.