Recentemente, um estudo publicado no site “arXiv” trouxe à tona uma discussão sobre a coleta de dados em plataformas de comunicação pública, como o Discord. A pesquisa, intitulada “Discord revelado: um conjunto abrangente de dados de comunicação pública”, visa criar um banco de dados para pesquisas em ciências sociais. O estudo gerou controvérsia ao utilizar dados de conversas públicas, levantando questões sobre privacidade e segurança.
O Discord, uma plataforma popular entre adolescentes para comunicação por texto, voz e vídeo, possui cerca de 200 milhões de usuários. A empresa afirma ter equipes dedicadas a combater atividades ilegais, mas a coleta de dados realizada pelos pesquisadores gerou preocupações entre os usuários, que questionaram a segurança de suas informações pessoais.
Como os dados do Discord foram coletados?
Os pesquisadores utilizaram funcionalidades do próprio Discord para acessar dados de grupos públicos, conforme os termos de uso da plataforma. O recurso “Discovery” permitiu que eles navegassem por servidores públicos e visualizassem mensagens sem precisar participar dos grupos. Além disso, a API do Discord foi utilizada para baixar dados em massa, que foram posteriormente tratados com técnicas de anonimização para proteger a identidade dos usuários.
Discord e a questão do consentimento na coleta de dados
Apesar de os dados serem públicos e a API ser uma ferramenta oficial do Discord, a empresa afirmou que a extração de dados sem consentimento escrito viola seus Termos de Serviço. A empresa está investigando a atividade e promete tomar medidas para proteger a privacidade dos usuários. A empresa destacou que, embora os pesquisadores tenham adotado medidas para anonimizar os dados, a ação ainda infringe suas políticas.

O estudo com dados do Discord é eticamente adequado?
Diogo Cortiz, professor da PUC-SP e especialista em tecnologia, analisou o estudo e considera a pesquisa legítima. Ele argumenta que a utilização da API oficial do Discord para acessar canais e servidores públicos foi feita de forma regular. Cortiz também ressalta que os pesquisadores seguiram critérios de anonimização para proteger a identidade dos usuários, tornando o projeto eticamente adequado.
Todo conteúdo público online está aberto para coleta?
Segundo Cortiz, nem todo conteúdo público pode ser coletado indiscriminadamente. No caso do estudo, os pesquisadores utilizaram dados acessíveis pela API oficial do Discord, respeitando os termos de uso. Ele compara a situação com o Twitter, que também permitia a extração de dados através de sua API, desde que certos requisitos fossem cumpridos. Isso demonstra a complexidade e as nuances envolvidas na coleta de dados em plataformas digitais.
Em suma, o estudo sobre dados públicos no Discord levanta importantes questões sobre privacidade, consentimento e a ética na pesquisa de dados. Enquanto a plataforma investiga a situação, a discussão sobre a coleta de dados em ambientes digitais continua a evoluir, destacando a necessidade de um equilíbrio entre pesquisa e proteção dos usuários.