A Wikipédia ainda não está morta, mas a IA coloca grandes desafios

A Wikipédia está, pelo menos por enquanto, a sobreviver à era da inteligência artificial (IA), de acordo com um novo estudo do King's College de Londres, no Reino Unido.
A enciclopédia gratuita e baseada na Internet, lançada em 2001, tem sido objeto de previsões negativas, que sugerem a morte iminente da Wikipédia devido ao aparecimento de ferramentas de IA como o ChatGPT.
Distanciando-se destas previsões negativas, o estudo mostra que as pessoas continuam a utilizar a Wikipédia, embora assinale que a recolha de dados por IA - a recolha em grande escala de dados de sítios Web - e as alterações na forma como os utilizadores acedem à informação colocam desafios à plataforma.
A participação na Wikipédia continua
Publicado na revista Association for Computing Machinery (ACM) Collective Intelligence, o artigo analisou 12 edições linguísticas da Wikipédia - seis com acesso ao ChatGPT e seis sem - de janeiro de 2021 a janeiro de 2024.
Os cientistas não observaram nenhuma queda na atividade da Wikipédia durante os 36 meses. De facto, encontraram um aumento nas visualizações de páginas e no número de visitantes em todas as edições linguísticas, embora o crescimento tenha sido menor nas línguas em que o ChatGPT estava disponível.
Apesar disso, o estudo não encontrou provas de que o ChatGPT tenha reduzido o número de edições ou de editores na Wikipédia.
Os investigadores também assinalaram várias limitações, como a possibilidade de alguns utilizadores terem contornado as restrições do ChatGPT utilizando redes privadas virtuais (VPN), e o estudo não teve em conta a popularidade do ChatGPT em diferentes países.
Estes resultados alinham-se com pesquisas anteriores sobre IA e Wikipédia, mostrando um tráfego estável na enciclopédia livre, ao mesmo tempo que destacam alguns desafios significativos para o futuro da plataforma.
Ameaça da IA à Wikipédia a longo prazo
Embora os dados desafiem a ideia da morte da Wikipédia, os investigadores também sublinham que a enciclopédia está a enfrentar sérias dificuldades.
"Os criadores de IA estão a deixar os seus scrapers à solta na Wikipédia para os treinar com dados de alta qualidade, aumentando o tráfego para níveis em que os servidores da Wikipédia estão a ter dificuldades em acompanhar", afirmou Elena Simperl, professora de ciências informáticas na King's e codiretora do Instituto de Inteligência Artificial da King's, num comunicado.
Elena Simperl observou ainda que os conteúdos gerados pela IA recorrem frequentemente à Wikipédia sem lhe atribuírem o devido crédito, desviando o tráfego da enciclopédia em linha.
A este respeito, o colega de Simperl e primeiro autor do estudo, Neal Reeves, apelou a um "novo contrato social" entre as empresas de IA e a Wikipédia, um contrato em que a plataforma pudesse manter o controlo sobre o seu conteúdo, permitindo ao mesmo tempo a sua utilização para o treino de IA.
O artigo foi publicado no mesmo dia em que a Wikimedia Deutschland, o ramo alemão da fundação que gere a Wikipédia, anunciou o Wikidata Embedding Project - uma nova base de dados concebida para facilitar o acesso dos utilizadores, e especialmente dos modelos de IA, ao conteúdo da Wikipédia.
Com este sistema, os programadores de IA poderão utilizar conhecimentos verificados pelos editores da Wikipédia, em vez de se basearem apenas em páginas extraídas.
Today