Cientistas europeus criam aplicação para transcrever manuscritos antigos
Cientistas europeus inventaram um método simples e extremamente eficaz para transcrever automaticamente manuscritos antigos, graças à inteligência artificial.
O Arquivo do Estado de Tirol, em Innsbruck, na Áustria, é um dos parceiros do projeto READ. A instituição possui uma imensa quantidade de documentos antigos.
"Com uma escrita difícil, penso que a nova técnica não funcionará. Mas, quando se trata de um bela caligrafia, como esta, o novo sistema tem várias vantagens e é um grande ajuda", referiu Christoph Haidacher, diretor da instituição austríaca.
Pequena aplicação revolucionária
O método desenvolvido pelos cientistas do projeto europeu READ baseia-se numa pequena tenda e numa aplicação para smartphone. A partir da aplicação, o utilizador tira uma foto da página em alta resolução, cada vez que vira a página do livro.
"É uma combinação de tecnologia básica com alta tecnologia. Esta tenda é um acessório relativamente simples. Mas funciona com uma aplicação para smartphone que incorpora alta tecnologia e que está ligada à plataforma Transkribus. A aplicação descarrega a imagem no servidor e o servidor realiza o reconhecimento do texto manuscrito", explicou Guenter Muehlberger, coordenador do projeto READ e investigador em digitalização da Universidade de Innsbruck.
A plataforma Transkribus simplifica tarefas que antes implicavam anos e anos de trabalho. O professor Mario Klarer usou a aplicação para transcrever as quinhentas páginas do "Livro dos Heróis", uma antologia de textos medievais germânicos.
"A grande vantagem deste sistema é que fornece uma ligação entre a imagem e o texto e fá-lo de uma forma muito simples, o que permite ao utilizador ter imediatamente uma visão global do texto. É uma forma de diminuir o número de erros. É algo que nenhum outro sistema faz", considerou Mario Klarer, professor de literatura e história cultural da Universidade de Innsbruck.
O servidor da Universidade de Innsbruck usa algoritmos de aprendizagem automática. O utilizador transcreve uma parte do texto manualmente e a partir daí o sistema aprende a identificar os caracteres e termina a tarefa automaticamente. O nível de precisão ultrapassa os 95%. O sistema é capaz de transcrever textos em qualquer língua.
"Forneço ao computador uma imagem e uma parte do texto correspondente. Com base nesses elementos o computador aprende o tipo de escrita e os carateres similares", acrescentou Guenter Muehlberger.
O projeto europeu READ integra vários países: Áustria, Espanha, Alemanha, Suíça, Finlândia, Reino Unido e Grécia. Devido ao sucesso do projeto, a equipa pretende comercializar a plataforma no mundo inteiro.
"Ficámos surpreendidos com o grande sucesso do projeto. Estamos em contactos com imensas instituições que estão interessadas nesta plataforma. De tal modo que para expandir o serviço criámos uma nova empresa", contou o coordenador do projeto europeu.