Vice-presidente do Google quer que site entenda mais de 6 mil línguas. Gigante da web tem acervo de 12 milhões de livros digitalizados.

Texto de Leopoldo Godoy publicado originalmente no G1

Alfred Spector, vice-presidente de engenharia do Google (Foto: Leopoldo Godoy/G1)

Há dez anos, seria impossível imaginar um computador capaz de analisar em alguns segundos o conteúdo de 12 milhões de livros em 400 línguas diferentes. Mas para o vice-presidente mundial de engenharia do Google, o banco de dados de mais de 5 bilhões de páginas digitalizadas que a empresa tem em seus servidores, totalizando cerca de 2 trilhões de palavras, não apenas servirá para arquivar o conhecimento humano, mas também servirá de instrumento para que os computadores possam ajudar no estudo da literatura e da evolução das línguas.

Alfred Spector é um dos principais defensores da tese de que a principal missão do Google é organizar toda a informação do planeta, e transformá-la em universalmente acessível e útil. De acordo com Spector, a facilidade com que os servidores da empresa trabalham com grandes volumes de dados torna possível realizar, em pouco tempo, estudos sobre as diferenças nas traduções de livros do latim para os idiomas modernos ao longo do tempo, ou mesmo entender como a conjugação de alguns verbos mudou nos últimos séculos.

“Há um campo imenso de pesquisa a ser feito nas ciências humanas utilizando os textos históricos que digitalizamos”, diz Spector. “Poderíamos, por que não, comparar todos os livros publicados na Inglaterra no século XIX para encontrar quais são os padrões nos textos que os estudiosos classificam como literatura da Era Vitoriana.”

O executivo aponta como exemplo um estudo realizado na universidade americana de Harvard. A partir da análise computacional de textos em inglês de diversas épocas, desde Beowulf, publicado entre os séculos VII e XI, até Harry Potter, o estudo mostrou como ocorreu a transformação da maioria dos verbos irregulares do inglês arcaico em verbos regulares, com conjungação mais simples.

Tradução
O armazenamento em forma digital de textos e a explosão exponencial do poder dos computadores também criaram a possibilidade do Google se transformar em um tradutor universal, eliminando uma das mais primitivas barreiras de acesso à informação: a língua.

Spector afirma que o Google Translate já consegue fazer traduções que nenhum ser humano vivo teria a capacidade de realizar. “Não creio que exista alguém que leia basco e maltês, ou que consiga adaptar um texto do islandês para o suaíl. Dos 58 idiomas que o Translate domina, tenho certeza que existe algum par de línguas que, para fazer a tradução, seria necessário traduzir uma delas para o inglês ou espanhol, por exemplo, para que outra pessoa fizesse enfim a transcrição para o idioma final.”

Aplicativo do Google traduz textos entre 58 idiomas (Foto: Reprodução)
Aplicativo do Google traduz textos entre 58 idiomas (Foto: Reprodução)

Não que o próprio software do Google já não faça isso, em alguns casos. Para “aprender” uma língua, o sistema é alimentado com documentos ou livros em mais de um idioma. Comparando frase a frase, palavra a palavra, ele cria regras para traduzir os textos e as páginas da internet encontradas pelo usuário.

Documentos da União Europeia, publicados em todas as línguas dos países que integram o bloco, ensinam a máquina a transpor termos do italiano para o espanhol, inglês, alemão ou português. Mas se o computador não receber textos idênticos em romeno e letão, por exemplo, a solução é usar um atalho, traduzindo para o inglês e daí, posteriormente, para o português.

Essa falta de documentos transcritos originalmente em mais de uma língua é o que torna praticamente impossível que o sistema venha, um dia, a falar as mais de seis mil línguas existentes no mundo, de acordo com a organização americana Summer Institute of Linguistics. “Isso não significa que vamos desistir do projeto original, que é fazer o Translate entender qualquer informação em qualquer idioma. Mas precisamos encontrar outra técnica”, diz Spector.

Comments

comentários

Powered by Facebook Comments