No mundo digital, as coisas parecem estar sempre acontecendo ao contrário. Considerando que o Google se apressou para digitalizar livros em seu catálogo digital, um grupo de bibliotecas nacionais começou a salvar o que o gigante online deixa para trás. Embora os motores de busca do Google sirvam como o índice na web, eles não arquivam o conteúdo. Muitos sites desaparecem quando seu proprietário fica sem dinheiro ou interesse. Adam Farquhar, responsável por projetos digitais para a Biblioteca Britânica, aponta que o mundo tem, de certa forma, um melhor registro do início do século 20 do que do início do século 21.

Em 1996, Brewster Kahle, um cientista da computação e empresário da Internet, fundou o Internet Archive, uma organização sem fins lucrativos dedicada à preservação de websites. Ele também começou a assediar as bibliotecas nacionais a gentilmente se preocuparem com a preservação da web.

Em 2003, onze bibliotecas nacionais e o Internet Archive lançaram um projeto para preservar informações nascidas digitalmente: o que nunca existiu senão como digital. Chamado International Internet Preservation Consortium (IIPC), que agora inclui 39 grandes bibliotecas institucionais. Mas a tarefa é impossível. Uma das razões é a enorme quantidade de dados na web. O grupo já coletou vários petabytes de dados (um petabyte pode conter cerca de 10 trilhões de cópias deste artigo).

Outra questão é garantir que os dados sejam armazenados em um formato que torna disponível nos séculos vindouros. Manuscritos antigos ainda são legíveis. Mas muito de mídia digital do passado pode ser lido apenas em um punhado de máquinas antigas e frágeis. O objetivo do IIPC é definir um único formato, tornando mais provável que os historiadores do futuro sejam capazes de encontrar uma máquina para leiam os dados. Os editores da Web estão cada vez mais produzindo páginas ricas em conteúdo, baseado em conjuntos de dados complexos. Áudio e programas de vídeo com base em formatos proprietários como o Windows Media Player é um outro desafio. O que acontece se a Microsoft estiver falida e esquecida em 2210?

O maior problema, por enquanto, é o dinheiro. A British Library calcula isto custe a metade que armazenar um documento digital que já foi físico. A Biblioteca do Congresso dos EUA goza de um mandato específico e orçamento para salvar a web. A Biblioteca Britânica está ainda buscando um.

Assim, bibliotecas nacionais decidiram dividir a tarefa. Cada umq tem assumido a responsabilidade para as obras digitais no seu domínio, de nível nacional (os sufixos de endereços web, como “. Fr”). Em países com áreas maiores, tais como Inglaterra e Estados Unidos, os curadores não pode esperar para salvar tudo. Eles estão se concentrando em matérias de interesse nacional, como as eleições, os sites de notícias e do jornalismo cidadão ou de usos inovadores da web.

A morte diária de inúmeros sites trouxe um novo sentido de urgência para bibliotecas, forçadas a se adaptar culturalmente. Uma Prática do passado foi a de usar uma tag a cada novo documento que chegava. Agora a precisão deve ser sacrificada em nome da escala e velocidade. A tarefa começou antes dos novos padrões, metas ou dos orçamentos. E estes ainda podem mudar. Assim como muitos sites, as bibliotecas serão conhecidas como “beta permanente”.

Fonte: The Ecomonist
Tradução: Bibliotecno

Comments

comentários

Powered by Facebook Comments