Muito além do backup: bem-vindo à era da preservação digital

Avanço rápido da tecnologia enseja desafio de preservar acessibilidade de arquivos apesar da obsolescência de ferramentas de hardware e software. Iniciativas como a Política de preservação Digital da Unesp buscam mudar cultura da universidade no manejo de objetos digitais.

Imagine a seguinte situação: pouco mais de dez anos atrás, você decidiu fazer um backup das suas fotos de família gravando-as em um CD. Desde então, o computador que você utilizava na época ficou pelo caminho, quebrado ou trocado. Hoje, você trabalha, diverte-se e se comunica com o mundo por meio de um notebook que não possui uma unidade de leitura de CD. Como recuperar agora as fotos antigas?

Diante do velocíssimo avanço da tecnologia digital, que está constantemente despachando para o limbo da obsolescência todo tipo de equipamento, programa de computador, formato de arquivo e suporte de armazenamento, torna-se fundamental encontrar meios para preservar os arquivos digitais que também assegurem a possibilidade de acessá-los no futuro – mesmo que as tecnologias então utilizadas venham a ser outras. Esta preocupação deu origem ao conceito de preservação digital, um conjunto de processos técnicos e de gestão pensados para cuidar dos acervos digitais das instituições.

Embora esse campo seja mais frequentemente associado ao trabalho de arquivistas e bibliotecários, ele engaja profissionais de diferentes áreas do conhecimento, de desenvolvedores a advogados. Cabe a eles encontrar e implementar as melhores maneiras para garantir que fotos, vídeos, documentos de texto e muitos outros tipos de objetos digitais permaneçam autênticos, íntegros e acessíveis ao público a longo prazo, ainda que o material de hardware ou o software nos quais foram criados caiam em desuso.

“Preservação digital não é só fazer  backups. É preciso manter os objetos digitais atualizados e, principalmente, assegurar a continuidade do acesso a eles”, diz José Carlos Abbud Grácio, presidente da Comissão Permanente de Preservação Digital (CPPD) da Unesp e professor colaborador do Programa de Pós-Graduação em Ciências da Informação da Unesp-Marília.

Ele lidera os esforços para implementar os processos de preservação previstos na Política de Preservação Digital para Documentos de Arquivo da Unesp, aprovada em 2018 pelo conselho universitário. Essa política estabelece as diretrizes para cuidar das multivariadas informações digitais que são produzidas todos os dias pela comunidade acadêmica. Um acervo que inclui  material didático, registros de videoconferências, revistas eletrônicas, teses e dissertações, hotsites de eventos, processos, ofícios, diplomas, e-mails, páginas Web, programas da TV Unesp, podcasts, notícias, acervos digitais de museus e centros de documentação… A lista é imensa, e, desde a pandemia, tem crescido de forma acelerada.

“A pandemia acelerou as mudanças na esfera digital. Antigamente ninguém queria fazer reunião por videoconferência e muitos professores não queriam dar aula desse modo. Hoje é o contrário, as pessoas preferem falar por videoconferência a viajar, e a pós-graduação oferece muitas disciplinas neste sistema. O resultado é um aumento na produção de documentos em formato digital, vídeo, áudio… É preciso preservar todo esse material”, diz Grácio. Ele ressalta que a necessidade de preservação se relaciona tanto com o valor histórico dos materiais quanto a exigências legais, como a necessidade da Unesp de atender aos parâmetros da Lei de Acesso à Informação, e a obrigação de abrigar, permanentemente, os processos de estudantes egressos.

Para implementar as novas diretrizes, a CPPD tem desenvolvido diversas ações que vão de treinamentos para os funcionários técnico-administrativos a projetos-piloto de preservação de acervos digitais. As iniciativas também incluem parcerias com outras universidades, por meio da Rede Cariniana – uma rede de serviços de preservação digital ligada ao Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT), órgão do Ministério da Ciência, Tecnologia e Inovação. A cooperação, aliás, segue uma das diretrizes da política de preservação digital da Unesp.

Acesso, integridade, autenticidade

Um projeto-piloto da CPPD é a criação de um repositório com os registros de vídeo das reuniões do conselho universitário. Os vídeos das reuniões são disponibilizados no YouTube, para acesso público. O problema é que, como as únicas cópias desses arquivos estavam armazenadas na plataforma do Google, havia o risco de que viessem a se extraviar eventualmente. “Se amanhã o YouTube fechasse, perderíamos [o registro das] reuniões da Unesp”, diz Grácio. Mas será que esse risco é real?  “Quem garante que não é? Ninguém dizia que o Orkut iria fechar, mas aconteceu”, lembra. Com essa perspectiva, a CPPD fez o download de todos os vídeos que estavam no YouTube e salvou os arquivos nos servidores da Unesp. Os originais foram guardados em um ambiente digital protegido. Outras cópias produzidas foram destinadas para um repositório público que está para ser lançado.

Armazenar cópias diversas de um mesmo arquivo em dois ambientes diferentes é uma prática comum de preservação digital, que permite proteger as informações de ataques de hackers e, ao mesmo tempo, assegurar o acesso público a elas. Isto, porém, é apenas uma pequena parte das iniciativas. Grácio explica que outras frentes de atuação envolvem a montagem de um data center e o treinamento de pessoal. Também é essencial que, sempre que necessário, os profissionais encarregados de sua guarda procedam à migração dos arquivos digitais para formatos mais novos para que as informações continuem acessíveis para os usuários de equipamentos mais atualizados. Um exemplo bastante familiar vem dos documentos de texto gerados pelo Word, que já tiveram a extensão .DOC e depois passaram a ser salvos como arquivos do tipo .DOCX. Além disso, é desejável que a conversão dos arquivos seja feita preferencialmente para formatos abertos, compatíveis com software livre ou, ao menos, com uma ampla gama de programas de computador.

Também é importante que o conteúdo dos arquivos preservados seja descrito por meio de metadados. Os metadados funcionam como uma espécie de etiqueta que permite recuperar a informação contida no arquivo. No projeto-piloto com os vídeos do Conselho Universitário, a CPPD contou com uma empresa contratada e com o trabalho dos alunos de graduação do curso de Arquivologia da Unesp-Marília para escrever as descrições nos metadados. Cada vídeo é acompanhado por uma etiqueta que conta quem foram os participantes da reunião, a data de realização e as pautas em discussão, vinculando os assuntos debatidos com a minutagem do vídeo. Com essas descrições, o usuário conseguirá conduzir buscas mais precisas no novo repositório de vídeos do que é possível fazer no canal da Unesp no YouTube.

Os metadados também servem para atestar a integridade e a autenticidade dos documentos, pois registram a origem do arquivo e cada modificação feita, descrevendo todo seu ciclo de vida. É também por meio deles que se verifica a validade da assinatura eletrônica de um documento.

Diferentes documentos possuem ciclos de vida com durações distintas. As gravações das bancas dos concursos para docentes precisam ser preservadas por alguns anos. Já as teses e dissertações necessitam de armazenamento indefinidamente. O descarte de arquivos digitais que não mais precisam ser preservados segue basicamente os mesmos critérios utilizados para os arquivos de papel: o documento descartado será excluído, mas o registro de seu ciclo de vida permanecerá, pois os metadados ficarão guardados nos servidores da universidade.

Uma nova cultura na universidade

Para Grácio, o desenvolvimento das iniciativas de preservação digital envolve uma mudança da cultura organizacional da universidade, e demanda mudanças nos processos de trabalho. Essas inovações tomam diversos aspectos nas diferentes áreas. Os funcionários técnico-administrativos, por exemplo,  passam a utilizar QR codes para verificar a validade de um documento assinado eletronicamente. Os funcionários das bibliotecas devem lembrar de pegar autorizações com os autores de um artigo científico publicado, para que a sua versão em arquivo PDF possa ser convertida para outros formatos no futuro. A pessoa responsável por produzir um ofício precisa tomar os cuidados necessários para garantir a autenticidade do documento, inserindo nele metadados descritivos. E a lista de exemplos continua.

“Mudar a cultura de uma instituição é um processo lento. Para implementar essas mudanças na Unesp instituímos a Política de Preservação Digital, criamos a CPPD, oferecemos treinamentos, participamos de reportagens… Tudo para fazer com que as pessoas compreendam do que se trata”, diz o presidente da CPPD. Ele também destaca a necessidade de introduzir essas inovações na formação dos estudantes, algo que já está acontecendo. “Isso vem mostrar a importância do profissional de arquivologia e de biblioteconomia para o mundo digital. Aqui em Marília já existe uma disciplina de preservação digital no curso de arquivologia e biblioteconomia, e na pós-graduação, também. No Brasil, há muitos cursos de especialização na parte digital. Cada vez mais, fica claro o quanto de trabalho há por ser feito nessa área”, diz.

Imagem acima: Depositphotos/Maxkabakov

Séries Jornal da Unesp

Este artigo pertente à série Preservação Digital do Jornal Unesp. Série traz reportagens sobre a preservação digital e as iniciativas que a Unesp têm desenvolvido para transformar a sua cultura organizacional.

Veja mais artigos desta série Conheça mais séries