Pouco a pouco as pessoas começam a se dar conta que um documento eletrônico não é em absoluto um documento digitalizado. O último caso é, por exemplo, o magistral trabalho da Hemeroteca de nossa Biblioteca Nacional. Trata-se da digitalização do acervo jornalístico do país. Ou seja: trata-se de um legado outrora gerado em papel e que agora o geramos em forma digital, — o que é infinitamente melhor para o pesquisador-usuário e para a conservação deste patrimônio histórico-cultural, evitando o seu acesso direto. Ressalte-se a aplicação da técnica de OCR (Optical Character Recognition)¹ a este acervo ele possibilita um acesso mais qualificado ao acervo e pesquisas acuradas. De forma muito objetiva: pode-se procurar por uma palavra qualquer, uma expressão, em todos os jornais da Corte no século XIX.
Um documento eletrônico nasce digitalmente e realiza todo seu ciclo de vida desta forma, se impresso, por algum razão, o impresso a bem da verdade é cópia, o original é o digital. O legado que a sociedade produziu nasceu com suporte em papel, a digitalização é cópia deste documento físico, e seu descarte — ainda que todas as técnicas possam ajudar neste processo — ainda é um "tabu", e de difícil superação a curto prazo. Todas mudanças são difíceis, não tenhamos ilusão, e o uso do papel é milenar. A escrita em si é uma "tecnologia da inteligência", para usar uma expressão de Pierre Lévy, a impressão de Gutemberg e também a máquina de escrever igualmente, e nenhuma delas desumanizou o homem. Como disse sutilmente Richard Sennett: "technique has a bad name; it can seem soulless"².
Fato irrecusável que nossa sociedade já produz gicantesca quantidade de documentos que nascem digitalmente. Fiquemos por hora com exemplo da Nota Fiscal Eletrônica (NFe), já validamos e autorizamos 7.5 Bilhões de NFes. Passados digamos uns 100 anos, será parcela da memória econômica de nosso país nestes documentos eletrônicos, assinados digitalmente. O mesmo se passa com o sistema para recolhimento e declaração do FGTS, o chamado "Conectividade Social", que também se insere em nossa memória econômico-social.
As escolhas tecnológicas de hoje decidirão no futuro as condições de legibilidade e acesso a este acervo. O XML como padrão e formato tem sido a decisão mais adequada (que é uma tendência global e não somente local). Além de ser um documento em "texto-puro", como qualquer linguagem de "marcação", e é tremendamente interoperável, aderente a Web. Igualmente poderosa ferramenta de intercâmbio de dados. Por isso o Governo Federal, em seus padrões de interoperabilidade assevera:
"Serão considerados preferenciais aqueles tipos de arquivo que têm como padrão de representação o formato XML, de forma a facilitar a interoperabilidade entre os serviços de governo eletrônico."³
Assim, é o formato de nossas NFes e também a comunicação eletrônica do Fundo de Garantia brasileiro segue o padrão XML Manifest. Ele descreve o conteúdo do pacote ".zip" enviado, especificando como o conteúdo é mapeado numa estrutura de diretório e de informação.
Outro aspecto importante é que ele deve ser agnóstico ao estabelecer os metadados do pacote, isto é, neutro quanto a linguagem e o sistema operacional, o que garantirá longevidade ao documento e sua informação. O esquema XML manifest é largamente utilizado pelos SOs atuais⁴ , como o MS Windows. Também no mundo da mobilidade, como o Android, aí toda a aplicação do SO Android deve ter na sua raiz um arquivo "manifest.xml".