Um dos formatos de ficheiro mais frequentemente utilizados é o Portable Document Format (PDF), desde sua criação em 1993. É uma forma de enviar documentos só de leitura, preservando a disposição do texto.
Embora seja um dos formatos de documentos mais comuns, muitas pessoas não sabem que existem muitos tipos diferentes de ficheiros PDF. Um dos mais importantes para arquivamento de longo prazo é o PDF/A. A norma PDF/A foi criada em 2005 e tem alguns benefícios em relação aos documentos PDF padrão.
Precisa de tornar os seus documentos PDF pesquisáveis? Quer saber mais sobre PDF/A? Neste blog vamos falar mais sobre o que é o PDF/A, quais versões existem e quais são os benefícios.
O que é o PDF/A?
O PDF/A é uma versão padronizada do PDF, feito especialmente para arquivar e preservar a longo prazo documentos eletrónicos. O A, na verdade, significa “Archiving” (Arquivamento). As normas ISO são acordadas por especialistas que descrevem a melhor maneira de fazer algo.
Estes identificam um conjunto de características para documentos eletrónicos que assegura que os documentos podem ser reproduzidos da mesma forma exata com vários softwares, agora e no futuro. Isto é algo que os documentos PDF normais não podem garantir e, portanto, os PDFs normais podem ser um problema de conformidade para o armazenamento de dados de longo prazo.
Um elemento chave é que os documentos PDF/A são 100% auto-contidos. Todos os metadados são incorporados no arquivo e isto inclui todo o conteúdo (texto, imagens raster e gráficos vetoriais), fontes e informações sobre cores.
Um documento PDF/A não pode depender de dados de fontes externas (programas de fontes e fluxos de dados), mas pode incluir hiperligações para documentos externos. O PDF/A bloqueia características inadequadas para arquivamento de longo prazo, como a vinculação e criptografia de fontes.
O PDF/A tem muitas variações diferentes, criadas pela combinação de diferentes normas PDF/A e níveis de conformidade. Cada norma PDF/A possui uma combinação diferente de recursos disponíveis e tecnologias de compactação de imagem que ajudam na preservação do conteúdo.
Que versões do PDF/A existem?
A primeira parte da norma foi publicada em 2005 e consistia em dois níveis:
PDF/A-1b – Conformidade de nível B (básico)
PDF/A-1a – Conformidade de nível A (acessível)
PDF/A-2u – Conformidade de nível U (unicode)
O nível B é o menos complexo e é normalmente utilizado para arquivamento. O nível A envolve alguns requisitos adicionais que o tornam mais adequado para deficientes visuais e mais fácil de pesquisar. A desvantagem é que nem sempre é possível criar um documento de nível A a partir de uma fonte específica e é preciso mais tempo (mais complicado) para criar documentos PDF/A-1a. Abaixo estão os requisitos adicionais de Nível A:
- Especificação de linguagem
- Estrutura hierárquica do documento
- Extensões de texto marcadas e texto descritivo para imagens e símbolos
Como a tecnologia melhora a cada dia, novas versões de PDF/A foram desenvolvidas ao longo do tempo.
O PDF/A-1 é o padrão PDF/A original, tanto o mais utilizado como o mais restritivo. Por ser baseado em um padrão PDF mais antigo, PDF 1.4, não suporta JPEG 2000, anexos ou camadas. A conformidade de nível A pretendia aumentar a acessibilidade para utilizadores com deficiência física, permitindo que softwares de suporte, como leitores de ecrã, interpretassem melhor o conteúdo de um ficheiro.
PDF/A-2
A segunda parte da norma foi publicada em 2011. Os arquivos PDF/A-1 não estão necessariamente em conformidade com PDF/A-2 e vice-versa. Esta parte contém os seguintes novos recursos e é agora mais utilizada:
- Assinaturas digitais
- Compressão de imagem JPEG 2000 e JBIG2
- Efeitos e camadas de transparência
- Opção de arquivar conjuntos de documentos em um único arquivo
- Incorporação de fontes OpenType
- O nível de conformidade u (Unicode) permite que o texto possa ser pesquisado e copiado de forma confiável, sem que o arquivo tenha de estar em conformidade com outros requisitos de nível a
O Nível U (Unicode) foi introduzido juntamente com PDF/A-2 e fornece mapeamentos de caracteres para o Unicode.
PDF/A-3
A parte 3 tem uma nova característica: permite qualquer formato de ficheiro (XML, CSV, CAD, Word, Excel, etc). como anexo, mas ainda não está amplamente difundido.
PDF/A-4
Espera-se que a parte 4 seja publicada ainda este ano (2020).
Quais são os benefícios do PDF/A?
Existem muitas vantagens em usar PDF/A em oposição, por exemplo, ao formato de arquivo PDF tradicional. Listámos as que considerámos serem as cinco mais importantes.
- Documentos PDF/A são totalmente pesquisáveis por texto: a resposta para as dores de cabeça de muitas pessoas: documentos PDF/A são totalmente pesquisáveis! Esta característica pode ajudar a poupar várias horas de trabalho manual. O texto é preservado no documento, mesmo o texto extraído com o Reconhecimento Ótico de Caracteres (OCR). O ficheiro PDF/A guarda tanto o texto extraído como a imagem digitalizada.
- O PDF/A ocupa relativamente pouco espaço de armazenamento: embora os documentos PDF/A contenham mais informações do que imagens (como o TIFF), os ficheiros PDF/A são normalmente mais pequenos devido à utilização de algoritmos de compressão eficientes.
- Os documentos PDF/A permanecem válidos para sempre: os documentos PDF/A existentes não precisam ser migrados quando são introduzidas novas alterações de normas pelo comitê da ISO. Permanecerão sempre em conformidade porque a ISO não pode retirar a norma PDF/A. Isto garante-lhe um arquivo de documentos seguro e utilizável e não perderá quaisquer dados nem se tornará incomplacente.
- As assinaturas digitais garantem a segurança: a combinação de PDF/A com assinaturas digitais garante que os documentos PDF não foram alterados e que são autênticos. Para um arquivamento de longo prazo, isso significa uma segurança jurídica ideal.
- PDF/A são amplamente aceitos: na Europa e na Ásia, o PDF/A já é amplamente usado para arquivamento de longo prazo, por governos, organizações e empresas. A procura por este padrão está a crescer na América do Norte em certos ramos. A Associação PDF é muito importante no suporte ao PDF/A.
Conformidade de Ficheiros PDF/A com o RGPD
Podemos falar de benefícios o quanto quisermos, mas também devemos considerar restrições legais.
Em 25 de maio de 2018, entrou em vigor o Regulamento Geral de Proteção de Dados (GDPR) da UE, a primeira lei global de proteção de dados. O objetivo do regulamento é respeitar a privacidade das pessoas e ser transparente como organização, mas também garantir a livre circulação de dados no mercado interno europeu.
A conformidade com o GDPR aplica-se a empresas da UE, mas também empresas no Canadá e Estados Unidos que trabalham com dados pessoais de cidadãos da UE. Significa basicamente que ao solicitar e guardar dados pessoais dos clientes, é preciso ter o seu consentimento e não manter os dados por mais tempo do que o necessário. Estes dados podem estar em qualquer lugar e podem já estar nos seus arquivos, mas pode simplesmente não saber, uma vez que o seu arquivo ou não é digital ou não é pesquisável.
Converter ou criar ficheiros PDF/A pesquisáveis é, portanto, muito relevante para garantir arquivos compatíveis com a GDPR. Combine isto com a anonimização ou pseudonimização automatizada e terá a certeza de armazenar apenas os dados corretos. Então, como se pode tornar compatível com o GDPR?
- Converta qualquer documento em papel em arquivos digitais.
- Torne os seus PDFs pesquisáveis (abaixo, estão mais informações sobre como a Klippa pode ajudá-lo a fazer isto)
- Identifique e torne anónimos todos os dados confidenciais que você não tem permissão para armazenar
- Use o formato PDF/A para fins de arquivamento seguro a longo prazo
Casos de utilização comuns de PDF/A
Abaixo estão alguns exemplos de casos de utilização:
- Digitalização: seguradoras que desejam dizer adeus às faturas impressas e criar um arquivo digital para que possam pesquisá-las rapidamente quando necessário, melhorando assim a produtividade.
- Documentos digitais: escritórios jurídicos que desejam converter os seus documentos jurídicos em PDF/A para fins de arquivamento e conformidade.
- Pesquisa: garantir a conversão de todos os seus documentos e PDFs em PDFs pesquisáveis tornará muito mais fácil e menos demorado encontrar dados nos seus arquivos.
- Documentação: bancos que oferecem um novo serviço podem consultar os termos e condições exatos de serviços antigos.
- Colaboração: engenheiros que compartilham rascunhos de um documento e armazenam a versão final em PDF/A para acessibilidade a longo prazo.
- Email/correio: prestadores de serviços de saúde que desejam arquivar automaticamente todas as comunicações com os pacientes para acessá-las rapidamente.
Como criar PDF/A e PDFs pesquisáveis?
Se quiser criar um único ficheiro PDF/A, pode simplesmente utilizar o Microsoft Word para o fazer. Criar ficheiros PDF/A automaticamente em grande escala é tecnicamente bastante complexo. Se for muito técnico e está à procura de uma maneira de fazer isto sozinho, consulte a Associação PDF.
Se lhe faltar experiência técnica, não deseja perder muito tempo a investigar como funciona, ou tem grandes volumes de documentos que precisam de ser convertidos, podemos automatizar o processo para si. Podemos converter todas as suas digitalizações, imagens ou PDFs para qualquer versão de PDF/A. Até mesmo o seu arquivo inteiro.
Com o nosso serviço, pode tornar toda a sua base de dados de ficheiros pesquisável e segura para armazenar, sem corrupção de dados. Com o formato de PDF tradicional, não pode garantir que, se tentar abri-lo dentro de cinco anos, ele ainda funcionará. Com o PDF/A pesquisável, pode.
Como validar ficheiros PDF/A?
É difícil julgar um livro pela sua capa. O mesmo se aplica a ficheiros PDF. Se é difícil validar um documento olhando para ele, como pode ter certeza de que um ficheiro é realmente um ficheiro PDF/A e está em conformidade com as normas? Os validadores de PDF/A são a resposta. São ferramentas (online) que verificam se todos os elementos das normas foram cumpridos. Uma boa fonte é o VeraPDF.
Como converter PDF em PDF/A?
Existem ferramentas online que permitem converter PDFs em PDF/A, mas nunca se sabe onde os seus dados vão parar e requer muito trabalho manual. Se for apenas um arquivo que está a tentar processar e o arquivo não for de natureza confidencial, esta pode ser uma boa opção.
Em qualquer outro caso, escolha um serviço de conversão confiável. Com o nosso próprio motor de OCR, extraímos dados de imagens ou documentos digitalizados, passamos os dados como uma camada extra do PDF e depois convertemo-los para PDF/A. Todo o processo é automatizado e adequado para o processamento de grandes volumes. A Klippa oferece isto num modelo SaaS, tanto contínuo como baseado em projetos.
Como a Klippa Pode Facilitar a Sua Gestão de Documentos
Na Klippa, ajudamos empresas com o Processamento Inteligente de Documentos. Se tiver um desafio no que respeita à entrada de dados, conversão de documentos ou extração de dados, pode sempre contactar-nos ou agendar uma demonstração do produto abaixo. Adoramos sempre um bom desafio!