L’un des formats de fichier les plus couramment utilisés est le Portable Document Format (PDF) depuis sa création en 1993. Il s’agit d’un moyen d’envoyer des documents en lecture seule qui préserve la mise en page d’un texte. Même s’il s’agit de l’un des formats de document les plus courants, beaucoup de gens ne savent pas qu’il existe en fait plusieurs types de fichiers PDF, dont l’un des plus importants pour l’archivage à long terme est le PDF/A. La norme PDF/A est née en 2005 et présente quelques avantages par rapport aux documents PDF standard. Dans cet article, nous vous expliquerons ce qu’est le PDF/A, quelles sont ses versions et quels sont ses avantages.
Vous avez besoin de rendre vos documents PDF consultables ? Vous souhaitez en savoir plus sur le PDF/A ? Lisez cet article et apprenez-en davantage.
Qu’est-ce que le PDF/A?
Le PDF/A est une version du PDF normalisée par l’ISO, conçue sur mesure pour l’archivage et la conservation à long terme des documents électroniques. Le A signifie “Archivage”. Les normes ISO sont adoptées par des experts décrivant la meilleure façon de faire. Elles identifient un ensemble de caractéristiques pour les documents électroniques qui garantissent la reproduction exacte de documents avec différents logiciels, aujourd’hui et à l’avenir. C’est une chose que les documents PDF standards ne peuvent garantir et, par conséquent, ils peuvent poser un problème de conformité pour le stockage de données à long terme.
Un élément clé est que les documents PDF/A sont 100% autonomes. Toutes les métadonnées sont intégrées dans le fichier et cela inclut tout le contenu (texte, images tramées et graphiques vectoriels), les polices et les informations sur les couleurs. Un document PDF/A ne peut pas s’appuyer sur des données provenant de sources externes (programmes de polices et flux de données), mais peut inclure des hyperliens vers des documents externes. Le PDF/A verrouille les fonctions qui ne conviennent pas à l’archivage à long terme, comme la liaison des polices et le cryptage.
Le PDF/A se décline en de nombreuses variantes, créées par le mélange de différentes normes PDF/A et de différents niveaux de conformité. Chaque norme PDF/A présente une combinaison différente de fonctionnalités disponibles et de technologies de compression d’images qui contribuent à la préservation du contenu.
Quelles sont les versions du PDF/A ?
La première partie de la norme a été publiée en 2005 et se composait de deux niveaux :
PDF/A-1b – Niveau B (basic) conformité
PDF/A-1a – Niveau A (accessible) conformité
PDF/A-2u – Niveau U (unicode) conformité
Le niveau B est le moins complexe et est généralement utilisé pour l’archivage. Le niveau A comporte quelques exigences supplémentaires qui le rendent plus adapté aux malvoyants et plus facile à consulter. L’inconvénient est qu’il n’est pas toujours possible de créer un document de niveau A à partir d’une source spécifique et qu’il faut plus de temps (plus compliqué) pour créer des documents PDF/A-1a. Vous trouverez ci-dessous les exigences supplémentaires du niveau A :
- Spécification de langage
- Structure hiérarchique du document
- Espaces de texte étiquetées et texte descriptif pour les images et les symboles
Comme la technologie s’améliore rapidement, de nouvelles versions de la norme PDF/A ont été élaborées au fil du temps. PDF/A-1 est la norme PDF/A originale, à la fois la plus utilisée et la plus restrictive. Comme elle est basée sur une ancienne norme PDF, PDF 1.4, elle ne prend pas en charge JPEG 2000, les pièces jointes ou les couches. La conformité au niveau A avait pour but d’accroître l’accessibilité pour les utilisateurs souffrant d’un handicap physique en permettant aux logiciels d’assistance, tels que les lecteurs d’écran, de mieux interpréter le contenu d’un fichier.
PDF/A-2
La deuxième partie de la norme a été publiée en 2011. Les fichiers PDF/A-1 ne sont pas nécessairement conformes à PDF/A-2 et vice versa. Cette partie contient les nouvelles fonctionnalités suivantes et est désormais couramment utilisée :
- Signatures digitales
- Compression d’images JPEG 2000 et JBIG2
- Effets de transparence et couches
- Possibilité d’archiver des ensembles de documents dans un seul fichier
- Incorporation de polices OpenType
- Le niveau de conformité u (Unicode) permet de rechercher et de copier du texte de manière fiable, sans que le fichier ne doive être conforme à d’autres exigences de niveau A.
Le niveau U (Unicode) a été introduit en même temps que le PDF/A-2 et fournit des correspondances de caractères vers Unicode.
PDF/A-3
La partie 3 comporte une nouvelle caractéristique : elle permet d’utiliser n’importe quel format de fichier (XML, CSV, CAD, Word, Excel, etc.) comme pièce jointe, mais elle n’est pas encore très répandue.
PDF/A-4
La partie 4 a été publiée au cours de l’année 2020.
Quels sont les avantages du PDF/A ?
Il existe de nombreux avantages à utiliser le format PDF/A par rapport, par exemple, au format de fichier PDF traditionnel. Pour ne pas allonger cet article, nous allons énumérer ce que nous pensons être les cinq avantages les plus importants.
1 – Les documents PDF/A sont totalement consultables : La réponse aux maux de tête de nombreuses personnes : Les documents PDF/A sont entièrement consultables ! Cette fonctionnalité permet d’économiser de nombreuses heures de travail manuel. Le texte est conservé dans le document, même celui extrait par la Reconnaissance Optique de Caractères (OCR). Le fichier PDF/A enregistre à la fois le texte extrait et l’image numérisée.
2 – Le format PDF/A occupe un espace de stockage relativement faible : Bien que les documents PDF/A contiennent plus d’informations que les images (telles que TIFF), les fichiers PDF/A sont généralement plus petits grâce à l’utilisation d’algorithmes de compression efficaces.
3 – Les documents PDF/A sont indéfiniment valides : Les documents PDF/A existants n’ont pas besoin d’être transférés lorsque de nouveaux amendements à la norme sont introduits par le comité ISO. Ils resteront toujours conformes car l’ISO ne peut pas retirer la norme PDF/A. Vous avez ainsi la garantie de disposer d’une archive de documents sûre et utilisable, sans perdre de données ni en conformité.
4 – Les signatures numériques garantissent la sécurité : La combinaison du PDF/A et des signatures numériques garantit que les documents PDF n’ont pas été modifiés et qu’ils sont authentiques. Pour l’archivage à long terme, cela signifie une sécurité juridique optimale.
5- Le format PDF/A est largement accepté
En Europe et en Asie, le PDF/A est déjà largement utilisé pour l’archivage à long terme, tant par les gouvernements que par les organisations et les entreprises. En Amérique du Nord, la demande pour cette norme augmente dans certaines branches. L’Association PDF joue un rôle très important dans le soutien au PDF/A.
Archives conformes aux normes PDF/A et RGPD
Nous pouvons parler des avantages aussi longtemps que nous le voulons, mais nous devons également tenir compte des restrictions légales. Le 25 mai 2018, le Règlement Général sur la Protection des Données (RGPD) de l’UE, première loi mondiale sur la protection des données, est entré en vigueur.
L’objectif de ce règlement est de respecter la vie privée des personnes et d’être transparent en tant qu’organisation, mais aussi de garantir la libre circulation des données au sein du marché intérieur européen. La conformité au RGPD s’applique aux entreprises de l’UE et aux entreprises du Canada et des États-Unis travaillant avec les données personnelles des citoyens de l’UE.
Cela signifie essentiellement que lorsque vous demandez et enregistrez les données personnelles des clients, vous devez avoir leur consentement et ne pas conserver leurs données plus longtemps que nécessaire. Ces données peuvent se trouver n’importe où et être déjà dans vos archives, mais vous ne le savez peut-être pas parce que vos archives ne sont pas numériques ou ne sont pas consultables.
La conversion ou la création de fichiers PDF/A consultables est donc très importante pour garantir des archives conformes au RGPD. Combinez cela avec l’anonymisation ou la pseudonymisation automatisée et vous êtes sûr de ne stocker que les bonnes données. Comment se conformer au RGPD ?
1 – Convertissez tous vos documents en fichiers digitaux.
2 – Rendez vos PDF consultables (ci-dessous voyez comment Klippa peut vous aider à ce propos)
3 – Identifiez & anonymisez toutes les données sensibles que vous n’êtes pas autorisé à conserver
4 – Utilisez le format PDF/A pour l’archivage à long terme.
Cas d’usage généraux du format PDF/A
Vous trouverez ci-dessous quelques exemples de cas d’utilisation :
Numérisation : Pour les compagnies d’assurance qui souhaitent dire adieu aux factures imprimées et créer des archives numériques afin de pouvoir les rechercher rapidement en cas de besoin, ce qui améliore la productivité.
Documents numériques : Pour les cabinets juridiques qui souhaitent convertir leurs documents juridiques au format PDF/A à des fins d’archivage et de conformité.
Possibilité de recherche : En veillant à convertir tous vos documents et PDF en PDF interrogeables, il sera beaucoup plus facile et moins long de trouver des données dans vos archives.
Documentation : Pour les banques qui proposent un nouveau service peuvent se référer aux termes et conditions exacts des anciens services.
Collaboration : Pour les ingénieurs qui partagent les brouillons d’un document et stockent la version finale en PDF/A pour une accessibilité à long terme.
Courrier électronique/courrier : Pour les prestataires de soins de santé qui souhaitent archiver automatiquement toutes les communications avec les patients afin d’y accéder rapidement.
Comment créer un PDF/A et des PDF consultables
Si vous voulez créer un seul fichier PDF/A, vous pouvez simplement utiliser Microsoft Word pour le faire. La création automatique de fichiers PDF/A à grande échelle est techniquement assez complexe. Si vous êtes très technique et que vous cherchez un moyen de le faire vous-même, consultez l’Association PDF.
Si vous manquez d’expérience technique, si vous ne souhaitez pas passer beaucoup de temps à chercher comment cela fonctionne, ou si vous avez de gros volumes de documents à convertir, nous pouvons automatiser le processus pour vous. Nous pouvons convertir tous vos scans, images ou PDFs vers n’importe quelle version de PDF/A. Même l’ensemble de vos archives.
Grâce à notre service, vous pouvez rendre l’ensemble de votre base de données de fichiers interrogeable et sûr à stocker, sans corruption des données. Avec le format PDF traditionnel, vous ne pouvez pas garantir que si vous essayez de l’ouvrir dans cinq ans, il fonctionnera encore. Avec le PDF/A consultable, vous pouvez.
Comment valider les fichiers PDF/A
Il est difficile de juger un livre à sa couverture. Il en va de même pour les fichiers PDF. S’il est difficile de valider un document en le regardant, comment pouvez-vous être sûr qu’un fichier est réellement un fichier PDF/A et qu’il est conforme à la norme ? Les validateurs PDF/A sont la réponse. Il s’agit d’outils (en ligne) qui vérifient si tous les éléments de la norme ont été respectés. Une bonne source est VeraPDF.
Conversion de PDF en PDF/A en tant que service
Il existe des outils en ligne vous permettant de convertir des PDF en PDF/A, mais vous ne savez jamais où vos données aboutissent et cela demande beaucoup de travail manuel. S’il ne s’agit que d’un seul fichier que vous essayez de traiter et que le fichier n’est pas de nature sensible, cela peut être une bonne option. Dans tous les autres cas, choisissez un service de conversion fiable.
Grâce à notre propre moteur OCR, nous extrayons les données des documents ou des images numérisés, nous en faisons une couche supplémentaire du PDF et nous le convertissons ensuite en PDF/A. L’ensemble du processus est automatisé et convient au traitement de gros volumes. Klippa propose ce service dans le cadre d’un modèle SaaS, à la fois permanent et par projet.
Entrons en contact
Chez Klippa, nous aidons les organisations à traiter des volumes importants de documents intelligents. Si vous avez un défi à relever en matière de saisie de données, de conversion de documents ou d’extraction de données, contactez-nous ou planifiez une démonstration de produit. Nous aimons relever les défis.