Im Laufe der Jahre haben Sie möglicherweise Zehntausende oder sogar bis zu hundert Millionen Dokumente in Ihrem Archiv gesammelt. Möglicherweise ist Ihnen nicht bewusst, was sich tatsächlich darin befindet. Daher ist es wichtig, einen Weg zu finden, um genau zu entdecken und zu navigieren, welche Dateien Sie in Ihrem Archiv haben.
Darüber hinaus könnten Sie sensible Daten archiviert haben, die Sie nach den neuesten DSGVO-Richtlinien nicht speichern dürfen. Sie könnten also gegen die Vorschriften verstoßen, ohne davon zu wissen. Gibt es einen guten Weg, um herauszufinden, ob dies der Fall ist?
Obwohl Ihr Archiv wahrscheinlich nicht der spannendste Teil Ihres Unternehmens darstellt, ist es wichtig, dass Sie sich darüber im Klaren sind, was sich in Ihrem Archiv befindet. Zum Glück leben wir in den Zeiten der intelligenten Archivierung, die Ihnen dabei helfen kann, Ihr Archiv effizient zu navigieren, indem Sie es beschriften und klassifizieren, und die Einhaltung datenschutzrechtlicher Vorschriften verbessern.
In diesem Blog erfahren Sie, wie Sie Ihr Archiv durch Kennzeichnung schnell und effektiv organisieren und durch Anonymisierung DSGVO-konform machen können.
Drei Anwendungsbeispiele für intelligente Archivierung
Ein gut organisiertes Archiv kann eine enorme Informationsquelle für Ihr Unternehmen sein. Daher ist es wichtig zu wissen, was sich in Ihrem Archiv befindet und wie Sie diese Informationen finden, wenn Sie sie benötigen.
Wenn Sie diesen Blog lesen, haben Sie wahrscheinlich festgestellt, dass Sie nicht ganz genau wissen, was sich in Ihrem Archiv befindet. Sie suchen nach einer Möglichkeit, Ihr Archiv effizient zu organisieren, oder Sie brauchen eine Lösung für die Einhaltung von Vorschriften und daher stellen sich Ihnen eventuell Fragen wie:
- “Haben wir Informationen zu diesem Thema in unserem Archiv?”
- “Ich brauche ein Dokument mit dieser Information, aber wie finde ich es?”
- “Darf ich diese Dokumente überhaupt in meinem Archiv haben?”
Es kann also sein, dass Sie einen enormen Berg an unorganisierten Informationen zur Verfügung haben, aber nicht in der Lage sind, irgendetwas davon zu nutzen. Es ist möglich, dass Sie ein Unternehmensarchiv oder ein persönliches Archiv haben, und dass Sie es in einem DMS, einem Cloud-Service oder einem Papierarchiv abgelegt haben.
Es gibt drei wesentliche Möglichkeiten, dieses Problem zu lösen. Lassen Sie uns einen Blick darauf werfen, was Sie tun können, um diese Ausstellungsprobleme mit Hilfe der intelligenten Archivierung zu lösen.
Wie Sie Ihr Archiv durchsuchbar machen
Wenn Sie nicht genau wissen, welche Dateien Sie in Ihrem Archiv haben, ist der erste Schritt zur intelligenten Archivierung die schnelle und effektive Identifizierung jedes einzelnen abgelegten Dokuments. Denken Sie dabei an Dokumententypen wie PDFs, Word-Dokumente, Excel-Tabellen, E-Mails, Bilder, Scans oder jeden anderen Typ.
Extrahieren von Text aus Nicht-Text-Dateien
Dateien, die digitalen Text enthalten, sind grundsätzlich bereits durchsuchbar. Wenn Sie also nur textbasierte PDFs, Word-Dokumente, Excel-Tabellen oder TXT-Dateien haben, können Sie vielleicht schon mit einer Suchleiste in den Dateien navigieren. Dies ist nützlich, wenn Sie schnell alle Dateien finden müssen, die einen bestimmten Suchbegriff oder ein bestimmtes Thema enthalten.
Viele Unternehmensarchive enthalten jedoch Scans von Dokumenten und anderen Bildtypen. Der Text in diesen Dokumenten ist noch nicht digitalisiert worden. Eine hervorragende Lösung, um solche Dateien durchsuchbar zu machen, ist die automatische Extraktion des Textes in ihnen mit Hilfe der OCR-Technologie (Optical Character Recognition). Die OCR-API von Klippa ist eine hervorragende Lösung für diesen Zweck.
Mit Hilfe von OCR ist die API von Klippa in der Lage, automatisch Pixel zu erkennen, die textuelle Zeichen in Bilddateien enthalten. Sie kann dies genau und zuverlässig für eine unbegrenzte Anzahl von Dateien tun. Das heißt, egal wie viele Nicht-Text-Dateien Sie in Ihrer Datenbank haben, die API kann den Text vollautomatisch und schnell extrahieren. Sie können dann z. B. PDF/a-Dateien haben, die sowohl durchsuchbar als auch GDPR-konform sind.
Sie brauchen also kein riesiges Backoffice, um alle Dateien in Ihrem Archiv durchzugehen. Ziemlich raffiniert, oder?
Ihr durchsuchbares Archiv verwenden
Das durchsuchbare Archiv steht Ihnen nun zur Verfügung. Jetzt können Sie entscheiden, was mit den Dokumenten in der Zukunft geschehen soll. Brauchen Sie all diese Dateien noch? Können Sie sie löschen?
Wie lassen sich Dokumente mit bestimmten Merkmalen sinnvoll finden? Dies sind alles Fragen, die mit dem Folgeprozess zusammenhängen. Es ist besonders nützlich, die folgenden Punkte zu identifizieren:
- Identifizieren Sie, welche Dateien Sie nicht benötigen, um Ihr Archiv von irrelevanten Dateien zu befreien oder datenschutzrelevante Informationen zu entfernen.
- Legen Sie fest, welche Dateien aufbewahrt werden sollen, und beschriften Sie diese. So können Sie leicht auf die Informationen zugreifen, die Sie benötigen.
- Ermitteln Sie, welche Dokumente nützliche Kunden- oder Marktinformationen enthalten, die Sie für die Ausarbeitung einer Geschäftsstrategie verwenden können.
- Identifizieren Sie, welche Dokumente sensible Informationen enthalten. In dem Sie diese Dokumente anonymisieren oder entfernen, können Sie sicherstellen, dass Sie die Datenschutzbestimmungen vollständig einhalten.
Dies sind nur einige Beispiele dafür, was Sie mit Ihrem, nun durchsuchbaren, Archiv machen können.
Beschriftung und Klassifizierung Ihres Archivs
Sobald Ihr Archiv durchsuchbar ist, müssen Sie es vielleicht ordentlich gruppieren und klassifizieren, um die Übersicht zu verbessern, Gruppen von Dateien in Ihrer Datenbank leicht an jemanden weiterzugeben, der sie benötigt, oder um sicherzustellen, dass bestimmte Dateien nur für bestimmte Kollegen zugänglich sind.
Es ist wichtig, dass Sie zunächst die Eigenschaften definieren, mit denen Sie Ihre Dateien gruppieren möchten. Sie können sich den folgenden Beschriftungskontext vorstellen:
- Dokumentformat: .pdf, .docx, .xml, .xlsx
- Dokumentart: Ausweisdokumente, E-Mails, Rechnungen, Quittungen, Antragsformulare, Kontaktformulare, Jahresabschlüsse, Kundenfotos, etc.
- Dokumenttyp: Finanzdokumente, Kundendokumente, HR-Dokumente, Rechtsdokumente, etc.
- Dokumente, die spezifische (DSGVO-bezogene) Informationen enthalten: Namen und Adressen, Kontaktdaten, kundenspezifische Informationen, Standortangaben usw.
Das Festlegen der Parameter ist ein wichtiger Schritt, bevor Sie mit der eigentlichen Beschriftung beginnen. Auf diese Weise können Sie Ihre Beschriftungen schön überschaubar halten und fangen nicht an, spontan Labels zu erfinden. Sie verhindern so, dass Sie unterwegs den Überblick und die Logik verlieren.
Sobald Sie Ihre Parameter gewählt haben, können Sie mit der Beschriftung und Klassifizierung Ihres durchsuchbaren Archivs beginnen. Natürlich haben Sie immer die Möglichkeit, manuell zu beschriften. Aber das würde schnell unübersichtlich und fehleranfällig werden.
Glücklicherweise ist es auch möglich, OCR- und KI-Algorithmen von Klippa anzuwenden, um Dokumente automatisch zu identifizieren und zu beschriften / zu klassifizieren.
Ein Dokument, das bestimmte Informationen enthält, kann automatisch mit dem Parameter Ihrer Wahl beschriftet werden. So kann z. B. jedes Dokument mit der entsprechenden Fallnummer beschriftet werden. Alle Reisepässe können als “Identitätsdokumente” beschriftet werden oder sogar anonymisiert oder entfernt werden.
Das Navigieren in gekennzeichneten Gruppen ist wesentlich weniger umständlich als das Durchsuchen von Millionen von Dateien. Wenn Sie ein digitales Archiv haben, auf das Hunderte von Mitarbeitern zugreifen können, können Sie den Zugriff auf bestimmte Dateigruppen einschränken.
Außerdem erhalten Sie sofort einen Überblick darüber, wie viele Dateien Sie in einer bestimmten Gruppe besitzen, und Sie können festlegen, wie Sie mit den Dokumenten weiter verfahren wollen. So können Sie schnell auf ein Dokument zugreifen und es aus dem Archiv holen, um es für Ihre speziellen Zwecke zu verwenden.
Identifizierung und Anonymisierung von datenschutzrelevanten Daten
Ein wichtiger Zweck, die Dokumente in Ihrem Archiv zu identifizieren und zu beschriften, ist die Einhaltung von GDPR- oder anderen datenschutzbezogenen Vorschriften. Wenn Sie sich nicht bewusst sind, welche privaten Daten Sie in Ihrer Datenbank gespeichert haben, kann das schwerwiegende Folgen haben, sobald Sicherheitslücken auftreten.
Dies kann nicht nur Cyberkriminellen ermöglichen, Informationen zu verbreiten, die Ihnen nicht zustehen, sondern auch dazu führen, dass private Kundendaten preisgegeben werden, potenzielle Geldstrafen verhängt werden und Ihr Unternehmen letztendlich öffentlich einen schlechten Ruf erhält.
Die naheliegende Lösung ist also, das Vorhandensein von datenschutzsensiblen Daten in Ihrem Archiv zu erkennen und solche Dokumente entweder zu entfernen oder zu anonymisieren.
Mit Hilfe der OCR-API von Klippa können Sie automatisch bestimmte Kombinationen von Namen, Adressen, Kontonummern oder anderen privaten Informationen erkennen und diese anonymisieren lassen, indem Sie diese spezifischen Zeilen auf einem Dokument entfernen oder die Dokumente ganz löschen.
Sie haben die Möglichkeit, automatisch bestimmte Informationszeilen aus den Dokumenten zu extrahieren, bevor Sie sich für das Löschen der Dokumente entscheiden. Dadurch wird sichergestellt, dass keine wertvollen Kundeninformationen verloren gehen, die möglicherweise für Compliance-, Marktforschung- oder Marketingzwecke benötigt werden.
Eine Alternative zum Löschen von Dateien ist, sie automatisch anonymisieren oder pseudonymisieren zu lassen. So können Sie Ihre Dateien behalten, ohne einen so großen Teil Ihrer Datenbank zu verlieren. Auf diese Weise behalten Sie alle Daten, die Sie benötigen, und erfüllen gleichzeitig die DSGVO-Vorschriften.
Die Vorteile des intelligenten Archivs
Es gibt eine ganze Reihe von Vorteilen, die sich aus dem intelligenten Archiv ergeben, insbesondere wenn Sie sich dafür entscheiden, Ihr Archiv automatisch von Klippa kennzeichnen und anonymisieren zu lassen. Die meisten davon haben wir oben genannt, aber für alle Fälle werden wir sie im Folgenden kurz auflisten.
- Bewusstsein über die Inhalte Ihres Archiv
In erster Linie sind Sie sich bewusst, was sich tatsächlich in Ihrem Archiv befindet. Dies kann Ihnen einen großen Vorteil verschaffen, da Sie vielleicht wertvolle Informationen entdecken, von denen Sie gar nicht wussten, dass Sie sie überhaupt haben.
- Durchsuchbares Archiv zu Ihrer Verfügung
Sie können rasch die Dateien finden, die Sie benötigen, oder herausfinden, ob Sie Dateien zu einem bestimmten Thema oder mit einem bestimmten Kontext haben. Sie können an Suchbegriffe für den Text in Dokumenten denken oder Dokumente mit bestimmten Codes oder Bezeichnungen finden.
- DSGVO-konform
Die Einhaltung der Vorschriften in Ihrem geografischen Gebiet oder weltweit ist ein wichtiges Ziel für alle Unternehmen. Mit intelligenter Archivierung und Datenanonymisierung können Sie sicher sein, dass Sie sich an die Regeln halten.
- Wertvolle Daten gespeichert halten
Durch die Anonymisierung der datenschutzsensiblen Daten in Ihrem Archiv können Sie sicher sein, dass die wertvollen Daten, die diese Informationen umgeben, auch in Zukunft sicher aufbewahrt werden.
- Kein Backoffice erforderlich
Sie brauchen keine riesige Gruppe von Angestellten, um Ihr Archiv zu durchforsten und herauszufinden, was sich darin befindet. Die Notwendigkeit für ein großes Backoffice oder Backoffice-Outsourcing ist für viele Unternehmen in der Regel gegeben, wenn sie mit einer solch umfangreichen Aufgabe konfrontiert werden. Mithilfe von Automatisierung können Sie all dies jedoch von einer KI durchführen lassen.
- Kosten- und zeitsparender Prozess
Der Verzicht auf ein Backoffice und die wertvolle Zeit für die Identifizierung und Anonymisierung von Tausenden von Dateien in Ihrem Archiv führt zu Kosteneinsparungen. Der Einsatz einer KI, die rund um die Uhr arbeiten kann, nahezu 100 % genau ist und unglaublich schnell arbeitet, wird letztendlich die Kosten für Backoffice-Mitarbeiter ausgleichen.
Nachdem Sie nun erfahren haben, welche Vorteile ein intelligentes und gesetzeskonformes Archiv mit sich bringt, sind Sie vielleicht daran interessiert zu erfahren, wie Klippa Ihnen helfen kann, dies zu erreichen.
Archivierung mit Klippa
Haben Sie ein Archiv, das dringend aufgeräumt werden muss? Sie haben keine Ahnung, was sich darin befindet? Ist Ihr Archiv GoBD-konform? Dann ist es höchste Zeit, Klippa zu kontaktieren, um zu sehen, wie wir Ihre Herausforderungen bei der Archivierung lösen können.
Kontaktieren Sie Klippa über [email protected] oder vereinbaren Sie einen Termin für eine Demo mit einem unserer Produktspezialisten.