Wenn Sie in der Dokumentenverarbeitung in großem Umfang tätig sind, stehen Sie wahrscheinlich vor Problemen im Zusammenhang mit schlechter Datenqualität. Schlechte Datenqualität kann in vielen Formen auftreten. Im Falle der Dokumentenverarbeitung können dies beispielsweise schlechte Bildqualität, falsche Dateiformate und gedrehte Dokumente sein.
Klippa spezialisiert sich auf die intelligente Dokumentenverarbeitung und kann diese Probleme für Sie lösen. In diesem Blog erklären wir, wie Klippa helfen kann, wenn Sie ein hohes Volumen an Dokumenten automatisch, ohne manuellen Eingriff, korrigieren möchten.
Durch eine automatisierte Korrigierung von Dokumenten steigern Sie Ihre Verarbeitungseffizienz und somit die verbundenen Verarbeitungskosten.
Warum ist die automatische Rotation von Dokumenten relevant?
Ein klassisches Anwendungsbeispiel
Nehmen wir an, dass das Unternehmen, welches Sie führen oder für welches Sie arbeiten, regelmäßig Finanzdokumente in hohen Volumen bearbeitet. Zum Beispiel Kassenbelege und Rechnungen für Customer Loyalty-Zwecke. Diesen Anwendungsfall sehen wir häufig in Unternehmen, die eine Art Cashback Programm anbieten.
Sie haben ein Team an Mitarbeitern, welches manuell Belege prüfen und bestimmte Daten extrahieren oder bestimmte Genehmigungen durchführen muss. Die manuelle Prüfung von Belegen ist bereits bei normalen Belegen eine zeitaufwändige Aufgabe, ganz zu schweigen von Belegen, die schwer lesbar sind.
Wenn Sie 100.000 Belege pro Monat verarbeiten und davon 10% in falscher Ausrichtung (z.B seitwärts gedreht) vorliegen, bedeutet es, dass Ihr Team jeden Monat 10.000 Belege manuell korrigieren muss. Klingt nach einer zeitraubenden und lästigen Aufgabe, oder?
Die jährlichen Kosten für das manuelle Rotieren von 120.000 Dokumenten belaufen sich leicht auf 20.000 € allein an reinen Arbeitskosten. Glücklicherweise kann die Automatisierung diese Kosten leicht um 90 % reduzieren, was eine Ersparnis von bis zu 18.000 € bedeutet. Ein großartiger Business Case!
Unten sehen Sie einige Beispiel Scans von eingesendeten Kundenbelegen:
Wie funktioniert die automatische Korrektur der Ausrichtung?
Es gibt es viele verschiedene Probleme, die in eingescannten und eingesendeten Dokumenten vorkommen können. Wir konzentrieren uns in diesem Artikel spezifisch darauf die fehlerhaften Bilder oben automatisch in die richtige Ausrichtung zu drehen.
Der erste und intuitive Einfall vieler Nutzer wäre es die Höhe und Breite der Dokumente zu prüfen und sie in die vertikale Ausrichtung zu drehen, so dass die Höhe größer als die Breite ist. Das klingt zwar einfach und effektiv, ist jedoch fehleranfällig. Eingesandte Belege und Rechnungen liegen, wie wir festgestellt haben, in vielen verschiedenen Formen und Größen vor.
Manchmal sind sie rechteckig, manchmal quadratisch. Dieser Ansatz kann dazu führen, dass Dokumente, die eigentlich in der richtigen Rotation sind, in die falsche Rotation gedreht werden. Es kann auch dazu führen, dass Sie Dokumente um 180 Grad in die entgegengesetzte Richtung drehen, und somit auf dem Kopf “stehen”.
Glücklicherweise gibt es eine effektivere und weniger fehleranfällige Alternative, die den Textinhalt des Dokuments analysiert. Um dorthin zu gelangen, führt unsere Software 3 wichtige Schritte aus:
1. Zuerst optimieren wir die Bildqualität. Das können wir tun, indem wir die Eingangsbilder zuschneiden, die Perspektive korrigieren und den Kontrast verbessern. Dadurch erhalten wir bereits besser lesbare Bilder, was für den zweiten Schritt relevant ist. Ein Beispielergebnis des ersten Schritts sehen Sie unten:
2. Im zweiten Schritt konvertieren wir die Dokumente und Bilder mit OCR in Text. Handelt es sich bei dem Dokument um ein PDF, wird es zunächst in ein Bild und dann in Text umgewandelt. So entsteht ein durchsuchbares Dokument und die Textausrichtung wird sichtbar.
Natürlich liest niemand einen Satz von oben nach unten, sondern meist von links nach rechts und in einigen Fällen von rechts nach links. In manchen Dokumenten werden Sie Text in mehreren Ausrichtungen haben. In diesen Fällen führen wir eine Textzählung durch und wählen die Ausrichtung, in der sich der meiste Text befindet.
3. Da die Textausrichtung nun bekannt ist, kann das Dokument nun fast in die korrekte Ausrichtung gebracht werden. Bevor dies geschieht ist es jedoch entscheidend die Sprache des Dokumentes zu prüfen.
Bei einigen Sprachen wird nämlich von links nach rechts gelesen und bei einigen anderen von rechts nach links. Dieser Faktor spielt eine wichtige Rolle für die korrekte Ausrichtung des Dokumentes oder Bildes. Wir verwenden also zunächst einen Machine Learning Classifier, um das Herkunftsland und die Sprache des Dokuments zu bestimmen.
Sobald dies geschehen ist, kann das Bild oder Dokument nun von unserer OCR Software gedreht und im gewünschten Format gespeichert werden. In vielen Fällen ist dies das ursprüngliche Dateiformat. Bei Bildern handelt es sich oft um JPEG, aber es ist auch möglich Dokumente in andere Formate zu konvertieren, zum Beispiel PDF. Das Ergebnis sieht in etwa so aus:
Einen oder zwei Schritte weiter: OCR-Texterkennung
Eventuell ist die automatische Korrigierung der Ausrichtung und die Optimierung der Bildqualität alles, was Sie für Ihren Use Case benötigen. Wir können jedoch noch ein oder zwei Schritte weiter gehen: Die OCR-Ergebnisse des Dokuments können wir in einem TXT-Format bereitstellen, so dass der Text auf dem Dokument nun durchsuchbar ist, d.h. Sie können ganz einfach den bestimmten Datenfeldern suchen.
Diese Arbeit können wir jedoch auch für Sie erledigen, da wir die Ergebnisse sogar in einem strukturierten Format wie JSON zurückgeben können. Unten sehen Sie ein vereinfachtes Beispiel für diese beiden zusätzlichen Schritte:
Was wir Ihnen bei Klippa bieten
Wie Sie sehen können, steckt hinter der automatischen Korrigierung der Ausrichtung ein ziemlich technischer Prozess, der Computer Vision, OCR und Dokumentenkonvertierungstechniken beinhaltet. Glücklicherweise müssen Sie diese Tools nicht selbst entwickeln.
Klippa bietet seine Technologie über APIs, SDKs und Schnittstellen an, welches eine Implementierung in Ihre bestehenden Workflows innerhalb kürzester Zeit (z.T. innerhalb weniger Stunden) gewährleisten kann. Das automatische Drehen von Bildern, Dokumenten und Seiten ist nur die Spitze des Eisbergs.
Wir bei Klippa spezialisieren uns auf eine breite Palette an dokumenten-bezogenen Herausforderungen. Wenn Sie also einer Herausforderung bezüglich der Bewältigung von Dokumenten stehen, können Sie sich jeder Zeit mit einem unserer Produktspezialisten in Kontakt oder eine unverbindliche Demo planen. Wir freuen uns Ihnen weiterzuhelfen!