Automatische Dokumentdrehung mit OCR & AI

Wenn Sie in der Dokumentenverarbeitung in großem Umfang tätig sind, stehen Sie wahrscheinlich vor Problemen im Zusammenhang mit schlechter Datenqualität. Schlechte Datenqualität kann in vielen Formen auftreten. Im Falle der Dokumentenverarbeitung können dies beispielsweise schlechte Bildqualität, falsche Dateiformate und gedrehte Dokumente sein.

Klippa spezialisiert sich auf die intelligente Dokumentenverarbeitung und kann diese Probleme für Sie lösen. In diesem Blog erklären wir, wie Klippa helfen kann, wenn Sie ein hohes Volumen an Dokumenten automatisch, ohne manuellen Eingriff, korrigieren möchten.

Durch eine automatisierte Korrektur von Dokumenten steigern Sie Ihre Verarbeitungseffizienz und somit die verbundenen Verarbeitungskosten.

Inhaltsverzeichnis

Kurzübersicht

Falsch ausgerichtete Dokumente: Eingescannte Belege, Rechnungen oder Ausweise liegen oft in falscher Ausrichtung vor und erschweren die OCR-Verarbeitung.
Automatisiertes Drehen mit OCR & KI: Korrekte Ausrichtung durch Kombination aus Texterkennung, Sprachanalyse und Layout-Erkennung – ganz ohne manuellen Eingriff.
Verbesserte Datenqualität: Optimale Texterkennung durch bessere Bildausrichtung als Grundlage für weitere Verarbeitungsschritte.
Nahtlose Integration: Drehen und weitere OCR-Schritte per API direkt in bestehende Workflows integrierbar.
Vorteile: Weniger manuelle Nacharbeit, höhere Verarbeitungsqualität, geringere Kosten und Skalierbarkeit bei großen Volumina.

Warum ist das automatische Drehen von Dokumenten relevant?

Ein klassisches Anwendungsbeispiel

Nehmen wir an, dass das Unternehmen, welches Sie führen oder für welches Sie arbeiten, regelmäßig Finanzdokumente in hohen Volumen bearbeitet. Zum Beispiel Kassenbelege und Rechnungen für Customer Loyalty-Zwecke. Diesen Anwendungsfall sehen wir häufig in Unternehmen, die eine Art Cashback Programm anbieten.

Sie haben ein Team an Mitarbeitern, welches manuell Belege prüfen und bestimmte Daten extrahieren oder bestimmte Genehmigungen durchführen muss. Die manuelle Prüfung von Belegen ist bereits bei normalen Belegen eine zeitaufwändige Aufgabe, ganz zu schweigen von Belegen, die schwer lesbar sind.

Wenn Sie 100.000 Belege pro Monat verarbeiten und davon 10 % in falscher Ausrichtung (z. B. seitwärts gedreht) vorliegen, bedeutet es, dass Ihr Team jeden Monat 10.000 Belege manuell korrigieren muss. Klingt nach einer zeitraubenden und lästigen Aufgabe, oder?

Die jährlichen Kosten für das manuelle Drehen von 120.000 Dokumenten belaufen sich leicht auf 20.000 € allein an reinen Arbeitskosten. Glücklicherweise kann die Automatisierung diese Kosten leicht um 90 % reduzieren, was eine Ersparnis von bis zu 18.000 € bedeutet. Ein großartiger Business-Case!

Unten sehen Sie einige Beispielscans von eingesendeten Kundenbelegen:

Automatically rotate images and documents

Wie funktioniert die automatische Korrektur der Ausrichtung?

Es gibt viele verschiedene Probleme, die in eingescannten und eingesendeten Dokumenten vorkommen können. Wir konzentrieren uns in diesem Artikel spezifisch darauf, die fehlerhaften Bilder oben automatisch in die richtige Ausrichtung zu drehen.

Der erste und intuitive Einfall vieler Nutzer wäre es, die Höhe und Breite der Dokumente zu prüfen und sie in die vertikale Ausrichtung zu drehen, sodass die Höhe größer als die Breite ist. Das klingt zwar einfach und effektiv, ist jedoch fehleranfällig. Eingesandte Belege und Rechnungen liegen, wie wir festgestellt haben, in vielen verschiedenen Formen und Größen vor.

Manchmal sind sie rechteckig, manchmal quadratisch. Dieser Ansatz kann dazu führen, dass Dokumente, die eigentlich in der richtigen Rotation sind, in die falsche Rotation gedreht werden. Es kann auch dazu führen, dass Sie Dokumente um 180 Grad in die entgegengesetzte Richtung drehen, und somit auf dem Kopf „stehen“.

Glücklicherweise gibt es eine effektivere und weniger fehleranfällige Alternative, die den Textinhalt des Dokuments analysiert. Um dorthin zu gelangen, führt unsere Software 3 wichtige Schritte aus:

Bildqualität optimieren: Zuerst optimieren wir die Bildqualität. Das können wir tun, indem wir die Eingangsbilder zuschneiden, die Perspektive korrigieren und den Kontrast verbessern. Dadurch erhalten wir bereits besser lesbare Bilder, was für den zweiten Schritt relevant ist. Ein Beispielergebnis des ersten Schritts sehen Sie unterhalb:

2. Texterkennung mittels OCR: Im zweiten Schritt konvertieren wir die Dokumente und Bilder mit OCR in Text. Handelt es sich bei dem Dokument um ein PDF, wird es zunächst in ein Bild und dann in Text umgewandelt. So entsteht ein durchsuchbares Dokument und die Textausrichtung wird sichtbar.

Natürlich liest niemand einen Satz von oben nach unten, sondern meist von links nach rechts und in einigen Fällen von rechts nach links. In manchen Dokumenten werden Sie Text in mehreren Ausrichtungen haben. In diesen Fällen führen wir eine Textzählung durch und wählen die Ausrichtung, in der sich der meiste Text befindet.

Sobald dies geschehen ist, kann das Bild oder Dokument jetzt von unserer OCR Software gedreht und im gewünschten Format gespeichert werden. In vielen Fällen ist dies das ursprüngliche Dateiformat. Bei Bildern handelt es sich oft um JPEG, aber es ist auch möglich, Dokumente in andere Formate zu konvertieren, zum Beispiel PDF. Das Ergebnis sieht in etwa so aus:

3. Spracherkennung und finale Ausrichtung: Da die Textausrichtung nun bekannt ist, kann das Dokument nun fast in die korrekte Ausrichtung gebracht werden. Bevor dies geschieht, ist es jedoch entscheidend, die Sprache des Dokumentes zu prüfen.

Bei einigen Sprachen wird nämlich von links nach rechts gelesen und bei einigen anderen von rechts nach links. Dieser Faktor spielt eine wichtige Rolle für die korrekte Ausrichtung des Dokumentes oder Bildes. Wir verwenden also zunächst einen Machine-Learning-Classifier, um das Herkunftsland und die Sprache des Dokuments zu bestimmen.

Sobald dies geschehen ist, kann das Bild oder Dokument jetzt von unserer OCR-Software gedreht und im gewünschten Format gespeichert werden. In vielen Fällen ist dies das ursprüngliche Dateiformat. Bei Bildern handelt es sich oft um JPEG, aber es ist auch möglich, Dokumente in andere Formate zu konvertieren, zum Beispiel PDF. Das Ergebnis sieht in etwa so aus:

Einen oder zwei Schritte weiter: OCR-Texterkennung

Eventuell ist die automatische Korrektur der Ausrichtung und die Optimierung der Bildqualität alles, was Sie für Ihren Use Case benötigen. Wir können jedoch noch ein oder zwei Schritte weiter gehen: Die OCR-Ergebnisse des Dokuments können wir in einem TXT-Format bereitstellen, sodass der Text auf dem Dokument jetzt durchsuchbar ist, d. h. Sie können ganz einfach nach bestimmten Datenfeldern suchen.

Diese Arbeit können wir jedoch auch für Sie erledigen, da wir die Ergebnisse sogar in einem strukturierten Format wie JSON zurückgeben können. Unten sehen Sie ein vereinfachtes Beispiel für diese beiden zusätzlichen Schritte:

Automatisiertes Drehen von Dokumenten mit Klippa DocHorizon

Das Drehen falsch ausgerichteter Dokumente ist weitaus mehr als nur eine einfache Bildmanipulation. Es erfordert ein Zusammenspiel moderner Technologien wie optische Zeichenerkennung (OCR), Computer Vision und sprachbasierter Analyse. Bei Klippa kombinieren wir diese Technologien in einer leistungsstarken, cloudbasierten Lösung – ohne dass Sie eigene Systeme entwickeln oder warten müssen.

Mit Klippa DocHorizon profitieren Sie von:

Automatischer Korrektur der Ausrichtung: Unsere Software erkennt fehlerhafte Ausrichtungen selbstständig und dreht Dokumente zuverlässig in die korrekte Leserichtung – unabhängig vom Dateiformat oder Dokumententyp.
KI-gestützter Spracherkennung: Durch die Analyse von Textstruktur und Sprache wird eine präzise Ausrichtung sichergestellt, auch bei Dokumenten mit gemischten Layouts oder nicht-lateinischen Schriften.
Optimierter OCR-Output: Durch saubere Ausrichtung und verbesserte Bildqualität wird die Texterkennung deutlich genauer – ein entscheidender Faktor für nachgelagerte Prozesse.
Flexible Integration: Ob via REST API oder individuell zugeschnittene Schnittstellen – Klippa lässt sich nahtlos in bestehende Systeme und Workflows einbinden.
Datensicherheit & Skalierbarkeit: Unsere Lösung ist ISO-zertifiziert, DSGVO-konform und in der EU gehostet. Sie eignet sich für kleine Teams ebenso wie für große Organisationen mit hohem Dokumentenvolumen.

Ob als einzelner Baustein oder als Teil einer ganzheitlichen Geschäftsprozessoptimierung – Klippa unterstützt Sie dabei, manuelle Korrekturen zu vermeiden, Ihre Datenqualität zu erhöhen und Prozesse nachhaltig zu automatisieren.

Jeden Dokumentenworkflow automatisieren.

Kosten senken. Zeit sparen. Betrug verhindern.

Demo planen

Kontakt

FAQ – Automatische Dokumentdrehung

Warum ist das automatische Drehen von Dokumenten wichtig?

Falsch ausgerichtete Dokumente können die OCR-Ergebnisse erheblich verschlechtern. Eine automatische Ausrichtungskorrektur verbessert die Lesbarkeit, erhöht die Datenqualität und reduziert den manuellen Aufwand bei der Verarbeitung.

Welche Arten von Dokumenten können automatisch gedreht werden?

Unsere Software unterstützt verschiedene Formate wie PDF, JPEG, PNG und TIFF. Gängig sind Belege, Rechnungen, Ausweise, Verträge und weitere gescannte oder fotografierte Dokumente.

Wie erkennt die Software die richtige Ausrichtung?

Die automatische Drehung basiert auf Texterkennung (OCR), Sprachanalyse und Layout-Erkennung. Dabei wird geprüft, in welcher Richtung der meiste lesbare Text erkannt wird und ob er zur Sprache passt (z. B. links-nach-rechts oder rechts-nach-links).

Was passiert mit Dokumenten, die bereits korrekt ausgerichtet sind?

Dokumente, die in der richtigen Ausrichtung vorliegen, werden erkannt und bleiben unverändert. Die Software überprüft jeden Fall individuell, um unnötige Änderungen zu vermeiden.

Kann die automatische Drehung auch mit anderen OCR-Funktionen kombiniert werden?

Ja, das automatische Drehen ist oft der erste Schritt in der Verarbeitung. Danach können Daten extrahiert, validiert und in strukturierte Formate (z. B. JSON, XML) überführt werden – alles in einem Workflow.

Ist das Drehen von Dokumenten auch in großem Umfang möglich?

Absolut. Klippa DocHorizon ist für die skalierbare Verarbeitung großer Dokumentenmengen konzipiert und lässt sich problemlos in bestehende Systeme via API integrieren.

Dokumente, Bilder und Seiten mit OCR und KI automatisch drehen