Das Sammeln von Produkt- und Preisdaten aus Supermarktquittungen kann schwierig sein. Konkrete Daten aus einer großen Menge von Quittungen zu sammeln, erfordert Zeit, Präzision und natürlich die Bereitschaft zahlreicher Käufer, ihre Quittungen einzusenden.
Einmal gesammelt, braucht man ein Heer von Mitarbeitern, um Beleg auf Beleg zu verwertbaren Daten zu verarbeiten. Vielleicht überlegen Sie, dass hier Outsourcing des Backoffice oder Crowdsourcing, wie z.B. Amazon’s Mechanical Turk, eine gute Gelegenheit wäre, um diese mühsame Arbeit zu erledigen.
Leider kann man bei Menschen, egal wie umfassend Sie sie instruieren, nie die Genauigkeit und Zuverlässigkeit eines Computers erwarten. Wie das Sprichwort sagt, sind es unsere Fehler, die uns menschlich machen. Aber neben der Genauigkeit sind auch die Bearbeitungskosten und die Bearbeitungszeit von Bedeutung.
Auch bei diesen beiden Themen haben Computer, gegenüber dem Menschen, die Nase vorn. Daher stellt sich die Frage: Wie bringt man Software dazu, die gesamte Verarbeitung der Belege für Sie zu übernehmen? Klippa hat die Lösung für Sie!
Warum Scannen von Kassenbelegen und was ist das Ziel?
Beim Scannen von Supermarkt-Quittungen werden Quittungen mit OCR-Software ausgelesen, alle relevanten Datenfelder identifiziert und der Text in ein brauchbares strukturiertes Format umgewandelt. Mit der Klippa API ist der Löwenanteil dieses Prozesses vollständig automatisiert.
Ohne jeglichen Aufwand stehen Ihnen riesige Datenmengen zur Verfügung. Sie können diese Daten verwenden, um Produktforschung zu betreiben, Produktverbesserungen anzustoßen, das Kaufverhalten zu analysieren, Preisstrategien zu erforschen, Marketingkampagnen aufzusetzen und vieles mehr.
Wie funktioniert OCR-Technologie auf Kassenbelegen?
Einigen reicht es vielleicht zu wissen, dass der Kassenbeleg eines Kunden als Foto an die API gesendet werden kann, und anschließend strukturierte Daten zurückgesendet werden. Doch was passiert dazwischen?
Stellen Sie sich vor, die API ist wie der Kellner, welcher im Restaurant Ihre Bestellung entgegennimmt, diese in die Küche gibt, wo die Bestellung bearbeitet wird, und das fertige Essen wieder an Ihren Tisch zurückbringt.
Werfen wir einen Blick, auf die vereinfachte Übersicht der Schritte, welche die API durchführt:
- Der Kunde fotografiert mit einem Smartphone den Kassenbeleg.
- Die API nimmt das Bild und scannt es.
- Mittels einer KI werden unscharfe und schlecht belichtete Bilder korrigiert, um den Text auf der Quittung zu verdeutlichen.
- Mit Hilfe einer optischen Zeichenerkennungssoftware (OCR) wird der Text gelesen und in ein TXT-Dokument umgewandelt.
- Durch Machine-Learning und Deep-Learning werden wichtige Datenpunkte und Kategorien identifiziert, welche in ein JSON-Format umgewandelt werden.
- Die API “serviert” die JSON-Daten innerhalb weniger Sekunden, sodass Sie diese nun zu Ihren Zwecken nutzen können.
Wer ist also der Koch, der in der Küche steht, um Ihre Mahlzeit zuzubereiten? In diesem Fall ist der Koch eine KI, welche mit zahlreichen Beispielen von Quittungen, Tickets, Rechnungen und anderen Dokumenten ausgebildet wurde. Die KI lernt zu bestimmen, was ein Datenfeld ausmacht, z.B. ob ein Datenfeld eine Produktlinie, ein Preis, eine Firmenadresse oder etwas anderes ist.
Im Laufe der Zeit hat sich diese KI zu einem sehr versierten Koch entwickelt, da sie ihre Fähigkeit, bestimmte Daten automatisch zu erkennen, nahezu perfektioniert hat. Diese Form des maschinellen Lernens hat es der Maschine ermöglicht, mit einer Genauigkeit von >95% riesige Mengen zu verarbeiten.
Unsere Koch-KI lässt nichts anbrennen, versalzt keine Suppe und verwandelt Ihre Daten in JSON automatisch innerhalb weniger Sekunden. Dadurch kann die API ein perfektes Gericht auftischen.
Welche Daten können aus Quittungen extrahiert werden?
Im Wesentlichen können alle Daten, die sich auf einer Quittung befinden, extrahiert und unterschiedlich genutzt werden. Im Folgenden erhalten Sie einen kurzen Überblick über Einsatzgebiete, in denen Daten von Quittungen genutzt werden und für die ein vollständiger Datensatz für gründliche Recherchen zusammengestellt werden kann.
Produktinformationen
Die Produktinformationen auf dem Beleg bestehen nicht nur aus dem Namen, welcher auf dem Beleg genannt ist. Sie können jede Art von Kontextinformationen wie Beschreibungen, Marken, Inhaltsstoffe oder sogar das Herkunftsland enthalten. Diese Beschreibungen der Einzelposten werden normalerweise von Datenpunkten wie Anzahl oder Menge begleitet.
Produkt-Klassifizierung
Die Produkte können in Klassen eingeteilt werden, wie z.B. Nahrungsmittel und Getränke (Gemüse, Snacks, Milchprodukte, Soda, Saft), aber auch Elektronik, Reinigung, Körperpflege, Kleidung usw. Auf Ihren Wunsch hin, können diese Klassifizierungen auch in Bezug auf den Nährwert oder den Gehalt an spezifischen Inhaltsstoffen vorgenommen werden.
Standort und Händlerdaten
Der Name, die Adresse, die Website und andere Kontaktdaten des Händlers können aus der Quittung entnommen werden, was Ihnen allgemeine Einsichten in den Standort und die Geschäfte gibt, die auf der Quittung stehen.
Pricing data
Der Stückpreis, die Größe des Warenkorbs, die MwSt.-Beträge und -Prozentsätze sowie die Währung sind alle Teil des Datensatzes, der aus einer Quittung extrahiert werden kann. Alle Informationen bezüglich der Preisgestaltung enthalten wesentliche Informationen für Marktforschungszwecke.
Durch OCR-Software verschiedene Arten von Betrug aufdecken
Leider hat man als Unternehmen immer wieder mit Betrug beim Scannen von Supermarktquittungen zu tun, insbesondere wenn es sich um Treuekampagnen und Cashback-Aktionen handelt. Betrüger können sehr kreativ werden, wenn es darum geht, Quittungen zu ihren Gunsten zu manipulieren.
Glücklicherweise ist Klippas KI in der Lage, solche Betrugsversuche aufzudecken. Die Betrugserkennung wird auf Anfrage individuell angepasst. Im Folgenden werden drei Betrugsversuche erläutert, welche Klippa aufdecken kann:
Finden Sie doppelte Quittungen
Die API ist in der Lage festzustellen, ob eine Quittung bereits vorher eingescannt wurde. Betrüger könnten versuchen, das System zu täuschen, indem sie mehrere Cashbacks mit einer einzelnen Quittung beantragen (z.B. durch das Anlegen mehrerer Konten), aber dies kann natürlich auch versehentlich geschehen.
Das System ist in der Lage, einen doppelten Eintrag durch Bild- und Datenhashing zu erkennen, indem es identische Informationen zwischen verschiedenen Einträgen identifiziert.
Erkennen von Bildbearbeitungen
Heutzutage ist es nicht allzu schwierig, ein Foto mit Bildbearbeitungsprogrammen wie Photoshop zu manipulieren. Dies erleichtert Betrügern den Versuch, Einzelposten zu ersetzen oder den Preis, das Datum oder die Uhrzeit des Kaufs zu ändern.
Die API von Klippa ist in der Lage, ungleichmäßige Strukturen der Pixel des Fotos zu erkennen und erkennt ein “photoshopped” Bild.
Gefälschte Quittungen
Grundsätzlich ist es möglich, dass jemand von Grund auf eine Quittung fälscht. Zusätzlich zu der Manipulation von Pixel durch Bildbearbeitung, ist die API in der Lage, Informationen auf einer Quittung, wie Namen der Geschäfte, Adressen, Handelsregister-Nummern, Telefonnummern etc., mit online verfügbaren Datenbanken zu vergleichen.
Wenn hier etwas nicht zusammenpasst, wie z.B. der Name des Geschäfts und eine falsche Steuernummer, wird dies entdeckt.
Was können Sie mit gescannten Supermarktbelegen tun?
Sobald die Daten ausgelagert sind, gibt es zahlreiche Möglichkeiten, die Daten auf Ihre Bedürfnisse anzuwenden. Der folgende Abschnitt beschreibt Beispiele für Anwendungsfälle:
Belegscanner für die Warenkorbanalyse
Um das Verhalten Ihrer Kunden zu verstehen, wird eine Ihrer Aufgaben darin bestehen, eine Marktkorbanalyse (MBA) durchzuführen. Um alle Produktdaten zu sammeln, die Sie für eine genaue Analyse benötigen, richten Sie eine Kampagne ein, um die Kunden zu ermutigen, Ihnen demografische Informationen zur Verfügung zu stellen und ein Foto ihrer Supermarktquittungen hochzuladen.
Diese Fotos müssen in brauchbare und genaue Daten umgewandelt werden, wie z.B. Produkttypen, Marken oder andere Produktqualitäten. Jedes einzelne Foto, das ein Kunde hochlädt, wird automatisch gescannt und in segmentierten Text umgewandelt. Dieser TXT wird dann in ein strukturiertes Format (JSON) verarbeitet, das Ihnen die Möglichkeit bietet, eine effektive Affinitätsanalyse durchzuführen.
Sie können Muster im Kaufverhalten entdecken, z.B. Produkte, die häufig zusammen gekauft werden. Ein großer Einzelhändler wäre dann in der Lage, Werbe- und Marketingkampagnen zu initiieren, um den Verkauf zu steigern.
Scannen von Supermarkt-Belegen zur Erfassung geographischer Preisdaten
Um die Preisstrategie Ihres Unternehmens zu bestimmen, müssen Sie die Preisgestaltung der Wettbewerber in Ihrem Geschäftsbereich analysieren. Sie können z.B. die Preisgestaltung der Konkurrenz in Ihrer Nachbarschaft oder Provinz analysieren und feststellen, welche Preisgestaltung Ihre Marke am besten repräsentiert und Kunden auf Ihr Unternehmen aufmerksam macht.
Sie sammeln Kundenbelege und verarbeiten diese über die Klippa API. Die API ist in der Lage, automatisch alle Felder auf dem Beleg zu lesen und zu extrahieren, einschließlich Produktname, Preisgestaltung, Mehrwertsteuer und Händler.
Die Kombination dieser Elemente ermöglicht es Ihnen, den niedrigsten und höchsten Preis zu ermitteln, der für ein bestimmtes Produkt in Ihrer Nähe angeboten wird. Wenn Sie sich für eine API im Gegensatz zu Outsourcing und Crowdsourcing entscheiden, werden Sie mit einem Prozess belohnt, der schneller, genauer und kostengünstiger ist.
Cashback- und Treueaktionen
Das Scannen von Supermarktquittungen ist ideal für die automatisierte Cashback-Verarbeitung oder ein Treuepunktesystem. Sie können eine Kampagne einrichten, um die Aufmerksamkeit der Kunden auf ein neues Produkt zu lenken und den Direktverkauf zu steigern.
Teil der Marketingkampagne ist, dass Kunden eine Quittung mit dem Produkt hochladen müssen, um Cashback zu erhalten. Wenn Sie diese Fotos in Tausenden oder sogar Millionenhöhe erhalten, benötigen Sie eine schnelle und präzise Verarbeitung, damit die Kunden ihr Cashback zügig erhalten.
Die API setzt OCR ein, um die Einzelposten der Quittungen zu lesen und diese in ein JSON-Format zu extrahieren. Das ermöglicht es Ihnen, die Produkte der Kampagne automatisch zu erkennen und den Zahlungsausgleich in Gang zu setzen. Das alles geschieht mit der Geschwindigkeit und Zuverlässigkeit, die Ihre Kunden mit Sicherheit zufrieden stellen wird.
FAQs zur OCR Software
Welche Felder kann die Klippa OCR Software aus Quittungen von Supermärkten entnehmen?
Unten sind die standardmäßig extrahierten Datenfelder aufgelistet. Diese können für jeden Kunden angepasst werden. Zusätzliche Felder können auf Anfrage extrahiert werden.
- Dokumenttyp
- Bildqualität
- Herkunftsland
- Sprache der Quittung
- Name des Händlers
- Angaben zur Adresse des Händlers
- Kontaktdaten des Händlers
- Website des Händlers
- Zahlungsmethode
- Kartennummer
- Betrag des Rückgeldes
- Datum des Kaufs
- Gesamtbetrag und Währung
- Mehrwertsteuer-Beträge
- Mehrwertsteuer-Prozentsätze
- Artikelbeschreibung, Menge, Preise und Kategorie
- Quittungsnummer
- Nummer der Handelskammer
- Umsatzsteuer-Nummer
- Und viele andere Bereiche
Funktioniert die OCR Software auch bei Fotos von geringer Qualität?
Unsere API enthält bereits Bildvorverarbeitungsfunktionen, mit denen Bilder schlechter Qualität zur besseren Verarbeitung verbessert und gedreht werden können. Darüber hinaus bietet Klippa ein Scan-SDK an, das in mobile Anwendungen implementiert werden kann.
Dieses SDK umfasst Bildverarbeitungsfunktionen wie Perspektivenkorrektur und Blend- und Unschärfeerkennung zur Klärung des Inhalts von Fotos. Auf diese Weise erhalten Sie nur Fotos, die gültige Informationen für die weitere Verarbeitung enthalten.
Es verhindert das “Garbage in, Garbage out”-Prinzip auf der Seite des Kunden zum Zeitpunkt der Aufnahme des Fotos.
Wie genau ist die OCR-API Software?
Supermarktquittungen können gescannt und Daten mit einer Genauigkeit von >95% extrahiert werden. Das bedeutet, dass die KI selten eine Zeile auf einer Quittung missversteht. Sie können mit Sicherheit davon ausgehen, dass sie Quittungen korrekt verarbeiten wird.
Wenn Sie bestimmte Verbesserungen sehen, können wir unsere Modelle individuell trainieren, um Ihren Anwendungsfall zu unterstützen und den besten Nutzen für Ihr Unternehmen zu erzielen.
Funktioniert es bei allen Produkten?
Auf einer Supermarktquittung kann eine Vielzahl von Produkten stehen. Nicht nur Ihre durchschnittlichen Lebensmittel, sondern auch eine elektrische Zahnbürste oder eine Bratpfanne. Unabhängig von der Produktart kann Klippa jede Produktlinie auf einem Beleg mittels OCR und maschinellem Lernen identifizieren.
Es wird auch in der Lage sein, Produktkategorien wie Lebensmittel & Getränke, Körperpflege, Reinigung, Kleidung, Elektronik und mehr zu erkennen.
Was ist mit Datenschutz und DSGVO?
Wie bei allen anderen Dienstleistungen, die Klippa anbietet, ist das Scannen von Supermarktquittungen vollkommen sicher und DSGVO-konform. Standardmäßig verwenden wir für die Verarbeitung von Quittungen ISO-zertifizierte Server innerhalb der Europäischen Union. Sind Sie außerhalb der EU ansässig?
Wir können sehr schnell einen kundenspezifischen Server in Ihrer Region einrichten. Es besteht außerdem ein Datenverarbeitungsabkommen. Wir speichern nach dieser Verarbeitung keine Daten von Ihnen oder Ihren Kunden.
In welchen Ländern können Sie es verwenden?
Klippa’s Engine funktioniert am besten auf westlichen Sprachen. Gängige Sprachen, mit denen wir arbeiten, sind Englisch, Niederländisch, Deutsch, Französisch, Spanisch, Portugiesisch, Schwedisch, Norwegisch, Dänisch, Finnisch und Italienisch. Jede andere Sprache kann auf Anfrage unterstützt werden.
Wir sind in der Lage, Machine Learning für jede Sprache einzusetzen.
Machen Sie sich mit Klippa vertraut!
Wir bei Klippa helfen Ihnen gerne bei all Ihren Anforderungen rund um das Thema Dokumentenverarbeitung. Wenn Sie eine Herausforderung in Bezug auf die Verarbeitung von Quittungen oder anderen Dokumenten haben, können Sie uns gerne eine Nachricht senden oder eine Online-Demonstration mit einem unserer Experten unten planen.