Talloze bedrijven over de hele wereld werken met kassabonnen. In sommige gevallen voor garantie en in andere gevallen voor bijvoorbeeld administratieve doeleinden. De laatste jaren zijn er echter ook steeds meer loyalty en data clubs de waarde gaan inzien van kassabon gegevens. Steeds vaker kregen we bij Klippa dan ook de vraag of onze scan en herken oplossing ook de line items van kassabonnen kunnen uitlezen. En dat kan! In dit blog geven we meer informatie over hoe wij dit doen en hoe wij fraude voorkomen.
Wat zijn de line-items precies?
De OCR software van Klippa kan alle informatie die op een bon staat aflezen en extraheren. Voor administratieve zaken zijn met name de verkoper, datum, bedragen en de BTW relevant. Voor loyalty en data clubs is het echter veel belangrijker wat er gekocht wordt, voor welke prijs en in welke combinaties. De productregels van de kassabon uitlezen, dat is dus waar het om gaat. De Engelse term voor de productregels is line-items. Dat zijn de de melk en het brood op je kassabon van bijvoorbeeld de Albert Heijn of de Jumbo en de hamer en spijkers op de kassabon van de Gamma en Praxis.
Hoe werkt het precies?
Het uitlezen van een kassabon is een stapsgewijs proces. Zodra een foto van een bon bij ons binnenkomt gaat deze door meerdere systemen heen. Eerste bepalen we bij Klippa of een ingezonden document voldoende kwaliteit heeft voor verwerking (belichting, afmeting, resolutie etc.). Als dat zo is zetten we de afbeelding om naar een tekstbestand. Dit is een ongestructureerd tekstbestand, dus de productregels zijn nog niet te onderscheiden van de rest van de tekst op de bon. Nu gaat het document door een classificatie systeem, dit systeem bepaald op basis van de inhoud van de tekst of het echt gaat om een kassabon, of dat het misschien een pinbon of een factuur is. Dit is relevant voor de volgende en laatste verwerkingsstap. In deze laatste stap gaan we alle losse tekst namelijk omzetten naar gestructureerde informatie. Dit kan bijvoorbeeld XML, JSON of CSV zijn. Alles krijgt van Klippa dus een betekenis, die ook door andere systemen begrepen kan worden. De winkelnaam, datum, tijd, totaalbedrag, btw-bedragen & -percentages en natuurlijk de productregels worden gestructureerd opgeslagen. Zo is het document in 4 stapjes van een foto tot data omgezet. Op basis van deze data zijn vervolgens allerlei interessante loyalty en data proposities te verzinnen. Scoupy is hiervan een goed voorbeeld.
Voor welke kassabonnen werkt dat?
Er zijn meerdere manieren om de gegevens van kassabonnen uit te lezen. Sommige partijen kiezen ervoor om met templates te werken. Ze maken vervolgens per winkelketen een template die specifiek voor die winkelketen gegevens kan uitlezen. Handig voor een specifieke keten, maar niet erg schaalbaar. Bij Klippa werken we meestal met onze universele oplossing op basis van machine learning. De accuratie ligt daarbij rond de 95%, ver boven het gemiddelde in de markt. Onze oplossing werkt voor alle soorten en maten kassabonnen in Nederland, maar ook buiten Nederland. Van de Albert Heijn en de MediaMarkt tot aan de Wallmart! Heb jij 1 specifiek soort kassabon die je graag 100% perfect verwerkt wil zien? Dan kunnen we ook daar bij helpen met een template based systeem.
Interesse in een online demonstratie van de productregel herkenning of een gesprek ter kennismaking? Neem contact met ons op!