Factuurherkenning, ook wel scan en herken of OCR genoemd, is al enkele jaren een hot topic in accounting land. Langzaam maar zeker gaat accounting over naar robotic accounting en daar is factuurherkenning een belangrijk onderdeel van. Lange tijd was factuurherkenning met name beschikbaar voor de kopinformatie zoals crediteur, debiteur, datum, factuurnummer, totaalbedrag etcetera. De ontwikkeling van de technologie heeft echter steeds slimmere machine learning systemen mogelijk gemaakt. Bij Klippa werken we bijvoorbeeld voor met deep learning. Deze techniek maakt het mogelijk om met steeds meer precisie, steeds specifiekere informatie uit documenten te halen. Daarom is ook automatische factuurherkenning op regelniveau mogelijk met de Klippa Scan en herken API en inkoopfactuurverwerking!
Waarom is factuurherkenning op regelniveau handig?
Het automatisch extraheren van de kerninformatie op een factuur is natuurlijk al enorm handig om vele facturen om te zetten naar een geautomatiseerd boekingsvoorstel. Zeker met de komst van RGS wordt het automatiseren van boekingsvoorstellen steeds makkelijker. Met de kerninformatie kan je echter niet in alle gevallen een compleet boekingsvoorstel maken. Immers hebben facturen (en kassabonnen) soms meerdere factuurregels en niet elke regel moet op dezelfde grootboekrekening, kostenplaats, kostendrager of project geboekt worden. Door op regelniveau facturen te herkennen is er meer context beschikbaar voor onze zelflerende software en kunnen bijna alle voorstellen accuraat gedaan worden.
Hoe werkt de regelherkenning op facturen?
Voor het herkennen van regels op facturen maken we gebruik van een machine learning model. Het is misschien een wat technisch verhaal, maar we gebruiken hiervoor deep learning. Een vorm van machine learning waarbij de software zelf betekenis kan ontlenen aan een set gelabelde data. Bij Klippa hebben we dus een grote dataset ontwikkeld waarbij per factuur en kassabon duidelijk is gemarkeerd wat de factuurregels zijn. Vervolgens hebben de zelflerende software op deze dataset losgelaten om daar patronen in te herkennen. Daar is uiteindelijk een zogenoemd model uitgekomen. Elke keer dat een document bij Klippa binnenkomt voor verwerking wordt het document vergeleken met ons model. Op basis van een statistische analyse wordt gekeken waar het document qua structuur op lijkt. Zodra dat duidelijk is wordt door de software de plek van de factuurregels aangewezen. Dit kan je zien als het maken van een soort highlight met een marker, zoals je dat bij een samenvatting zou doen.
Zodra je de markeringen hebt staan van de regio van de factuurregels, komt er een ander computerprogramma in werking. Dit noemen we een parser. Deze parser bekijkt alle informatie die in het gemarkeerde gebied staat en kent betekenis toe aan ieder stukje informatie. Zo worden de beschrijving, bedragen, aantallen en BTW-waardes op de factuur uit elkaar gehouden en los opgeslagen in de database per factuurregel. Deze informatie wordt uiteindelijk, samen met de kopinformatie, gebruikt om het boekingsvoorstel mee te namen op regelniveau.
Hoe ziet de herkenning van factuurregels er dan uit?
Het is soms lastig om een goede visualisatie te maken van de werking van een computerprogramma. Immers doet de software de meeste zaken juist op de achtergrond, en enkel de output wordt gevisualiseerd in een interface. Om je toch een beeld te geven van hoe de software werkt kan je onderstaande visualisatie bekijken. Je ziet hier hoe de software, naar de kerngegevens, ook een groene box op een factuur heeft aangebracht, dit is waar de regels te vinden zijn. Vervolgens zijn zwarte blokjes getekend om de individuele waardes die relevant zijn en zijn deze met zwarte lijntjes aan elkaar verbonden. Op deze manier wordt de data geëxtraheerd en aan elkaar gekoppeld, zonder gebruik te maken van templates.
Kennis maken?
Bij Klippa implementeren we onze slimme oplossingen in onze eigen software, bijvoorbeeld in de inkoopfacturen module, maar ook in de software van derden. Hiervoor hebben we gebruiksvriendelijke API’s beschikbaar. Heb jij een vraagstuk rondom scan en herken voor factuurregels? Laat het vooral weten door contact op te nemen! We denken graag met je mee.