

Als financieel medewerker, boekhouder of medewerker van een inkoopteam, weet je dat factuurverwerking een tijdrovende en frustrerende taak kan zijn. Elke maand heb je te maken met een stortvloed aan facturen, elk met hun eigen unieke indeling, lay-out en eigenaardigheden.
Het goede nieuws? Je hoeft niet te blijven worstelen met inefficiënte processen. In deze blog lees je verschillende strategieën om factuurgegevens te scannen, variërend van semi-geautomatiseerde oplossingen zoals Excel en OCR op basis van sjablonen tot volledig geautomatiseerde AI-gebaseerde software.
Aan het eind zul je duidelijk begrijpen welke methode het beste bij jouw bedrijfsbehoeften past, zodat je je workflow kunt stroomlijnen, fouten kunt verminderen en de efficiëntie kunt verbeteren.
Belangrijkste Punten
- Semi-automatische gegevensextractie voor facturen is een praktische oplossing voor kleine bedrijven – Methoden zoals de functie Get Data van Excel en OCR op basis van sjablonen helpen bij het extraheren van gestructureerde gegevens uit facturen, maar vereisen handmatige validatie en werken het best met consistente factuurformaten.
- Volledig geautomatiseerde AI-gebaseerde oplossingen bieden meer efficiëntie – AI-gebaseerde factuurverwerking kan omgaan met verschillende formaten, handgeschreven tekst en verschillende belastingregels, waardoor het ideaal is voor bedrijven die te maken hebben met grote factuur volumes.
- Veelvoorkomende problemen bij factuurverwerking vertragen workflows – Inconsistente lay-outs, ongestructureerde line items, handgeschreven notities en indieningen in meerdere formaten maken handmatige extractie en extractie op basis van sjablonen gevoelig voor fouten.
- Het automatiseren van de extractie van factuurgegevens vermindert fouten en bespaart tijd – AI-gebaseerde platforms zoals Klippa DocHorizon vereenvoudigen workflows, verbeteren de nauwkeurigheid en de financiële controle door handmatige interventie te elimineren.
Wat wordt bedoeld met het scannen en herkennen van facturen?
Het scannen en herkennen van factuurgegevens is het proces van het vastleggen van belangrijke gegevens van facturen. Dit proces kan handmatig, semi-geautomatiseerd of volledig geautomatiseerd zijn met behulp van OCR-technologie (Optical Character Recognition) en AI. Bedrijven gebruiken factuurherkenning om de crediteurenadministratie te vereenvoudigen, menselijke fouten te verminderen en de financiële nauwkeurigheid te verbeteren.
Hoe scan je gegevens uit facturen?
Voor bedrijven die een beheersbare hoeveelheid facturen verwerken, bieden semi-automatische gegevensextractie met Excel en OCR op basis van sjablonen een praktische middenweg. Hieronder bekijken we hoe elke aanpak werkt, samen met hun beperkingen, om je te helpen bepalen welke het beste past bij jouw bedrijfsbehoeften.
1. Factuurgegevens scannen met Excel Get Data
Voor kleine bedrijven of teams die een beperkt aantal facturen verwerken, biedt Microsoft Excel een semi-geautomatiseerde manier om gegevens te extraheren met de functie Get Data. Hoewel er nog steeds handmatige goedkeuring nodig is, kan deze methode het proces vereenvoudigen door gestructureerde gegevens uit PDF-facturen naar een bewerkbaar formaat te halen.
Zo extraheer je factuurgegevens met Excel:
Stap 1: Factuurgegevens importeren uit een PDF
- Open Excel → Data tab → Get Data → From File → From PDF
- Selecteer het PDF-bestand van de factuur
Stap 2: De gegevens opschonen en opmaken
- Verwijder overbodige kolommen en rijen
- Formaten standaardiseren (bijv. datums, valuta)
Stap 3: Basisverwerking automatiseren
- TEKST-functies gebruiken voor formaatcorrecties
- Gebruik SUMIFS en COUNTIFS om totalen te analyseren.
- Gebruik LOOKUP-functies om leveranciersnamen te vergelijken
Stap 4: De gegevens exporteren en gebruiken
Limieten bij het gebruik van Excel voor het extraheren van facturen
- Handmatige aanpassingen nodig voor niet-standaard factuurformaten
- Kan geen handgeschreven of gescande facturen verwerken
- Geen ingebouwde intelligentie voor het herkennen van veldvariaties (bijv. “Totaal verschuldigd” vs. “Te betalen bedrag”)
- Niet schaalbaar voor het verwerken van grote hoeveelheden facturen
Ondanks deze beperkingen biedt de functie Get Data in Excel een praktische oplossing voor bedrijven die een semi-geautomatiseerde manier nodig hebben om factuurgegevens te extraheren zonder te hoeven investeren in geavanceerde automatiseringstools.
2. Factuurgegevens scannen met OCR op basis van sjablonen
Op sjablonen gebaseerde OCR automatiseert gegevensextractie door documenten te scannen en belangrijke gestructureerde gegevens uit facturen te halen op basis van vooraf gedefinieerde sjablonen. Deze methode is handig voor bedrijven die facturen verwerken van een vaste groep leveranciers met consistente indelingen.
Stap 1: Factuursjablonen configureren
- Kies een OCR-software die extractie op basis van sjablonen ondersteunt
- Definieer belangrijke velden op basis van een voorbeeldfactuur
- Stel vaste zones in voor elk gegevenspunt, zodat de OCR-engine weet waar hij moet zoeken
Stap 2: Facturen scannen en verwerken
Stap 3: Gegevens controleren en exporteren
Beperkingen van OCR op basis van sjablonen
- Werkt het best wanneer de lay-out van de factuur ongewijzigd blijft
- Als een leverancier zijn factuurindeling aanpast, kan de sjabloon falen
- Het is niet ideaal voor bedrijven om facturen van verschillende leveranciers te verwerken.
Hoewel OCR op basis van sjablonen efficiënter is dan handmatige invoer, is het niet flexibel genoeg om met verschillende factuurindelingen om te gaan. Bedrijven die een grote verscheidenheid aan facturen verwerken, hebben mogelijk een meer geavanceerde AI-gestuurde aanpak nodig.
Hoe je automatisch facturen kunt scannen
De meeste semi-geautomatiseerde methoden voor het extraheren van gegevens vereisen handmatige interventie voor reguliere of unieke documenten. Maar er is een alternatief – AI-gestuurde oplossingen die het hele proces van het extraheren van factuurgegevens volledig kunnen automatiseren.
Klippa DocHorizon is een krachtig platform voor Intelligent Document Processing (IDP) waarmee documentworkflows eenvoudig kunnen worden geautomatiseerd. De ondersteuning van talloze documenttypen en –formaten biedt flexibiliteit voor verschillende gebruikssituaties.
Laten we je stap voor stap door het proces leiden. En het beste deel? Je kunt het gratis uitproberen!
Stap 1: Meld je aan op het platform
Het eerste wat je moet doen is je gratis aanmelden op het DocHorizon Platform. Voer je e-mailadres en wachtwoord in en geef vervolgens details op zoals je volledige naam, bedrijfsnaam, use case en documentvolume. Zodra je dat hebt gedaan, ontvang je een gratis tegoed van €25 om alle functies en mogelijkheden van het platform te verkennen.
Nadat je bent ingelogd, maak je een organisatie aan en stel je een project in om toegang te krijgen tot onze diensten. Voor ons doel – het extraheren van gegevens uit facturen – schakel je gewoon het Financiële Model en de Flow Builder in om aan de slag te gaan. Met deze instellingen heb je alles wat je vanaf het begin nodig hebt!


Stap 2: Maak een preset
Je vraagt je misschien af waarom we ervoor gekozen hebben om het Financieel Model in te schakelen in plaats van andere opties. Het Financieel Model is ontworpen om je financiële workflows te stroomlijnen door de extractie, analyse, validatie en classificatie van gegevens te automatiseren. Het verwerkt op efficiënte wijze een breed scala aan financiële documenten, waaronder bonnen, inkoopopdrachten, bankafschriften en meer.
Eenmaal geactiveerd kun je een nieuwe voorinstelling maken. Laten we het “Gegevens uit facturen halen” noemen. Met deze voorinstelling kun je de componenten activeren die je nodig hebt voor je specifieke toepassing. In dit geval schakel je de financiële en line items componenten in om specifieke velden in je facturen te verwerken, zoals leverancier, bedrag, btw-informatie, datum, valuta en factuurnummer.
Hier is een tip: je hebt de keuze om de preset verder aan te passen afhankelijk van je gebruikssituatie door meer onderdelen in te schakelen, zoals Datumgegevens, Referentiedetails, Bedraggegevens, Documenttaal, Betalingsdetails, enzovoort.
Je bent bijna klaar! Klik op “Opslaan” om je instellingen af te ronden en je bent klaar voor de volgende stap in de Flow Builder.


Stap 3: Selecteer je invoerbron
Nadat je een preset hebt gemaakt en de Flow Builder hebt ingeschakeld, is het tijd om je flow te bouwen. Een flow is in wezen een reeks stappen die bepalen hoe je facturen worden verwerkt en overgedragen naar je uitvoerbestemming. In dit voorbeeld kiezen we Google Drive als invoerbron.
Ga naar de Flow Builder in het Services gebied, klik op New Flow → + From scratch en geef je flow een naam. We noemen de flow “Factuurgegevens ophalen”.
Hier is een tip: De eerste stap bij het bouwen van je flow is het selecteren van je invoerbron. Je hebt verschillende opties: je kunt bestanden rechtstreeks uploaden vanaf je apparaat of verbinding maken met meer dan 100 externe bronnen, waaronder Dropbox, Outlook, Salesforce, Zapier, OneDrive, de database van je bedrijf of cloudopslagoplossingen zoals Amazon S3 en iCloud. Zorg ervoor dat je alle facturen in dezelfde map plaatst, zodat ze indien nodig in bulk kunnen worden verwerkt.
In dit voorbeeld kiezen we Google Drive als invoerbron, maken we een map aan met de naam “Invoer” en uploaden we een PDF-factuur in onze nieuw aangemaakte map. Wees gerust, ons platform kan ook facturen in andere formaten verwerken, zoals JPG, PNG, DOCX en nog veel meer.
Laten we verder gaan met het proces. Kies als invoerbron “Google Drive” en vervolgens “Nieuw bestand”. Hiermee start je je flow. Vul aan de rechterkant de volgende onderdelen in:
- Verbinding: Je kunt een willekeurige naam geven aan je verbinding. Wij hebben de onze bijvoorbeeld “google-drive” genoemd. Eenmaal benoemd, zal het systeem je vragen om je te verifiëren bij Google.
- Parent Folder (Bovenliggende map): Invoer
- Bestandsinhoud opnemen: Vink dit vakje aan om ervoor te zorgen dat de bestandsinhoud wordt verwerkt.
Test deze stap door te klikken op Load Sample Data: vergeet niet om minstens één voorbeeldfactuur in je invoermap te hebben terwijl je je flow instelt.
Hier is een tip: Aangezien het platform een breed scala aan documenttypes ondersteunt om aan alle bedrijfsbehoeften te voldoen, kun je onze uitgebreide documentatie raadplegen voor meer informatie.


Stap 4: Gegevens vastleggen en extraheren
Nu is het tijd om de benodigde gegevens te extraheren door de eerder gemaakte preset te gebruiken om alle geselecteerde gegevensvelden van de facturen in de invoermap te verwerken.
Druk in de Flow Builder op de + knop en kies Document Capture: Financieel document.
Configureer het volgende om verder te gaan:
- Verbinding: Standaard DocHorizon Platform
- Preset: De naam van je preset (in ons geval “extract_data_from_invoices”)
- Bestand of URL: Nieuw bestand → Inhoud
Test vervolgens de stap om er zeker van te zijn dat alles correct werkt. Als de test geslaagd is, ben je klaar om door te gaan naar de volgende stap: je resultaten opslaan!


Stap 5: Het bestand opslaan
Zodra de factuurgegevens zijn geëxtraheerd, is de laatste stap het kiezen van de bestemming en het gegevensformaat voor de uiteindelijke uitvoer. De bestemming kan je database, ERP-systeem, boekhoudsoftware of een ander platform zijn, afhankelijk van je workflow. Het uitvoerformaat voor de gegevens kan gekozen worden uit JSON, XML, CSV, XLSX, UBL, PDF of TXT.
In dit voorbeeld stellen we het factuurnummer in als bestandsnaam voor de geëxtraheerde gegevens en slaan we deze op in JSON-formaat. We maken een nieuwe map aan in Google Drive, noemen de uitvoermap “Uitvoer” en stellen deze in als eindbestemming voor ons bestand met de geëxtraheerde gegevens.
Druk op de + knop en selecteer Nieuw bestand maken → Google Drive
Configureer het volgende om verder te gaan:
- Verbinding: google-drive
- Bestandsnaam: Document Capture: Financial Document → components → financial → invoice_number. Typ daarnaast .json
- Tekst: Document Capture: Financial Document → components
- Hier is een tip: Selecteer de tekst die je in het nieuwe document wilt opnemen. Door “ components ” te selecteren kies je alle geëxtraheerde elementen.
- Type inhoud: Tekst
- Parent folder: Uitvoer (de naam van je uitvoermap)
Test deze stap door op de knop rechtsonder te klikken en je bent klaar!


Gefeliciteerd! Alle factuurgegevens zijn nu beschikbaar in je Google Drive-map. Met deze instelling kun je de flow publiceren en alle nieuwe facturen die aan de map worden toegevoegd, worden automatisch verwerkt. Zo kun je tijd besparen en tegelijkertijd de nauwkeurigheid van je workflows garanderen.
Welke factuurgegevens kun je scannen en herkennen?
Facturen bevatten belangrijke financiële en bedrijfsgegevens die nauwkeurig moeten worden uitgelezen voor verwerking, verificatie en administratie. Hier volgt een overzicht van de belangrijkste velden:
1. Identificatiegegevens van de factuur
- Factuurnummer – Uniek referentienummer voor tracering
- Factuurdatum – De datum waarop de factuur is verzonden
- PO-nummer (Purchase Order) – Koppelt de factuur aan een goedgekeurde order
- Betalingsdatum – De deadline voor betaling
2. Informatie over leveranciers en kopers
- Gegevens verkoper – De naam, het adres en de contactgegevens van het bedrijf dat de factuur opstelt
- Belastingnummer / BTW-nummer – Vereist voor naleving van de belastingwetgeving
- Klantnaam & factuuradres – De entiteit die verantwoordelijk is voor de betaling
- Verzendadres – Indien verschillend van het factuuradres
3. Line-Items
Line items bevatten details van geleverde goederen of diensten, zoals een beschrijving van het product of de dienst, de hoeveelheid, de eenheidsprijs en het totaal van de line items.
4. Betaling en financiële details
- Subtotaal – Het totaal vóór belastingen, verzendkosten en kortingen
- Belastingen (btw, GST, omzetbelasting) – Belastingbedrag en -percentage
- Kortingen – Vroegtijdige betaling, bulkbestelling of promotiekortingen
- Verzendkosten – Indien van toepassing
- Totaal te betalen bedrag – Het uiteindelijk te betalen bedrag
5. Betalingsvoorwaarden & Bankgegevens
- Geaccepteerde betalingsmethoden – Bankoverschrijving, creditcard, etc.
- Bankrekeninggegevens – IBAN, SWIFT-code of ABA-routingnummer van de verkoper
- Valuta – De valuta waarin de factuur is opgesteld
Het uitlezen van deze velden zorgt ervoor dat facturen efficiënt worden verwerkt, waardoor fouten en vertragingen bij het reconciliëren van betalingen worden verminderd.
Naast facturen verwerk je misschien ook kassabonnen. Als dat het geval is, bekijk dan ook onze Engelse gids voor het extraheren van kassabon gegevens.
Belangrijkste uitdagingen bij het scannen van factuurgegevens
Het extraheren van gegevens uit facturen is zelden eenvoudig. Boekhoud- en financiële teams verwerken facturen van meerdere leveranciers, elk met hun eigen structuur, formaat en eigenaardigheden. Dit maakt het extraheren van gegevens tot een complex en foutgevoelig proces. Hier volgen enkele van de belangrijkste uitdagingen waarmee professionals worden geconfronteerd:
1. Inconsistente factuurindelingen
Vaak zien facturen er niet hetzelfde uit. Leveranciers gebruiken verschillende sjablonen, veldindelingen, lettertypen en kolomindelingen. Sommige facturen geven de totalen bovenaan weer, terwijl andere ze onderaan vermelden. Essentiële details zoals vervaldatums of belastingbedragen kunnen op onvoorspelbare locaties verschijnen, waardoor je ze handmatig moet controleren om de juistheid ervan te garanderen.
2. Ongestructureerde Line Items
Het extraheren van line item gegevens is bijzonder lastig. Terwijl sommige facturen netjes gestructureerde tabellen gebruiken, zijn op andere facturen de artikelbeschrijvingen verspreid over meerdere regels of worden kolommen samengevoegd tot één blok tekst. Dit maakt het voor geautomatiseerde tools moeilijk om zonder geavanceerde verwerkingstechnieken onderscheid te maken tussen productomschrijvingen, eenheidsprijzen en totaalbedragen.
3. Handgeschreven en gestempelde informatie
Veel facturen bevatten handgeschreven notities, goedkeuringsstempels of handtekeningen. Standaard OCR-tools hebben moeite met cursieve tekst, vervaagde inkt en overlappende stempels, wat leidt tot ontbrekende of onnauwkeurige gegevens. Voor bedrijven die facturen van leveranciers verwerken en nog steeds handmatig factureren, is dit een veelvoorkomend knelpunt.
4. Ingediende facturen via meerdere kanalen
Facturen komen binnen in verschillende formaten, zoals PDF’s, gescande afbeeldingen, e-mails, EDI-feeds en zelfs fysieke papieren exemplaren. De verwerking ervan vereist een combinatie van scannen, OCR en handmatige controle, waardoor het risico op vertragingen en fouten toeneemt. Sommige facturen zijn onderdeel van een e-mail, terwijl andere als afbeelding zijn bijgevoegd, wat het extraheren nog ingewikkelder maakt.
5. Vreemde talen en regionale opmaak
Omgaan met internationale leveranciers betekent facturen verwerken in meerdere talen, elk met unieke tekens, datumnotaties en valutasymbolen. Zo kan een factuurdatum van 07/12/2024 in het ene land 12 juli betekenen en in een ander land 7 december. Valutasymbolen zoals $ kunnen verwijzen naar USD, CAD of AUD, wat leidt tot potentiële financiële mismatches.
6. Slecht gescande documenten of documenten met een lage resolutie
Facturen die scheef, onscherp of met een lage resolutie zijn, vormen een grote uitdaging voor gegevensextractie. OCR-tools kunnen tekens verkeerd lezen (bijvoorbeeld 8 verwarren met B of 1 met I), wat leidt tot problemen met de integriteit van gegevens. Het handmatig corrigeren van deze fouten vertraagt de verwerking en verhoogt de operationele kosten.
7. Uiteenlopende belastingregels en nalevingsvereisten
Belastingberekeningen, btw-structuren en wettelijke vereisten verschillen van rechtsgebied tot rechtsgebied. Sommige facturen bevatten btw-onderverdelingen, terwijl andere alle belastingen in één bedrag bundelen. Het nauwkeurig extraheren van deze informatie is essentieel voor naleving, maar inconsistenties in de manier waarop belastingen worden weergegeven, maken automatisering moeilijk.
8. Gebrek aan contextueel begrip
Eenvoudige OCR-tools kunnen tekst extraheren, maar ze begrijpen niet altijd de context. Een waarde als “1.500” kan bijvoorbeeld een factuurbedrag, een hoeveelheid of een referentienummer zijn, afhankelijk van de context. Zonder intelligente gegevensverwerking lopen bedrijven het risico dat kritieke financiële informatie verkeerd wordt geclassificeerd.
Conclusie
Met zo veel uitdagingen, van inconsistente lay-outs tot handgeschreven tekst en ingediende facturen in meerdere formaten, kan handmatige en semi-geautomatiseerde gegevensextractie snel een knelpunt worden voor bedrijven die grote hoeveelheden facturen verwerken.
Hoewel OCR op basis van sjablonen en Excel enige verlichting bieden, vereisen ze nog steeds voortdurend toezicht en aanpassingen. Voor bedrijven die te maken hebben met verschillende factuurformaten, meerdere talen en strikte nalevingseisen, biedt een volledig geautomatiseerde aanpak op basis van AI en machine learning een meer schaalbare, nauwkeurigere en efficiëntere oplossing.
Automatiseer het scannen van factuurgegevens met Klippa DocHorizon
Wil je gegevens scannen en herkennen uit facturen in Google Sheets, Excel, JSON en meer? Bij ons zit je goed! Met Klippa DocHorizon, een geavanceerd platform voor intelligente documentverwerking, kun je al je workflows eenvoudig automatiseren. Door gebruik te maken van de geavanceerde module van Klippa kun je een naadloze workflow opzetten die is afgestemd op jouw behoeften:
- Gegevensextractie OCR: Automatisch gegevens extraheren van elke factuur.
- Human-in-the-loop: Zorg voor bijna 100% nauwkeurigheid met onze human-in-the-loop functie, die interne verificatie of ondersteuning door Klippa’s data annotatieteam mogelijk maakt.
- Conversie van documenten: Converteer facturen in elk formaat – PDF, gescande afbeeldingen of Word-documenten – naar verschillende voor bedrijven geschikte gegevensformaten, waaronder JSON, XLSX, CSV, TXT, XML en meer.
- Gegevens anonimiseren: Bescherm gevoelige informatie en zorg voor naleving van de regelgeving door privacygevoelige gegevens, zoals persoonlijke informatie of contactgegevens, te anonimiseren.
- Verificatie van documenten: Authenticeer documenten automatisch en identificeer frauduleuze activiteiten om het risico op fraude te verkleinen.
Bij Klippa hechten we veel waarde aan privacy. Daarom voldoen al onze documentworkflows aan de HIPAA-, AVG- en ISO-normen, waardoor een veilige gegevensverwerking is gegarandeerd. Neem met een gerust hart de volgende stap en optimaliseer jouw factuurverwerkingsworkflows.
Als je geïnteresseerd bent in het automatiseren van je workflow met Klippa’s intelligente oplossing voor documentverwerking, aarzel dan niet om contact op te nemen met onze experts voor meer informatie of een gratis demo te boeken!
FAQ
Het extraheren van factuurgegevens legt belangrijke details vast, zoals factuurnummers, data en bedragen. Dit kan handmatig, semi-geautomatiseerd met Excel of op sjablonen gebaseerde OCR, of volledig geautomatiseerd met AI.
Je kunt de functie Get Data van Excel gebruiken voor gestructureerde PDF’s, OCR op basis van sjablonen voor vaste formaten of AI-gestuurde oplossingen zoals Klippa DocHorizon voor volledige automatisering.
Ja. Klippa biedt een gratis proefperiode met €25 aan credits, zodat je de functies en mogelijkheden van het platform kunt verkennen voordat je beslist.
Absoluut. Klippa voldoet aan wereldwijde normen voor gegevensprivacy, waaronder AVG. Je gegevens worden versleuteld, veilig verwerkt en nooit gedeeld met derden zonder jouw toestemming.