OCR-software: het ‘wat’, ‘hoe’ en ‘waarom’ van scan en herken
‘OCR’, ‘Optical Character Recognition’, ‘optische tekenherkenning’, ‘software OCR’, ‘scan en herken‘: de termen omtrent documentherkenning vliegen je om de oren — en waarschijnlijk heb je ze inmiddels allemaal weleens gegoogeld. Maar de informatie rondom het onderwerp is vaak technisch en subjectief, waardoor het moeilijk is om een goed beeld te krijgen van OCR. Waar vind je de uitleg die je zoekt? Op deze pagina zetten we alle belangrijke vragen en antwoorden omtrent OCR-software voor je op een rij!
De basis van OCR-software: optische tekenherkenning begrijpen
Benieuwd naar het principe achter OCR en de voordelen die jij uit OCR-software kan halen? In deze sectie gaan we daar dieper op in.
Wat is OCR (Optical Character Recognition) en hoe werkt het?
‘OCR’ staat voor ‘Optical Character Recognition’. Dit is een techniek waarmee de computer letters, cijfers en leestekens van een plaatje afleest. Je gebruikt OCR-software om papieren documenten en boekwerken om te zetten tot bewerkbare digitale versies die je uiteindelijk kan archiveren. Denk aan formulieren, contracten, brieven, rapporten, artikelen en handleidingen.
OCR werkt op basis van patroonherkenning. Na de tekst te hebben gescand en herkend als afbeelding haalt OCR-software letters, cijfers en leestekens uit het plaatje op pixelniveau. Hieruit komen woorden en tekst. Als je dus een papieren document (zoals een inkoopfactuur) scant, kan OCR-software dit héél snel transformeren tot een doorzoekbaar digitaal document.
Meer weten? Lees onze blogs ‘Wat is OCR?‘ en ‘Hoe werkt OCR?‘
Wat is een OCR-programma en wat kan je ermee?
De basisfunctie van OCR-software is het doorzoekbaar maken van documenten. Een OCR-programma bekijkt waar de waarden op een document staan en herkent deze. Maar er bestaan verschillende systemen. Reguliere OCR-oplossingen herkennen volgens templates. Staat één element een keer op een andere plek (bijvoorbeeld wanneer de datum van links naar rechts is verplaatst), dan werkt de OCR-tekstherkenning niet meer. Als gebruiker zal je dan een handmatige aanpassing moeten doen. Een geavanceerd OCR-programma kan tekst interpreteren zoals een mens dat zou doen en voorziet je daarom van specifieke informatie. Dat heeft veel toegevoegde waarde in administratieve processen als inkoopfactuurverwerking.
Goede OCR-software minimaliseert repetitieve, eentonige werkzaamheden. Dit betekent dat financieel-administratief medewerkers tijd overhouden voor uitdagende, leuke taken waarmee ze meer waarde toevoegen voor de organisatie. Bovendien gaat het foutgehalte flink omlaag, omdat een OCR-programma (menselijk) overtypewerk elimineert.
Wat hebben ‘scan en herken’ en OCR-software met elkaar te maken?
Als je inkoopfacturen en andere inkomende documenten wilt digitaliseren, heb je scan- en herken-software (in het Engels: ‘recognition software’) nodig. Dit is een oplossing voor documentherkenning. Maar wat is dat precies?
Veel mensen denken dat het bij documentherkenning gaat om een proces waarbij je een plaatje inscant dat vervolgens in je administratie terechtkomt. Dat is niet onjuist, maar er komt veel meer bij kijken: scan- en herken-software zet het gescande plaatje automatisch om in data, die je terugziet in je ERP-systeem.
Is dit niet precies hetzelfde als wat een OCR-programma doet? Dat klopt. ‘Scan- en herken-software’ is dan ook een synoniem voor ‘OCR-software’.
Een tekst scannen met OCR en digitaal verwerken: hoe werkt dat?
Op de financiële administratie wil je gescande en pdf-documenten converteren tot digitale versies die je kan bewerken en archiveren. Daarvoor kan je het best een slim OCR-programma gebruiken. Dit herkent gegevens op pdf-documenten en interpreteert deze om een logisch resultaat te presenteren.
Staan er bijvoorbeeld zes cijfers achter het woord ‘factuurnummer’, dan begrijpt een OCR-programma de context. Het herkent de cijfers als het factuurnummer en vult dit voor je in. Jij hoeft het geautomatiseerde voorstel vervolgens alleen nog te controleren. Het is dus niet meer nodig om de afzonderlijke velden handmatig in te vullen wanneer je een pdf-document verwerkt.
Wat is het verband tussen OCR, pdf-bestanden en afbeeldingen?
OCR-software wordt vaak gebruikt om inkoopfacturen, werkbonnen, declaraties, servicemeldingen en hr-dossiers uit te lezen. Dit zijn namelijk vaak pdf-bestanden die financieel-administratief medewerkers van oudsher overtypen.
Als je een pdf-bestand uitleest met OCR, hoef je deze tijdrovende, foutgevoelige taak niet uit te voeren. De OCR-software converteert ingescande afbeeldingen automatisch tot data die in je ERP-systeem terechtkomen. Slimme OCR-software interpreteert het document en doet een boekingsvoorstel dat jij enkel nog even hoeft te controleren.
Kan je met OCR-software alleen facturen of ook andere documenten verwerken?
In de meeste gevallen zetten organisaties OCR-software in om inkoopfacturen te verwerken. Maar in principe kan je met OCR-technologie alle inkomende documenten verwerken.
Veelvoorkomende document-types die je in principe ook met OCR-software kan verwerken, zijn opdrachtbevestigingen, bestellingen en declaraties. Zorg wel dat je kiest voor een slimme totaaloplossing (‘scan en herken‘ plús workflow ) die naadloos integreert met je ERP-systeem.
Meer weten over OCR?
Download het whitepaper ‘de toekomst van inkoopfactuurverwerking’
Waarom werkt OCR niet foutloos?
Wanneer een bepaald veld op een document afwijkt, kan het voorkomen dat het OCR-systeem dit niet direct herkent. In zulke gevallen is het belangrijk wat voor soort OCR-software je gebruikt.
Bij een reguliere variant moet je allerlei handelingen verrichten. Zo is het nodig om het systeem bij elke leverancier opnieuw te trainen en templates aan te maken.
Gebruik je echter slimme, zelflerende OCR-software, dan start je met een hele hoge herkenning (óók bij een nieuwe leverancier). Mettertijd worden de resultaten steeds beter — zonder dat jij hier iets voor hoeft te doen. Als het systeem bepaalde documentgegevens eens niet meteen herkent, kan je simpelweg aanklikken wat het had moeten herkennen. De software leert en onthoudt dit, zodat het de volgende keer wel in één keer goed gaat en deelt de opgedane kennis binnen de gebruikerscommunity. Alle gebruikers profiteren hiervan en het systeem wordt daardoor steeds slimmer Bovendien hoef je geen templates aan te maken, waardoor je tijdbesparing optimaal is.
Wat is de toekomst van OCR?
Toekomstbestendige OCR-software biedt een oplossing voor de uitdagingen van vandaag en morgen. Met een solide OCR-systeem kan je:
- De grote diversiteit aan inkomende documenten (van e-mailberichten en pdf-bestanden tot e-facturen) terugbrengen tot één universele stroom. Het systeem zorgt voor het interpreteerbaar maken van de diverse type documenten.
- Facturen met een XML-bestand op een uniforme manier verwerken en boeken. Een goede OCR-oplossing leest het bestand in en koppelt de ingelezen waarden aan de informatie op de factuur. Bovendien heeft zij een groot aantal interfaces om de verschillende marktstandaarden aan te kunnen.
- Facturen met verschillende presentatievormen laten interpreteren. E-facturen hebben niet altijd dezelfde lay-out als traditionele inkoopfacturen. Een goede scan- en herken-oplossing houdt rekening met het feit dat we steeds meer te maken krijgen met nieuwe presentatievormen.
- Niet alleen inkoopfacturen, maar ook andere documenten verwerken. Denk aan declaraties, serviceaanvragen, formulieren en aflever- of pakbonnen.
- Hybride aanlevervormen aan. Moet je bijvoorbeeld een binnengekomen e-factuur combineren met een pakbon in pdf-formaat, dan heb je een hybride OCR-oplossing nodig die dit op een eenvoudige manier voor je regelt.
De voordelen
-
Geen handmatig werk
-
Hoge herkenningsgraad
-
Bespaar veel tijd
Wil je jouw proces slimmer inrichten?
We denken graag met je mee. Plan vrijblijvend een demo met ons in of neem contact met ons op voor verdere vragen!