Overslaan naar inhoud

Historische Documenten toegankelijker maken zit in ons DNA...

Vandaag kunnen historische bronnen met AI en 'Human Text Recognition', ofwel HTR software op grote schaal en snel toegankelijk gemaakt worden, door de digitale kopieën van lees- en doorzoekbare tekst te voorzien. Een grote troef voor genealogen, onderzoekers en historisch geïnteresseerden in het breed! 

Het is echter nog niet altijd evident om met deze tools aan de slag te gaan, vanwege personeels-, tijdstekorten of andere redenen, laat staan er het meest uit te halen op een zo efficiënt mogelijke wijze... Het is de missie van HTR Experts om jou en jouw organisatie net hierin in bij te staan, geheel op maat van je noden en mogelijkheden. 

Hoe gaat dat precies in zijn werk en welke gedaantes kan dat dan aannemen? Dat lees je hieronder.

Officiële Transkribus Partner


Een van de meest gebruikte HTR tools op dit moment is Transkribus, voortgekomen uit twee Europese onderzoeksprojecten in het vorig decennium en sindsdien verder ontwikkeld door de coöperatieve READ-COOP SCE in Innsbruck, Oostenrijk. 


Vanwege de toegankelijkheid, flexibiliteit, mogelijkheden tot samenwerking, het ecosysteem (van scannen tot publiceren) en in het bijzonder de verzekerde doorontwikkeling van Transkribus, heb ik ervoor gekozen voornamelijk met deze HTR-software te werken. 

Daarbij komt dat ik over de twee jaar dat ik bij READ-COOP zelf gewerkt heb, ik veel ervaring opgedaan heb met de tool en de organisatie goed ken. Een partnerschap aangaan met hen was dan ook haast een vanzelfsprekendheid!

Workshops


  • Dit kunnen algemene introducties tot de software zijn, tot meer geavanceerde workshops over specifieke onderwerpen. Het doel is om de kennis mee te geven waarmee jullie (geheel of met verdere ondersteuning) zelf aan de slag kunnen met de software.

    • Deze optie op zich is vooral aangeraden wanneer je (organisatie) zelf over voldoende tijd en/of mankracht beschikt om grotendeels zelf het tekstherkenningsproject aan te vatten, maar niet goed weet hoe of waar te beginnen. 

Voorstudie ter voorbereiding van geautomatiseerde tekstverwerking


  • Om tot een mooi eindresultaat te komen met je tekstherkenningsproject, is het van essentieel belang op voorhand goed te weten welke mogelijkheden en uitdagingen je collectie meebrengt bij een verwerking door HTR software. Even belangrijk is om vooraf goed na te denken wat je uiteindelijk met de uitkomst van de tekstherkenning wil doen en hoe je dan idealiter je documenten met HTR software verwerkt om dit te faciliteren. 

  • Daarom begint een tekstherkenningsproject dan ook best met een goede voorstudie (op basis van een steekproef) van je bronnen. Hierin kan ik jullie bijstaan, waarbij het doel is om in samenspraak tot de meest passende methodes te komen voor de uitvoering van het tekstherkenningsproject zelf. 

    • Aangaande de inzet van HTR an sich is de kernvraag dan vaak welke methoden voor lay-outherkenning het meest effectief zijn, alsook welke tekstherkenningsmodellen.
    • Daarbij gaan we ook voor verschillende opties hun kosten en baten na. 
    • Bij die evaluatie nemen we dan natuurlijk ook de context waarin het project uitgevoerd zal worden mee.

  • Een voorstudie valt overigens goed te combineren met een workshop. De workshop zou dan concreet en praktisch richten op werken met je specifieke collectie.
 

Een tekstherkenningsproject volledig of deels voor/met jullie uitvoeren  


  • Hier zijn er twee verschillende assen; namelijk welk aandeel van het project dat ik zou uitvoeren, alsook in welke mate dat ik dit voor jullie doe of samen met jullie team. Hier gaat het dan meestal om een meer continue integratie in jullie project waarin ik doorheen een deel of heel het project actief betrokken ben en het project draag. 

  • Indien gewenst, kan kennisoverdracht een essentieel onderdeel zijn van de opdracht, zodat je na afloop een volgend project autonoom kunt opstarten of het huidige project zelf kan verderzetten.

Begeleiding en coördinatie van een team vrijwilligers die aan de slag gaan met HTR


  • Transkribus leent zich uitstekend voor tekstherkenningsprojecten waaraan vrijwilligers hun steentje willen bijdragen. Vaak doen ze dat door het aanmaken of corrigeren van trainingsdata, het uiteindelijke resultaat van de tekstherkenning te controleren of te verrijken met meer data (bijvoorbeeld met 'Labels'). 

  • Hierbij is het van belang dat coherente transcriptiestandaarden gevolgd worden en dat de aangemaakte trainingsdata aligneert met hoe de AI modellen leren en de wijze waarop deze AI modellen lay-outs en tekst vervolgens zullen herkennen. Verder is ook een gepaste rolverdeling en het opzetten van een efficiënte werkstroom van groot belang om de bijdrage van vrijwilligers volledig tot hun recht te doen komen. Deze begeleiding en coördinatie kan je dan ook (volledig of deels) aan mij uitbesteden.