Voor het vak 'Living Pasts' van de Universiteit Utrecht, zijn we samen met een groep studenten begonnen aan een nieuw experiment. Ons doel is om de geschiedenis van het Janskerkhof tot leven te brengen in een Augmented Reality app. Maar daarvoor moet de grote hoeveelheid data die wij bewaren over deze plek, eerst bruikbaar worden gemaakt. In de eerste twee bijeenkomsten hebben we al een paar stappen in goede richting gezet, zoals het genereren van een nieuw model voor handschriftherkenning van getypte brieven.

Cursus Living Pasts 2020 - Janskerkhof 
In de praktijkgerichte cursus Living pasts van de Universiteit Utrecht gaan studenten van allerlei opleidingen aan de slag om historische, architectonische en maatschappelijke gegevens te combineren in een augmented reality (AR) applicatie. Het doel: de geschiedenis van het Janskerkhof nieuw leven in te blazen. Studenten gaan de straat op en gebruiken verschillende onderzoeksmethoden om meer informatie te krijgen over het plein, de dynamiek en de mensen. Het startpunt is bij ons, waar de meeste data over deze plek wordt bewaard. 

Data bruikbaar maken
Maar hoe maak je die data uit de grote hoeveelheid aan oude teksten eigenlijk écht bruikbaar voor een app? In dit project werken we met het archief van de Familie Martens van Sevenhoven, dat veel waardevolle data bevat over het Janskerkhof. Vooral in de brievenwisseling die de familie voerde tussen 1666-1668 staat veel relevante informatie. Gelukkig zijn deze brieven in het verleden al eens op een typmachine getranscribeerd. We wilden dan ook een nieuw model genereren dat de tekst uit deze getypte brieven automatisch kon herkennen en transcriberen. 

Resultaat experiment
Daarvoor hebben we alle getypte brieven via OCR omgezet naar digitale tekst. Deze teksten gebruikten we als input voor de Text2Image module in Transkribus. De module koppelt de OCR-tekst-regels aan de regels in de originele brieven. Het resultaat konden we gebruiken als trainingsdata om een model te trainen van het handschrift van ‘David Martens’. Het trainen van het model duurde een aantal uren. En het resultaat mag er zijn; namelijk een goed handschrift model met rapportcijfer 9,2. Puur dus op basis van het werk van transcribenten uit 1994. De komende weken gaan we het model van Martens ook toepassen op andere brieven uit dit achief.

De vorderingen in dit project delen we graag met iedereen, houd daarvoor onze LinkedIn, twitterfeed en deze website in de gaten. Wilt u zelf aan de slag met Transkribus of de Text2Image module en heeft u een vraag? Dit e-mailadres wordt beveiligd tegen spambots. JavaScript dient ingeschakeld te zijn om het te bekijken.