Historische brieven via AI doorzoekbaar gemaakt
28 augustus 2024Meer dan 2.000 pagina’s van brieven uit het archief van Kasteel Amerongen zijn via AI omgezet in getypte tekst. De scans zijn hiermee woord voor woord doorzoekbaar. Na deze geslaagde proef worden de komende tijd meer scans op deze manier toegankelijk gemaakt.
Benieuwd naar het resultaat?
> Bekijk de transcripties van de brieven van Margaretha Turnor en Godard van Reede-Ginkel
HTR
Een groot deel van de bronnen uit Het Utrechts Archief is handgeschreven. Van eeuwenoude Latijnse teksten tot recent materiaal. Onze vrijwilligers maken hier handmatig transcripties van (getypte versies van handschriften), zodat deze teksten leesbaar en doorzoekbaar worden. Met AI-modellen, ook wel Handwritten Text Recognition (HTR) genoemd, worden de scans nu ook direct door de computer leesbaar gemaakt. De AI-modellen zijn getraind op het herkennen van de layout en de handgeschreven teksten zelf. Deze transcripties worden gemaakt in een fractie van de tijd die handmatig werk kost. Hierdoor kan het ontsluiten van deze soort bronnen enorm worden opgeschaald. Voor deze pilot is het HTR-platform Transkribus gebruikt. Het project is mede mogelijk gemaakt door de inzet van vrijwilligers van Kasteel Amerongen.
Zoekbalk en webonderdeel
De transcripties en scans zijn te vinden via de algemene zoekmachine op de website van Het Utrechts Archief (zie “Transcripties” in de zoekresultaten) en toegankelijk via de transcriptie-website zelf.