Historische documenten ontcijferd met 'Handwritten Text Recognition'
Het Utrechts Archief verwerft en bewaart bronnen over de geschiedenis van de stad en provincie Utrecht en maakt ze toegankelijk. In het project Transcripties wordt onderzocht hoe hoe de door Artificial Intelligence (AI) gedreven handschriftmodellen van Transkribus gebruikt kunnen worden om onze collecties digitaal doorzoekbaar te maken.
Een groot deel van onze archiefcollectie bestaat uit handgeschreven documenten. Deze oude handschriften zijn vaak moeilijk te lezen. Om deze documenten voor meer mensen toegankelijk te maken, worden er transcripties gemaakt. Dit zijn getypte versies van de handschriften. Een extra voordeel is dat deze transcripties digitaal doorzoekbaar zijn.
In samenwerking met Transkribus en Kasteel Amerongen is Het Utrechts Archief een pilot gestart om de brievencollectie van Margaretha Turnor en haar zoon Godard van Reede laten transcriberen. Deze transcripties zijn nu volledig digitaal doorzoekbaar op onze website. En dit is nog maar het begin. Er zullen regelmatig nieuwe transcripties van oude handgeschreven archiefstukken uit onze collectie volgen. Het Utrechts Archief wil met nieuwe technieken het bestuderen van de historische bronnen van onze stad en provincie makkelijker maken.
De techniek die dit project mogelijk maakt, heet ‘Handwritten Text Recognition’ (HTR). Hiermee kunnen handgeschreven teksten automatisch worden gedigitaliseerd. Het programma Transkribus speelt een belangrijke rol in het ontwikkelen van modellen voor handschriftherkenning. Het Utrechts Archief wil met deze nieuwe techniek zijn archiefcollectie toegankelijk maken voor zoveel mogelijk mensen. Met onze zelf ontworpen handschriftmodellen draagt Het Utrechts Archief ook bij aan de verdere ontwikkeling van Transkribus.
In juli 2024 is deze pilot afgerond en kan iedereen de nieuwe collectie transcripties doorzoeken en bekijken.