De mensen van TRIADO: Marten Düring
VIDEO | In de interviewserie 'De mensen van TRIADO' komen betrokkenen bij het project Tribunaalarchieven als digitale onderzoeksfaciliteit aan het woord. Ze vertellen over hun expertise en rol in het project. Maar ook over hun verwachtingen en het belang van TRIADO. In deze eerste aflevering: Marten Düring, onderzoeker bij het Luxembourg Centre for Contemporary and Digital History (C2DH) met een expertise in sociale netwerkanalyses.
De mensen van TRIADO: Anne Gorter
In de interviewserie 'De mensen van TRIADO' komen betrokkenen bij het project Tribunaalarchieven als digitale onderzoeksfaciliteit aan het woord. Ze vertellen over hun expertise en rol in het project. Maar ook over hun verwachtingen en het belang van TRIADO. In deze derde aflevering: Anne Gorter, projectmanager bij het Nationaal Archief.
De mensen van TRIADO: Rutger van Koert
In de interviewserie 'De mensen van TRIADO' komen betrokkenen bij het project Tribunaalarchieven als digitale onderzoeksfaciliteit aan het woord. Ze vertellen over hun expertise en rol in het project. Maar ook over hun verwachtingen en het belang van TRIADO. In deze vierde aflevering: Rutger van Koert, software ontwikkelaar bij de afdeling Digital Infrastructure van het Humanities Cluster (KNAW).
De mensen van TRIADO: Edwin Klijn
VIDEO | In de interviewserie 'De mensen van TRIADO' komen betrokkenen bij het project Tribunaalarchieven als digitale onderzoeksfaciliteit aan het woord. Ze vertellen over hun expertise en rol in het project. Maar ook over hun verwachtingen en het belang van TRIADO. In deze vijfde aflevering: Edwin Klijn, programmamanager van Netwerk Oorlogsbronnen en projectleider van TRIADO.
Hellema heeft een workflow-document opgesteld voor de digitalisering van het Centraal Archief Bijzondere Rechtspleging (CABR, collectie Nationaal Archief). Daarin staan alle stappen van het digitaliseringstraject beschreven, van de dossier-selectie tot het scannen en verrijken van digitale objecten. Binnen TRIADO wordt een kleine steekproef uit het CABR gedigitaliseerd. Aan de hand van die testset worden methoden ontwikkeld om de grote verscheidenheid aan documenten in archieven als deze, digitaal beter doorzoekbaar te maken.
Scannen, OCR'en, verrijken
Om (wetenschappelijke) vragen te kunnen stellen aan het archief, is alleen scannen - een ‘plaatje’ van een document maken - niet voldoende. Daarom worden documenten ook ge-OCR’d (naar ALTO-bestanden) en de data uit de CABR-steekproef verrijkt door middel van o.m. Named Entity Recognition. Hiermee wordt informatie over bijvoorbeeld personen en plaatsen geclassificeerd, en vervolgens gekoppeld aan referentiedata uit o.m. de WO2-thesaurus en BAG (Basisregistraties Adressen en Gebouwen).
Deze verrijkingsfase binnen TRIADO wordt uitgevoerd door het Huygens ING, met betrokkenheid van Hellema als adviseur. Het doel is te komen tot één testset verrijkt met persoons-entiteiten, locaties, organisaties, domeinspecifieke termen (concepten) en datumaanduidingen. Ook wordt er metadata aan de OCR-data toegevoegd over o.m. documenttypen; informatie die uit een geautomatiseerd proces van document-classificatie wordt gehaald.