Netwerk Oorlogsbronnen is in september gestart met het pilotproject WO2-thesaurus. Daarbij worden erfgoedcollecties met het thema Tweede Wereldoorlog automatisch ontsloten met trefwoorden uit een WO2-thesaurus. Toepassing van de thesaurus is van belang om miljoenen oorlogsbronnen, in beheer en beschreven door verschillende instellingen, centraal toegankelijk en vindbaar te maken en houden via oorlogsbronnen.nl. De thematische thesaurus draagt daarmee bij aan het doel van Netwerk Oorlogsbronnen om verspreide WO2-collecties beter en gestructureerder toegankelijk te maken.
Waarom een thesaurus?
De portal oorlogsbronnen.nl bevat op dit moment bijna negen miljoen bronnen. We verwachten hier de komende jaren nog honderdduizenden aan toe te voegen. Toepassing van een thesaurus zorgt ervoor dat álle bronnen over bijvoorbeeld 'Atlantik Wall' daadwerkelijk gevonden worden. Verschillende collectiebeherende instellingen gebruiken doorgaans verschillende velden om te en manieren van beschrijven. Een thesaurus brengt een vorm van standaardisatie met zich mee, waardoor zoeken op één trefwoord als 'moffenmeisjes' en zelfs 'Opmars van de Geallieerden bij Eindhoven' mogelijk is door alle – oorspronkelijk verschillend beschreven – collecties.
Matchen van termen
De door het NIOD beheerde WO2-thesaurus bestaat uit circa 1200 trefwoorden, waaronder honderdvijftig kampen, verdeeld over een aantal hoofdgebieden als Vervolging, Bestuur, Dagelijks Leven, Recht, etc. Afgelopen weken zijn de thesaurus-trefwoorden gedefinieerd en voorzien van een hiërarchie (dat wat een trefwoordenlijst tot een thesaurus maakt). Op dit moment wordt er 'gematcht': d.w.z. het geautomatiseerd toekennen van WO2-trefwoorden aan bronnen. (Lees ook de blogpost over het werk van Inge van Stokkom.) Hierbij zoekt een computer naar identieke of vergelijkbare termen in exports van objectbeschrijvingen uit collectiebeheersystemen en de WO2-thesaurus. Als termen in een objectbeschrijving worden gevonden dan maakt de computer (in een extern bestand) verwijzingen aan: we leggen vast dat in object X, van organisatie Y, term Z uit de WO2-thesaurus gebruikt is.
In deze eerste fase van ons project testen we óf termen uit onze WO2 thesaurus te matchen zijn met beschrijvingen van verschillende erfgoed instellingen. Op dit moment gebruiken we digitale kopieën van object- of archiefbeschrijvingen van het Fries Verzetsmuseum, Erfgoed Brabant en NIOD als casus. Testen (matchen) met meer datasets betekent een vollediger resultaat. We maken dan ook graag gebruik van zo veel mogelijk objecten, archiefbeschrijvingen en andersoortige collecties die gaan over Nederland in de Tweede Wereldoorlog. Uw WO2-collectie kan ook onderdeel zijn van deze pilot. Meedoen betekent niet alleen dat uw dataset wordt gebruikt om mee te testen, maar ook dat u desgewenst uw beschrijvingen verreikt met thesaurustermen terug krijgt. Daarmee beschikt u automatisch over extra trefwoorden, een verbetering aan de vindbaarheid van bronnen.
Testen van techniek
De bronnen voor deze pilot worden niet automatisch online geplaatst zonder duidelijke afspraken met de collectiebeheerders (uiteraard nemen we ze graag op in de portal oorlogsbronnen.nl als de collectiebeheerders daarmee akkoord gaan). We willen vooral de techniek testen. Aan het einde van het pilotproject gaat Netwerk Oorlogsbronnen met de collectiebeheerders en softwareleveranciers in gesprek over de mogelijkheid de thesaurus-trefwoorden in de eigen systemen op te nemen. Ook praten we met softwareleveranciers en portalbeheerders als Erfgoed Brabant om te kijken of de WO2-thesaurus standaard ingebouwd kan worden. Zodat collectiebeheerders bij het metadateren direct gebruik kunnen maken van de termen uit de WO2-thesaurus.
Netwerk Oorlogsbronnen en Netwerk Digitaal Erfgoed
Dit project wordt ondersteund door het Netwerk Digitaal Erfgoed (NDE), een samenwerkingsverband dat zich richt op de ontwikkeling van een stelsel van landelijke voorzieningen en diensten voor het verbeteren van de zichtbaarheid, bruikbaarheid en houdbaarheid van digitaal erfgoed. De WO2-thesaurus is voor het NDE werkpakket bruikbaar een van de bouwstenen van een netwerk van terminologiebronnen (Knowledge Graph voor Digitaal Erfgoed).
Het project WO2-thesaurus is voor Netwerk Oorlogsbronnen onderdeel van het beter vindbaar en bruikbaar maken van WO2-bronnen op het gebied van 'wat'. Daarnaast houdt NOB zich bezig met verbeterde bronnenontsluiting via de vragen ‘wie’, ‘wanneer’ en ‘waar’? En in de toekomst een combinatie van de vragen. Zo kunnen oorspronkelijk losstaande collecties digitaal als één worden bevraagd over een thema.
Meedoen?
Mocht u mee willen doen met de pilot, dan kunt u contact op willen nemen met: Lizzy Jongma (Netwerk Oorlogsbronnen/NIOD), Senior Projectleider, l.jongma@niod.knaw.nl, 020-5233543