Een klein comité informatiespecialisten van verschillende Nederlandse en Belgische instellingen kwam 13 december bij elkaar om aan de slag te gaan met Cultuurlink, een webdienst waarmee je terminologiebronnen onderling kunt verbinden. Doel van de workshop, georganiseerd in samenwerking met NDE en het Antwerpse modemuseum MoMu, was om koppelingen te leggen tussen de trefwoorden in eigen collecties en de Art & Architecture Thesaurus (AAT). Inge van Stokkom was erbij als begeleider, voortbouwend op de ervaring die ze opdeed tijdens haar WO2-thesaurus project bij Netwerk Oorlogsbronnen.
Vinden wat erin zit
Met welke term zou u zoeken naar deze afbeelding? Bunker, fort, kazemat, Atlantik Wall of verdedigingswerk? Waarschijnlijk wisselt het antwoord per persoon.
Het leggen van koppelingen omvat een aantal verschillende stappen. Ten eerste is het handig als de eigen thesaurus/termenlijst zo ‘schoon’ mogelijk is. Dat wil zeggen geen dubbele termen, verschillende (niet aan elkaar gekoppelde) spellingsvarianten of samengestelde termen. Dit is eigenlijk een inhoudelijke actie, die het beste uitgevoerd kan worden door iemand die weet hoe de termenlijst in het eigen systeem gebruikt wordt. Opschonen doe je door de termenlijst door te lopen op zoek naar ‘gekke’ termen, bijvoorbeeld in Excel of OpenRefine. Dat laatste programma heeft een heel nuttige cluster-functie, die termen die erg op elkaar lijken bij elkaar zoekt.
Vervolgens moet de termenlijst omgezet worden in een andere notatievorm: skos. Dit overzetten kan met behulp van OpenRefine en kost een paar minuten. Het RDF-bestand dat resulteert, kan Cultuurlink importeren. Een van de bouwers van Cultuurlink, Michiel Hildebrand van Spinque, was aanwezig bij de workshop om uitleg te geven over de werking ervan. De deelnemers hadden allemaal al een export van hun termenlijst omgezet in skos (of deden dat nog even snel) en waren klaar voor een upload in Cultuurlink. Michiels uitleg bleek zeer verhelderend over de strategieën die ingezet kunnen worden om zoveel mogelijk goede links naar de AAT te leggen.
Na experimenteren met het koppelingen leggen in Cultuurlink, werd de middag besteed aan de vervolgstap. Het uiteindelijke doel is het incorporeren van de links (URI’s) naar de AAT in het eigen collectiebeheersysteem. De gelegde links bleken via een csv-export prima uit Cultuurlink op te halen, en konden vervolgens bewerkt worden tot een importbestand. Hier liepen de mogelijkheden vervolgens uiteen, afhankelijk van het collectieregistratiesysteem. Adlib bijvoorbeeld, biedt een makkelijke importoptie om een extra veld aan een groot aantal records in één keer toe te voegen. Tijdens de discussie bleek dat dit bijvoorbeeld niet geldt voor het systeem Cardbox. Geen van de systemen bleek een standaardveld te hebben voor een URI bij een thesaurusrecord, wat men voelde als een gemis.
Uiteindelijk blijken het eerste en laatste deel van het hele proces het moeizaamst. Het eerste deel omdat de thesaurus in het eigen systeem vaak vol ‘historische vervuiling’ staat, en inhoudelijk opgeschoond moet worden. Hierbij zijn vaak meerdere mensen in een instelling betrokken, terwijl het weinig prioriteit krijgt. Dit kan vertraging opleveren. Vervolgens komt het linken zelf; Cultuurlink maakt dit makkelijk, alhoewel er een ombouwstap aan vooraf gaat die sommige mensen als lastig ervaren. Vervolgens is het laatste deel de nieuwe info (URI’s) in het eigen systeem opnemen. Dit is lastig omdat de systemen hier niet op ingericht zijn en er daarom eerst maatwerk nodig is om een veld voor de URI’s te creëren. Ook zal een importbestand er voor elk systeem anders uitzien, waardoor er niet een standaard, import-klaar bestand uit Cultuurlink geëxporteerd kan worden. Hierdoor is een extra ombouwstap toch nog noodzakelijk. Het succes van de dag lag er desondanks in dat verschillende informatiespecialisten nu op de hoogte zijn van het proces dat nodig is om URI’s te laten verschijnen in hun collectiebeheersysteem.
MoMu en NOB organiseerden dit evenement in samenwerking met Netwerk Digitaal Erfgoed, als onderdeel van de samenwerking ‘Visuele Thesaurus voor Mode & Kostuums’. Het doel van dit project, dat loopt sinds november 2015: beheerders van het Vlaamse en Nederlandse mode-erfgoed stimuleren links voor objectnamen op te nemen in hun collectiebeheersystemen. De Vlaamse Overheid maakte het project mogelijk. De strategie omvat drie opdrachten: een bestaande open terminologie verbeteren, het effect van Linked Data demonstreren en workshops organiseren, zoals deze.