Het opschonen van de interne thesaurus

Dezelfde term kan bijvoorbeeld in vele spellingsvarianten in de objectrecords terecht komen. In veel interne thesauri staan termen met spelfouten en extra spaties, verschillende spellingsvarianten van dezelfde term en termen die bestaan uit meerdere woorden, die als losse trefwoorden bedoeld zijn (bijv. 'wehrmacht bunkers'). 

Het resultaat van dit soort vervuiling is dat bij het zoeken op een bepaalde term, records niet gevonden worden waar net een andere variant van de term in gebruikt wordt. Objectrecords kunnen ‘verspreid’ raken over verschillende thesaurustermen waar dezelfde term is bedoeld, omdat elke invoerder een eigen voorkeur van thesaurustermen heeft. Er is geen goed overzicht en de kans wordt groter dat er records ‘vergeten’ worden omdat ze niet naar boven komen in zoekacties. 

Aan de slag met het opschonen van uw thesaurus

Dus voordat er gematcht gaat worden is het belangrijk een thesaurus op te schonen. Bij het opschonen van de thesaurus, worden spelvarianten van dezelfde term aan elkaar gekoppeld, extra spaties verwijderd, termen met spelfouten verbeterd of verwijderd en samengestelde termen gesplitst. Het kan ook een goed moment zijn om inhoudelijk naar de toekenning van termen te kijken: zijn de invoerregels inhoudelijk consistent, en zijn ze ook goed toegepast? 

Wat is bijvoorbeeld de precieze scheiding tussen de inhoud van het veld ‘materiaal’ en het veld ‘techniek’? In welk veld worden de kleuren van een werk beschreven, moet dat echt in een gecontroleerd veld? Hoe is de naamsopbouw bij personen; achternaam eerst, met voorletters of voornamen, waar komen titels en tussenvoegsels? Wat is de manier waarop naar plaatsnamen wordt verwezen en hoe maakt u het onderscheid tussen Den Hoorn op Texel en Den Hoorn in Zuid-Holland? 

Het opschonen van uw thesaurus kan aan de ene kant bestaan uit het verwijderen of doorverwijzen van inhoudelijk dubbele termen. En aan de andere kant is er het bedenken, aanscherpen en/of toepassen van de registratieregels in zowel de objectrecords als de thesaurus. Beide aanpakken helpen bij het creëren van een overzichtelijke, ondubbelzinnige digitale registratie waarbij snel álle records met een bepaald kenmerk gevonden kunnen worden. De mate waarin dit aangepakt wordt is uiteraard afhankelijk van de staat van de digitale registratie en de wensen van de instelling. 

Pak inhoudelijk bij elkaar horende groepen aan

Opschonen gaat, ook weer afhankelijk van de situatie, vaak het beste wanneer er inhoudelijk bij elkaar horende groepen worden aangepakt: één of een aantal velden die samen een bepaald aspect van het object beschrijven (materiaal, techniek, objecttype). Als de collectie groot en/of heterogeen is, kan het ook handig zijn om per deelcollectie (bijv. beeldende kunst) te werken. 

Lees ook verder over het daadwerkelijke koppelen of matchen van uw thesaurus met de WO2-thesaurus:  

headerbeeld
Paleis Noordeinde Den Haag. Aankomst Koningin Wilhelmina. Tapijt wordt geveegd (Meijboom, Marius / Anefo)
datum
gebied