Open Archieven is een zoekmachine voor de genealogische gegevens van open archieven (=archieven die hun gegevens beschikbaar stellen voor hergebruik). Het maken van een dergelijke websites is leuk en nuttig.
Leuk, omdat innovatieve ideeën gerealiseerd kunnen worden, zoals de koppel-weergave bij huwelijken (zie afbeelding hieronder) en de verwijzing naar relevante gerelateerde akten en online grafzerken en stambomen.
Nuttig, omdat in dit proces ook fouten en omissies aan het licht komen. Enerzijds in de gegevens, deze worden teruggekoppeld aan het archief zodat de kwaliteit van de data verhoogd wordt. Anderzijds in de wijze waarop informatie beschikbaar wordt gesteld. Eén aspect hiervan wil ik in dit artikel toelichten.
Gescans akten vs. gescande registers
Erfgoed Leiden en omstreken (ELO) stelt hun genealogische gegevens beschikbaar via het OAI-PMH protocol. Binnen dit harvesting protocol wordt er gebruik gemaakt van het Archive 2 All (A2A) model. Dit A2A model beschrijft informatie in termen van personen, gebeurtenissen, bronnen, objecten en relaties hiertussen. Concreet kun je denken aan een huwelijksakte die de gegevens van het bruidspaar en hun ouders toont, de datum en plaats van het huwelijk en gegevens over de bron, waaronder of er een scan van de akte beschikbaar is.
Bij de open data van ELO zijn van de 4,1 persoonsvermeldingen zo’n 2 miljoen gekoppeld aan een scan. Is de rest van het materiaal dan niet gescand? Jawel! Echter die persoonsvermeldingen (of beter, de records/akten) zijn niet gekoppeld aan één akte maar aan een gescand register. Zo’n register kan de bezoeker digitaal doorbladeren om de betreffende akte te vinden.
In het A2A model (versie 1.7) kun je alleen aangeven dat er een gescande akte is of niet. Er kan niet worden aangegeven dat de akte zich bevind in een gescand register. En dat is jammer! Open Archieven heeft de informatie over de gescande registers nu op een andere wijze verkregen (helaas niet uit de EAD), maar ziet toch graag dat in een volgende versie van het A2A model er een mogelijkheid komt om aan te geven dat er een gescand register beschikbaar is waarin de akte gevonden kan worden. Voor de eindgebruiker is dit immers belangrijke informatie.
Ik stel voor om in de XSD het element A2A:Scan uit te breiden met het element A2A:ScanType van type A2A:token100 met mogelijk waarden “akte” en “register”. Wanneer het scan type “register” is verwijzen de overige URI velden niet naar een “akte” maar heel “register”. In de presentatie door de hergebruiker dient dit onderscheidt inzichtelijk gemaakt te worden. Ter inspiratie hieronder hoe Open Archieven een en ander toont aan haar gebruikers.