In de blogposting Op zoek naar overlijdensakten van Tweede Wereldoorlog slachtoffers werd beschreven hoe in de door archiefinstellingen beschikbaar gestelde open data naar overlijdensakten van oorlogsslachtoffers gezocht werd. De resultaatlijst met overlijdensakten toont ook de archiefinstelling waar de (data van de) overlijdensakte vandaan komt. Opvallend was dat sommige archiefinstellingen ontbraken in deze lijst, zoals bijvoorbeeld Stadsarchief Rotterdam, terwijl ook zij de nadere toegang op overlijdensakten beschikbaar stellen voor hergebruik.
Op basis van deze constatering zijn de datasets van de “missende” archiefinstellingen geanalyseerd om mogelijke oorzaken te achterhalen. Het blijkt dat de datasets die Open Archieven heeft verwerkt van archiefinstellingen “gebreken” vertonen waardoor niet alle overlijdensakten van oorlogsslachtoffers gevonden worden. Enkele voorbeelden hiervan worden hier toegelicht.
Voorbeeld 1 – Stadsarchief Rotterdam
Op 19 oktober 1942 overlijdt Klara Koster in Auschwitz. In 1951 wordt in Rotterdam hiervan de volgende overlijdensakte opgetekend:
Dat de overlijdensakte de Poolse schrijfwijze Oświęcim hanteert is in dit geval geen probleem. De Kamplijst binnen de WO2 thesaurus van Netwerk Oorlogsbronnen heeft de verschillende schrijfwijzen opgenomen: Auschwits, Auswits en Oświęcim. Het “in Polen” deel zou via zoekterm expansie naar boven zijn gekomen.
Het is echter misgegaan bij het indexeren (of migreren) van de data. Als we naar de geïndexeerde gegevens van bovenstaande overlijdensakte kijken van deze akte op Open Archieven of de website van het Stadsarchief Rotterdam, dan zien we dat als plaats van overlijden Rotterdam staat genoteerd! In het vrije tekst veld Opmerkingen wel een goede aanwijzing: “overleden in Auschwitz (Polen) geb: 29-11-1905”.
In de nadere toegang op de Rotterdamse overlijdensakten (archief 999-09) van 1941-1959 komt in 8.612 akten een plaats van overlijden (als Auschwitz, Sobirob, enz.) voor in een opmerkingenveld.
Waarom bij het indexeren niet de letterlijke plaatsnaam is overgenomen (wat toch gebruikelijk is bij het indexeren) is mij niet bekend, evenmin waarom de akteplaats Rotterdam als plaats van overlijden is genomen. Ook is het apart dat de geboortedatum niet als gestructureerde dataveld is verwerkt, maar is opgenomen in een vrijtekst veld.
Wat tenslotte ook nog ontbreekt in de gestructureerde data is de aktedatum (19-01-1951), deze is waarschijnlijk niet geïndexeerd. In de selectie van overlijdensaktes van oorlogsslachtoffers speelde de aktedatum ook een belangrijke rol, als er meer dan twee maanden tussen datum van overlijden en akte ligt was het een kandidaat. Op de website van het Stadsarchief wordt het aktejaar weergegeven (1951), deze waarde zit helaas niet als zodanig (<a2a:SourceDate>) in de open data. Wel valt dit jaar te herkennen in het inventarisnummer “1951V1” en het aktenummer “1951.300” (strikt genomen zou je hier als aktenummer “300” verwachten).
Issue: niet goed geïndexeerde (of verkeerde gemigreerde) plaats van overlijden, informatie in ongestructereerd tekstveld, geen aktedatum (mogelijk af te leiden uit andere velden).
Voorbeeld 2 – Stadsarchief Delft
Op Open Archieven worden akten ook direct gematched met data van de Oorlogsgravenstichting, dit helpt bij het vinden van mogelijke oorlogsslachtoffers. Eén van de resultaten in de handmatige zoektocht bij Stadsarchief Delft levert de overlijdensakte van Abraham Kamphuis op. Dat deze overlijdensakte niet werd gevonden in de zoektocht naar oorlogsslachtoffers, komt enerzijds doordat als overlijdensplaats Delft staat genoteerd. Controle van de bijbehorende scan leert dat de gegevens niet correct zijn, plaats van geboorte en overlijden lijken verwisseld.
Deze verwisseling lijkt het Stadsarchief Delft zelf ook te hebben geconstateerd, daar de akte op hun website nu de plaatsen op de juiste plek toont. In plaats van “Lüneburg (Dld)” staat er trouwens nu “Lüneburg, Duitsland” wat op zich dichter bij de tekst in de originele akte ligt. Het is wachten totdat Stadsarchief Delft weer nieuwe exportbestanden maakt voor hun open data portaal, de laatste keer was in september 2017.
Dit voorbeeld zou, als de gecorrigeerde data was verspreidt, ook niet gevonden zijn in de zoektocht naar oorlogsslachtoffers doordat Lüneburg niet voorkomt in de WO2 thesaurus kamplijst. Abraham Kamphuis is hoogstwaarschijnlijk wel een oorlogsslachtoffer, maar is niet in een kamp overleden. Dit is een belangrijk inzicht ten aanzien van de vergaarde “set van overlijdensakten van oorlogsslachtoffers”. Door gebruik van de WO2 thesaurus kamplijst, moet dit dus eigenlijk gelezen worden als “set van overlijdensakten van oorlogsslachtoffers in kampen”.
Issue: niet goed geïndexeerde plaats van overlijden, overlijdensplaats niet van kamp, gecorrigeerde data vloeit te langzaam naar hergebruikers.
Voorbeeld 3 – Stadsarchief Enschede
Bij de overlijdensakten van Stadsarchief Enschede komen we Josine Caroline Felicia Hijmans tegen en haar partner Bernard Sanders. De matching met gegevens van de Oorlogsgravenstichting laat het hier afweten. De matching is te strikt, waardoor Open Archieven de naam Josine Caroline Felicia Sanders-Hijmans niet vindt. Verbeterpunt voor Open Archieven.
Volgens de geïndexeerde gegevens van de overlijdensakte is Josine in Enschede overleden, volgens gegevens van de Oorlogsgravenstichting in Bergen-Belsen. Helaas is er aan de overlijdensakte op Open Archieven geen scan gekoppeld (deze data is niet aangeleverd als #opendata), maar op de website van Stadsarchief Enschede is de scan wel te vinden.
In de laatste regel van deze akte lezen we dat Josine inderdaad in het concentratiekamp te Bergen-Belsen is overleden. De geïndexeerde plaats van overlijden is dus niet juist.
Wat in de geïndexeerde data ook mis gaat is de datum van overlijden. Zoals in de scan is te lezen is Josine op 31 maart 1945 overleden, hiervan is op 12 oktober 1945 een akte opgemaakt. Deze laatste datum is helaas geïndexeerd als datum van overlijden.
De gestructeerde data waar we beschikking over hebben is dus niet altijd goed. In dit soort gevallen is de enige logische vervolg stap het melden van de fout en wachten op bijgewerkte data.
Issue: foutief geïndexeerde plaats en datum van overlijden.
Voorbeeld 4 – Haagse gemeentearchief
Bij het Haagse gemeentearchief komen we hetzelfde probleem tegen als in het vorige voorbeeld. De overlijdensakte van Abraham Adrianus Oskam zoals op Open Archieven en de website van het gemeentearchief toont ‘s-Gravenhage als plaats van overlijden. Open Archieven geeft een link naar de pagina van Abraham Adrianus Oskam op de website van de Oorlogsgravenstichting waar als overlijdensplaats Mauthauzen staat gemeld. Inspectie van de scan toont aan dat dit laatste klopt en de geïndexeerde data dus foutief is.
De datum van overlijden is hier overigens wel correct, hier is niet de aktedatum genomen maar de in de tekst genoemde datum van 16 januari 1945.
Issue: foutief geïndexeerde plaats van overlijden.
Voorbeeld 5 – Regionaal Historisch Centrum Eindhoven
Eén van de overlijdensakten die Regionaal Historisch Centrum Eindhoven beschikbaar maakt en ook op Open Archieven wordt getoond is die van Albertus van Lieshout. Op Open Archieven wordt Deurne als plaats van overlijden genoemd. Ook hier is het weer de data van de Oorlogsgravenstichting die doet vermoeden dat dit niet klopt, de Oorlogsgravenstichting geeft Salzgitter-Watenstedt als plaats van overlijden van Albertus van Lieshout.
De scan van de overlijdensakte kan niet teruggevonden worden, ook al is het gescande register beschikbaar op de website van het archief. Op de website Online-Begraafplaatsen vinden we de naam van Albertus van Lieshout terug op een oorlogsmonument. Het oorlogsmonument in Helenaveen (gemeente Deurne) is opgericht ter nagedachtenis aan 22 medeburgers die als dwangarbeider in het Duitse Wuppertal om het leven zijn gekomen. Een tweede aanwijzing dat de overlijdensplaats Deurne niet klopt.
Maar wat opvalt is dat het archief op de betreffende aktepagina Deurne niet noemt als plaats van overlijden, maar als akteplaats! Het lijkt dat hier iets mis is gegaan is het aanmaken van de open data bestanden (de mapping van velden), daar is – wellicht door ontbreken van de plaats van overlijden – de akte plaats terecht gekomen in de a2a:EventPlace, wat dus niet klopt!
<a2a:Event eid="Event1"> <a2a:EventType>Overlijden</a2a:EventType> <a2a:EventDate> <a2a:LiteralDate>07-05-1945</a2a:LiteralDate> <a2a:Year>1945</a2a:Year> <a2a:Month>05</a2a:Month> <a2a:Day>07</a2a:Day> </a2a:EventDate> <a2a:EventPlace> <a2a:Place>Deurne</a2a:Place> </a2a:EventPlace> </a2a:Event>
Issue: foutief gemapte data.
Voorbeeld 6 – Regionaal Archief Dordrecht
De overlijdensakte van Alfred Catharinus van de Poll komt in de eerste selectie van overlijdensaktes naar voren als kandidaat. Alfred is op 14 maart 1945 te Hamburg-Neuengamme overleden. In de tweede selectie, waar wordt gezocht naar akten waar de aktedatum minimaal 2 maanden na de datum van overlijden ligt, valt deze akte er echter uit door het ontbreken van de aktedatum 17 februari 1949.
Op de website van het archief zien we dat de data van deze akte ook een veld “Diversen” bevat met de inhoud “Aktejaar: 1949. De namen van de ouders zijn niet vermeld in de akte. Er is ook een overlijdensverklaring.”. Helaas staat het jaar dat de akte is opgemaakt dus als ongestructureerd gegeven in een tekstveld. Inspectie van de aangeleverde open data (in A2A formaat) leert dat deze “Diversen” velden ook niet worden aangeleverd.
NB. de akte op de website van Regionaal Archief Dordrecht toont vreemd genoeg de plaats van overlijden niet, terwijl ze die wel hebben want die zit wel in de aangeleverde open data.
Issue: de akte datum is niet beschikbaar (in gestructureerde vorm).
Voorbeeld 7 – Gemeentearchief Venray
In de dataset van gemeentearchief Venray vinden we de overlijdensakte van Marinus Hendrikus van Hoff. Ook hier geeft de data van de Oorlogsgravenstichting een hint dat het om een oorlogsslachtoffer gaat. Als plaats van overlijden wordt aldaar Remscheid genoemd en niet Venray zoals de geïndexeerde data suggereert. Een opmerking bij deze akte geeft ook al een hint: “Exrtact Remscheid (Dld.)” (sic).
De scan van de overlijdensakte geeft uitsluitsel: gemeente Remscheid.
Los van het feit dat de plaats van overlijden dus niet juist is zou deze akte in het zoekproces naar overlijdensakten van oorlogsslachtoffers toch niet zijn gevonden. Remscheid komt namelijk niet voor in de kamplijst in de WO2 thesaurus. Wel komt Remscheid-Lüttringhausen voor. Lüttringhausen ligt in de gemeente Remscheid, wellicht dat Remscheid in de thesaurus als altLabel toegevoegd dient te worden.
Issue: onjuiste plaats van overlijden, plaats komt niet voor in WO2 thesaurus.
Voorbeeld 8 – Streekarchief Voorne-Putten
De overlijdensakte van Dirk Groeneveld geeft aan dat deze op 13 maart 1945 te Neuengamme is overleden.
Zoals is te zien op de scan is de aktedatum 8 december 1950. In de geïndexeerde data van de akte is deze helaas terecht gekomen in een ongestructureerd opmerkingenveld: “Akte ingeschreven te Spijkenisse op 08-12-1950”. Door het ontbreken van de aktedatum in een gestructureerd dataveld komt deze akte niet terecht in de selectie.
Issue: geen aktedatum (in gestructureerde vorm).
Voorbeeld 9 – Gemeentearchief Borsele
Bij gemeentearchief Borselle is de overlijdensakte beschikbaar van Cornelis Hillebrand, er is helaas geen online scan hiervan. De gegevens van de akte geven aan dat Cornelis op 10 februari 1945 is overleden te Lippendorf (D). De pagina van Cornelis Hillebrand op website van de Oorlogsgravenstichting geeft Peres, Landkreis Borna als plaats van overleden (ongeveer 20 kilometer van Lippendorf).
De reden dat deze overlijdensakte niet naar voren is gekomen in de zoektocht komt doordat noch Lippendorf, noch Peres, noch Peres voorkomen in de kamplijst van de WO2 thesaurus. Lippendorf komt voor in de lijst Arbeitserziehungslager. Het Digitaal Monument Merwedegijzelaars beschrijft Kamp De Kippe, Lippendorf. Een uitzoekwerkje voor de beheerders van de kamplijst in de WO2 thesaurus!
Issue: missende term in WO2 thesaurus.
Conclusie
Een onjuist geïndexeerde (of gemigreerde of gemapte) plaats van overlijden vormt de belangrijkste oorzaak van het niet vinden van overlijdensakten van oorlogs(kamp)slachtoffers. Het ontbreken van een aktedatum speelde de selectie ook parten. Wanneer het om een aantal fouten in een nadere toegangen gaat is melden het devies, zodat handmatig een en ander gecorrigeerd kan worden. Bij grotere aantallen, zoals bij Rotterdam, moet er gekeken welke mogelijkheden er zijn om in bulk correcties aan te leveren dan wel door te voeren. Tenslotte heeft deze exercitie ook weer enkele suggesties voor de kamplijst in de WO2 thesaurus opgeleverd.
De dataset waarin wordt gezocht is niet altijd perfect. Maar gelukkig heeft de drang naar perfectie publicatie niet in de weg gestaan. Zodoende kunnen meerdere ogen naar de data kijken en suggesties voor verbeteringen doen!