zondag 8 december 2013

Straatweergave Open Archieven

Van punt naar lijn

In Uitdagingen bij geocoderen historische straten ging ik nog uit van het plaatsen van een marker in de betreffende straat op een historische kaart.

image

Zo’n punt op de kaart wekt echter ten onrechte de indruk dat de locatie precies bekend is, dat je het juiste huis aanwijst. De meeste ‘adresgegevens’ in historische akten beperken zich tot straatnamen (en wellicht wijk informatie). De huisnummers in oude bevolkingsregisters komen vaak niet meer overeen met de moderne nummering. Het aanwijzen van de straat is voor de toepassing in Open Archieven dan ook genoeg, maar een straat moet je niet met een punt maar met een lijn weergeven!

Op zoek naar geometrie van straten

Een goede bron voor geometrische data is OpenStreetMaps, te vergelijken met Google Maps, maar OpenStreetMap (OSM) biedt open data, gelicenseerd onder de Open Data Commons Open Database License (ODbL).

De XML variant van de data (de ‘planet’ variant) is ongecomprimeerd ruim 400GB (gecomprimeerd zo’n 29GB). OSM maakt het echter ook mogelijk om van een bepaald gebied (een zog. bounding box) data te downloaden via de Overpass API. Voor Leiden komt dit neer om een bestand van zo’n 13MB, wat een stuk behapbaarder is. Dit bestand is voor Open Archieven geschikt gemaakt zodat op basis van een straatnaam (in OSM termen een way) een lijn kan worden getekend (op basis van 2 of meer nodes).

image

Bruikbaarheid van de data

OSM biedt veel gegevens, maar is niet compleet. Zo vond ik bijvoorbeeld de Leidse straten Hermanstraat, Brandewijnsgracht en Paradijssteeg niet in OSM. Maar als OSM gebruiker kun je ook, net als bij Geonames, zelf gegevens toevoegen! Een kwestie van een lijn tekenen en gegevens opvoeren en de straten zijn nu wel beschikbaar, voor iedereen!

Het grootste nadeel van OSM is dat alleen de huidige geometrie wordt weergegeven, historische straten vind je niet en kan je ook niet opvoeren. Een groot deel van de straten die voorkomen in historische akten zal gewoon beschikbaar zijn omdat deze nog steeds bestaan, een deel van de straten zal hernoemd zijn, maar een resterend historische/verdwenen deel zul je handmatig in je eigen dataset moeten opvoeren.

Open data slim gebruiken

Open Archieven heeft een alternatieve schrijfwijzen bestand aangelegd om de oude schrijfwijzen en namen te koppelen aan de hedendaagse varianten. Zo wordt de St. Aeachtenstraet dus herkend als Sint Aagtenstraat, de Zuytcingel als Zuidsingel en zelfs de Achtergracht (die is hernoemd) als 5e Binnenvestgracht. Het aanleggen van deze lijst is nog handwerk, op basis van oude kaarten en bronnen als Overzicht van veranderde straatnamen en verdwenen straten en stegen van Jan van Hout.

De lijst met straatnamen wordt gebruikt om in specifieke velden van de genealogische gegevens op Open Archieven te zoeken naar bekende straatnamen. Bij sommige akten is er een apart veld ‘straat’, maar er kan ook een straat opgenomen zijn in de woonplaats. Het lastige aan het woonplaats veld is dat er een woonplaats in kan zitten, een straatnaam, of combinatie, zoals “Leiden, Oranjegracht Wijk 8 No. 652”. Open Archieven herkent in dit voorbeeld “Oranjegracht” waardoor er een link gelegd kan worden naar de historische kaart met gehighlighte straat (zie voorbeeld).