Het handschrift dat het leven op aarde beschrijft

blog naturalisHet Natuurhistorisch Museum Naturalis in Leiden bezit een groot spectrum aan specimen, geordend in zalen. Wat u en ik in Leiden kunnen zien, is maar een fragment van het totaal van wat aanwezig is in Naturalis’ gewelven.

De afgelopen jaren verrichtte het Natuurhistorisch Museum monnikenwerk door de digitalisering van 37 miljoen ‘objecten’, zoals dat in vaktermen heet. Terwijl het fysieke museum zo’n 3 ton bezoekers per jaar ‘doet’, ontvangen de door Naturalis Biodiversity Center beheerde digitale informatiediensten ruim vijf miljoen bezoekers. Via de vrij toegankelijke Biodiversiteits-API hebben we een deel van Naturalis’ collectie doorvertaald naar de Digitale Collectie. Met de omzetting van meta-data ontzorgen we Naturalis, en brengen we nieuwe ambities voor het aanbieden van diensten, door anderen, dichterbij.

Deelname Hack-a-LOD

Afgelopen zaterdag vond in het Brabantse Veghel de Hack-a-LOD plaats. Een hackaton waar het allemaal draaide om het maken van toepassingen met Linked Open Data van onder andere de openbare bibliotheken. Deze Hack-a-LOD is onderdeel van het project Brabantse Collecties en Content. Voor meer informatie http://www.hackalod.com/.

De Nederlanse Bibliotheek Catalogus NBC+
De Nederlandse Bibliotheek Catalogus (NBC+) was hiervoor beschikbaar via de API en als ruwe data in RDF-vorm (en via sparql).  Beide technisch beschikbaar gemaakt door Seecr.  Tevens waren er verrijkingen toegevoegd door Roland Cornelissen van Metamatter.

Impressie op YouTube
Voor een korte impressie van de Hack-a-LOD, zie dit filmpje.

De catalogus en beschikbaarheid
Erik was als ‘kijker’ aanwezig en zag hoe veelal jonge mensen met de data aan de slag gingen.  De catalogus is daadwerkelijk door een team gebruikt om relevante informatie te vinden terwijl je onderweg bent.  Ze waren enigszins teleurgesteld.  Op de vraag waarom was het antwoord: “het is maar een catalogus”.  Ze bedoelden hiermee: “we vonden wel wat, maar we konden niet doorlinken, er staat alleen dat het er is”.

Het was te laat om ze te wijzen op het  NBC+ /available end-point helaas; dat had misschien in een deel van hun wensen voorzien. Het toont maar weer eens aan hoe belangrijk het is om daadwerkelijk links te geven, ook naar de inhoud zelf!

Waarom Linked Data?

Organisaties beschikken over steeds meer waardevolle informatie. Voor een goede samenwerking intern en extern is het van belang dat die informatie gedeeld en gevonden kan worden. Voor het delen van informatie worden vaak afspraken gemaakt, die op een later moment te rigide blijken te zijn. En bij het zoeken ligt de nadruk noodgedwongen nog vaak op het (toevallig) voorkomen van een woord in een lap tekst.

Linked Data is een vorm om informatie beschikbaar te stellen die meer mogelijkheden biedt, doordat
• onderlinge relaties expliciet gemaakt worden;
• software deze vorm automatisch kan verwerken: bekende relaties worden herkend;
• bepaalde datavelden niet bij voorbaat verplicht zijn;
• waardoor er altijd ruimte blijft om later meer data/relaties toe te voegen, ook door derden.

De belofte van Linked Data

Alles wat binnen de data de moeite waard is om te beschrijven, zoals bijvoorbeeld een kunstwerk, een persoon of een locatie, krijgt een unieke identifier. Verbanden ontstaan door relaties te leggen tussen de verschillende ‘concepten’ op basis van deze identifiers. RDF biedt hiervoor een eenduidig formaat (triples) waarbinnen de vrijheid bestaat om te kiezen welke relaties daarvoor het meest van toepassing zijn. Bovendien kunnen er in RDF altijd relaties worden toegevoegd, ook vanuit andere bronnen, zodat de semantische verbanden rijker worden naarmate daar behoefte aan ontstaat.

Specialisme van Seecr
Seecr is gespecialiseerd in het inrichten van een (software) infrastructuur voor het verwerken en snel doorzoekbaar maken van grote hoeveelheden data voor veel gebruikers. Wanneer die data als linked data afkomstig is uit verschillende bronnen, kan er sprake zijn van verschillen in rijkheid en structuur. Daarom is het van belang om bij de bron al goed te kiezen welke relaties gebruikt worden om de data te beschrijven. Beschrijf zoveel mogelijk relaties uit gangbare RDF vocabularies (zoals Dublin Core, FOAF, SKOS) en daarnaast eventueel meer specifieke (of zelfs proprietary) relaties voor zover dat richting de eindgebruiker toegevoegde waarde kan hebben.

Daarnaast is het noodzakelijk om binnen de infrastructuur voorzieningen te treffen om de verschillende objecten op een eenduidige manier vindbaar te maken. Onze oplossing daarvoor bouwt weer voort op de Linked Data filosofie met behulp van zogenaamde Open Annotations.

Gericht op eindgebruiker
Wij zijn altijd gericht op het toepassen van de juiste gereedschappen om op een praktische manier data nuttig te maken voor de eindgebruiker. Linked Data biedt vergaande mogelijkheden, waarvan we voor specifieke (deel)problemen dankbaar gebruik maken. Een waardevolle aanvulling in onze ‘gereedschapskist’ Meresco.

Project Nationale Aggregator Digitale Collectie NL

Samen met het Nederlands Instituut voor Beeld en Geluid hebben we een nationale infrastructuur ontwikkeld, de zogenaamde Nationale Aggregator

Digitale Collectie NL
Deze aggregator brengt beschikbare digitale erfgoedcollecties van musea en archieven in Nederland samen in een centrale index.

Vergroting zichtbaarheid collecties
De Nationale Aggregator biedt een infrastructuur voor de aansluiting van digitale erfgoedcollecties van musea en archieven op (inter)nationale diensten en voorzieningen. Door de metadata van miljoenen digitale erfgoedobjecten nationaal te ontsluiten, wordt de zichtbaarheid vergroot van het Nederlands erfgoed op een portal als Europeana.

Kwaliteit
Om de metadata uit verschillende bronnen eenduidig te kunnen ontsluiten via OAI-PMH, is het van belang dat formaatafspraken correct worden toegepast. Binnen het platform wordt deze kwaliteit gewaarborgd. Met de feedback die dit oplevert, adviseren we collectiebeheerders over eventueel noodzakelijke aanpassingen in de manier waarop hun gegevens beschikbaar worden gesteld.

Op de basisfunctie worden steeds nieuwe toepassingen en verbindingen gebouwd. Zo is er een koppeling gerealiseerd met Clarin, de research infrastructuur voor taalonderzoek en menswetenschappen.

Linked Open Data
Met Beeld en Geluid zijn we semantische technologie gaan toepassen en doorontwikkelen om de onderlinge verbanden tussen collecties op een uitnodigende manier zichtbaar te kunnen maken. Op de studiedag ‘De Grootste Gemene Deler’ (juni 2013) heeft Jurjan-Paul de Linked Open Data Demonstrator gepresenteerd. Omdat het in veel gevallen nog nodig is dat brongevens worden uitgebreid met links naar herkenbare concepten, vervult Seecr ook hierin een adviserende rol.

Looptijd
Van oktober 2009 tot maart 2011

Link
http://www.beeldengeluid.nl/

Presentatie Linked Open Data Demonstrator

Onder het thema ‘De grootste gemene deler’ vond op 5 juni  jl. een studiedag plaats voor erfgoedprofessionals in het kader van Europeana en de nationale aggregator ‘Digitale Collectie’ (waarvan de software is ontwikkeld door Seecr).

Jurjan-Paul Medema presenteerde daar de stand van zaken van een ‘linked open data demonstrator’. In samenwerking met het Nederlands Instituut voor Beeld en Geluid en de Rijksdienst voor het Cultureel Erfgoed (RCE) heeft Seecr deze demonstrator ontwikkeld. Het doel van dit project is om verbanden zichtbaar te maken tussen erfgoedobjecten in verschillende collecties. Dit zal vervolgens instellingen kunnen stimuleren om hun metadata steeds meer in een ‘linked open’ vorm beschikbaar te maken.

screenshot Linked Open Data Demonstrator:
Image

Semantische links
Voorlopig zijn we gestart met de Open Beelden collectie van Beeld & Geluid en een collectie molenfoto’s van RCE. We hebben ondersteuning verleend aan het vormgeven van de RDF met semantische links naar thesaurusbegrippen en geografische aanduidingen. Voor de metadataspecialisten was het vervolgens nog wel een flinke klus om de brondata daadwerkelijk te verrijken en links te leggen tussen de verschillende thesauri die bij beide organisaties in gebruik zijn.

Visualisatie
De demonstrator maakt gebruik van de open source tool InContext (http://surf.nl/InContext) om de relaties tussen objecten en begrippen te tonen. Met de demonstrator willen wij de bezoekers een gebruiksvriendelijke user interface aanbieden, waardoor zij op een intuïtieve manier langs inhoudelijke relaties op verkenning kunnen gaan door de dataset. Dit hebben we gerealiseerd door voldoende intelligentie op te nemen in de software die efficiënte selecties maakt van de data en de technische details daarvan buiten het zicht houdt.

Toekomst
Wij hopen dat het project een vervolg krijgt in de vorm van doorontwikkeling aan de user interface en linked data van meer collecties.