Waarom Linked Data?

Organisaties beschikken over steeds meer waardevolle informatie. Voor een goede samenwerking intern en extern is het van belang dat die informatie gedeeld en gevonden kan worden. Voor het delen van informatie worden vaak afspraken gemaakt, die op een later moment te rigide blijken te zijn. En bij het zoeken ligt de nadruk noodgedwongen nog vaak op het (toevallig) voorkomen van een woord in een lap tekst.

Linked Data is een vorm om informatie beschikbaar te stellen die meer mogelijkheden biedt, doordat
• onderlinge relaties expliciet gemaakt worden;
• software deze vorm automatisch kan verwerken: bekende relaties worden herkend;
• bepaalde datavelden niet bij voorbaat verplicht zijn;
• waardoor er altijd ruimte blijft om later meer data/relaties toe te voegen, ook door derden.

De belofte van Linked Data

Alles wat binnen de data de moeite waard is om te beschrijven, zoals bijvoorbeeld een kunstwerk, een persoon of een locatie, krijgt een unieke identifier. Verbanden ontstaan door relaties te leggen tussen de verschillende ‘concepten’ op basis van deze identifiers. RDF biedt hiervoor een eenduidig formaat (triples) waarbinnen de vrijheid bestaat om te kiezen welke relaties daarvoor het meest van toepassing zijn. Bovendien kunnen er in RDF altijd relaties worden toegevoegd, ook vanuit andere bronnen, zodat de semantische verbanden rijker worden naarmate daar behoefte aan ontstaat.

Specialisme van Seecr
Seecr is gespecialiseerd in het inrichten van een (software) infrastructuur voor het verwerken en snel doorzoekbaar maken van grote hoeveelheden data voor veel gebruikers. Wanneer die data als linked data afkomstig is uit verschillende bronnen, kan er sprake zijn van verschillen in rijkheid en structuur. Daarom is het van belang om bij de bron al goed te kiezen welke relaties gebruikt worden om de data te beschrijven. Beschrijf zoveel mogelijk relaties uit gangbare RDF vocabularies (zoals Dublin Core, FOAF, SKOS) en daarnaast eventueel meer specifieke (of zelfs proprietary) relaties voor zover dat richting de eindgebruiker toegevoegde waarde kan hebben.

Daarnaast is het noodzakelijk om binnen de infrastructuur voorzieningen te treffen om de verschillende objecten op een eenduidige manier vindbaar te maken. Onze oplossing daarvoor bouwt weer voort op de Linked Data filosofie met behulp van zogenaamde Open Annotations.

Gericht op eindgebruiker
Wij zijn altijd gericht op het toepassen van de juiste gereedschappen om op een praktische manier data nuttig te maken voor de eindgebruiker. Linked Data biedt vergaande mogelijkheden, waarvan we voor specifieke (deel)problemen dankbaar gebruik maken. Een waardevolle aanvulling in onze ‘gereedschapskist’ Meresco.

Project Open Annotation Service (OAS)

Om gedigitaliseerde beelden, audiofiles, scans van oude documenten op een standaard manier te annoteren en uit te wisselen is binnen CATCHplus het Open Annotation Service project uitgevoerd.

Annotaties van specialisten, bijvoorbeeld bij handgeschreven teksten, worden via de Open Annotation standaard opgeslagen in een Annotation Service. Deze serice publiceert de annotaties, maakt ze doorzoekbaar, en stelt ze te beschikking aan ander applicaties. Verschillende annotaties services kunnen onderling annotaties uitwisselen.

Seecr heeft Open Annotation Server ontwikkeld. OAS is makkelijk te installeren en in te richten. De software is beschikbaar als Open Source (https://github.com/CatchPlus/OAS-Open-Annotation-Service). Voor Debian linux is een kant en klaar package beschikbaar: http://repository.seecr.nl/binaries/oas-1.2.html

Onderdeel van het project was ook het ontwikkelen van de OAS-standaard. Onze feedback heeft mede geleid tot de huidige standaard, zie http://www.w3.org/community/openannotation/.

Feedback
Een zoekapplicatie ontwikkelen is dagelijkse kost voor ons. De aangeleverde specificaties en structuren maakten dit project wel wat gecompliceerder. Ik vind het dan ook echt een uitdaging om die documenten uit te pluizen en vervolgens voor 100 procent conform de aangeleverde specificaties te implementeren. Feedback van de klant is daarbij onmisbaar. Het is bij dit project wel weer gebleken dat we voor het beste resultaat de klant nodig hebben.

Looptijd
Van januari 2012 tot oktober 2012

Link
http://oas.dev.seecr.nl:8000/index