Digitale Collectie tikt 4,3 miljoen objecten aan

We hebben ons werk voor de Digitale Collectie in een infographic samengevat. Het totale aantal objecten dat we uit meer dan 100 archieven, musea en instituten in Nederland doorzoekbaar maken, bedraagt intussen 4,3 miljoen!

Europeana

Door de aansluiting op Europeana van de Digitale Collectie, maken we het Nederlands erfgoed ook op Europees niveau zichtbaarder.

Infographic Digitale Collectie

Project Nationale Aggregator Digitale Collectie NL

Samen met het Nederlands Instituut voor Beeld en Geluid hebben we een nationale infrastructuur ontwikkeld, de zogenaamde Nationale Aggregator

Digitale Collectie NL
Deze aggregator brengt beschikbare digitale erfgoedcollecties van musea en archieven in Nederland samen in een centrale index.

Vergroting zichtbaarheid collecties
De Nationale Aggregator biedt een infrastructuur voor de aansluiting van digitale erfgoedcollecties van musea en archieven op (inter)nationale diensten en voorzieningen. Door de metadata van miljoenen digitale erfgoedobjecten nationaal te ontsluiten, wordt de zichtbaarheid vergroot van het Nederlands erfgoed op een portal als Europeana.

Kwaliteit
Om de metadata uit verschillende bronnen eenduidig te kunnen ontsluiten via OAI-PMH, is het van belang dat formaatafspraken correct worden toegepast. Binnen het platform wordt deze kwaliteit gewaarborgd. Met de feedback die dit oplevert, adviseren we collectiebeheerders over eventueel noodzakelijke aanpassingen in de manier waarop hun gegevens beschikbaar worden gesteld.

Op de basisfunctie worden steeds nieuwe toepassingen en verbindingen gebouwd. Zo is er een koppeling gerealiseerd met Clarin, de research infrastructuur voor taalonderzoek en menswetenschappen.

Linked Open Data
Met Beeld en Geluid zijn we semantische technologie gaan toepassen en doorontwikkelen om de onderlinge verbanden tussen collecties op een uitnodigende manier zichtbaar te kunnen maken. Op de studiedag ‘De Grootste Gemene Deler’ (juni 2013) heeft Jurjan-Paul de Linked Open Data Demonstrator gepresenteerd. Omdat het in veel gevallen nog nodig is dat brongevens worden uitgebreid met links naar herkenbare concepten, vervult Seecr ook hierin een adviserende rol.

Looptijd
Van oktober 2009 tot maart 2011

Link
http://www.beeldengeluid.nl/

Project Open Annotation Service (OAS)

Om gedigitaliseerde beelden, audiofiles, scans van oude documenten op een standaard manier te annoteren en uit te wisselen is binnen CATCHplus het Open Annotation Service project uitgevoerd.

Annotaties van specialisten, bijvoorbeeld bij handgeschreven teksten, worden via de Open Annotation standaard opgeslagen in een Annotation Service. Deze serice publiceert de annotaties, maakt ze doorzoekbaar, en stelt ze te beschikking aan ander applicaties. Verschillende annotaties services kunnen onderling annotaties uitwisselen.

Seecr heeft Open Annotation Server ontwikkeld. OAS is makkelijk te installeren en in te richten. De software is beschikbaar als Open Source (https://github.com/CatchPlus/OAS-Open-Annotation-Service). Voor Debian linux is een kant en klaar package beschikbaar: http://repository.seecr.nl/binaries/oas-1.2.html

Onderdeel van het project was ook het ontwikkelen van de OAS-standaard. Onze feedback heeft mede geleid tot de huidige standaard, zie http://www.w3.org/community/openannotation/.

Feedback
Een zoekapplicatie ontwikkelen is dagelijkse kost voor ons. De aangeleverde specificaties en structuren maakten dit project wel wat gecompliceerder. Ik vind het dan ook echt een uitdaging om die documenten uit te pluizen en vervolgens voor 100 procent conform de aangeleverde specificaties te implementeren. Feedback van de klant is daarbij onmisbaar. Het is bij dit project wel weer gebleken dat we voor het beste resultaat de klant nodig hebben.

Looptijd
Van januari 2012 tot oktober 2012

Link
http://oas.dev.seecr.nl:8000/index

Project NBC+ Zoekplatform

Onder de naam Nationale Bibliotheek Catalogus (NBC) hebben wij een nieuw en innovatief platform voor digitaal erfgoed ontwikkeld. Dit platform geeft toegang tot bibliografische content van alle bibliotheken in Nederland en op termijn ook van musea, archieven en Media Content Providers voor Muziek, televisie en films. Andere bronnen die nu al wel ontsloten zijn, zijn onder andere Krantenbank, Gutenberg, Wikipedia en de Consumentenbond.

Met behulp van dit platform hebben programmeurs snel toegang tot de enorme hoeveelheden digitale erfgoedinformatie die vandaag de dag aanwezig is in bibliotheken, archieven en musea. Alle inhoud is gestandaardiseerd, verrijkt en aan elkaar gerelateerd. Commerciële partijen alsook instellingen kunnen daardoor toegang krijgen tot deze content. Snel en eenvoudig.

Relateren
Het platform analyseert en verrijkt de verschillende bronnen zodat de silo’s van informatie aan elkaar worden gerelateerd, maar ook aan de wereld om ons heen, het Linked Open Data netwerk. Dit semantisch netwerk vertegenwoordigt niet alleen boeken, maar ook mensen, gebeurtenissen, organisaties, plaatsen en andere artefacten. Alles in een samenhangende en georganiseerde manier.

Geen informatie verloren
Eén van de onderscheidende eigenschappen van het platform is het gestructureerd aanbieden van zeer heterogene data, zodat hiermee eenvoudig betrouwbare diensten kunnen worden ontwikkeld. Het platform doet dit zonder dat er informatie verloren gaat. Programmeurs kunnen kiezen op welk abstractieniveau ze de data willen benaderen, bijvoorbeeld algemeen, bibliografisch, muziek, etc.

Open architectuur
De wereld van data analyse, linked open data e.d. ontwikkelt zich snel. Via R&D komen steeds nieuwe tools beschikbaar. Daarom hebben we gekozen voor een open architectuur waarin nieuwe technische ontwikkelingen snel kunnen worden omarmd. De initiële keuzes die we hebben gemaakt voor dataopslag, verrijken en zoeken, kunnen worden uitgebreid met nieuwe technologieën. Verschillende technieken kunnen ook naast elkaar worden toegepast.

In deze open architectuur kunnen databronnen eenvoudig worden toegevoegd, ongeacht de gebruikte techniek, communicatieprotocollen of standaarden.

Doorbraak
Het leuke van het project is dat op een paar cruciale punten echt een doorbraak aan het ontstaan is. Dat heeft er vooral mee te maken dat we tegen grenzen aanlopen van het verzamelen van data en het bouwen van indexen daarop. Met dit platform maken we radicaal een einde aan de eisen die een data-aggregator oplegt aan de data-toeleveranciers. Wij draaien de rollen om! Gebruik het specialisme van de data-toeleveranciers om die data goed doorzoekbaar te maken.

Het zoekplatform is het resultaat van een opdracht van het ministerie van OCW en SIOB om een nieuwe en innovatieve digitale infrastructuur voor openbare bibliotheken te creëren.

Looptijd
Vanaf april 2012.

 

 

Wetenschappelijke Etalage

De universiteitsbibliotheek van Maastricht bevat een hoeveelheid aan wetenschappelijke artikelen, lezingen, proefschriften etc. Regelmatig wordt de bibliotheek aangevuld door onderzoeksgroepen en faculteiten. Deze worden met behulp van OAI-PMH ontsloten uit METIS

De opdracht was om op een nette gestructureerde manier de faculteiten en vakgroepen “in de etalage” te zetten, met als doel om “Maastricht” op de kaart te zetten. Dit is bereikt door met semantische technologie alle medewerkers en publicaties te relateren aan faculteiten en doelgroepen en daarop de etalage te baseren. Het (technische) resultaat is opgenomen in de open source suite Meresco en daarmee voor iedereen beschikbaar.

DAI-code
Alle auteurs zijn geïndexeerd met hun DAI-code (Digital Author Identifier). Deze code wordt geresolved met behulp van RDF. Elke avond wordt de RDF ingelezen in de triple store. De DAI-code zorgt voor een eenduidige schrijfwijze, zodat er gedurende de harvesting uit meerdere bronnen de naam identiek wordt weergegeven.


Flexibel plan van aanpak
Maastricht ligt niet bepaald naast de deur. Maar de afstand heeft ons er niet van weerhouden om regelmatig met de klant om tafel te gaan. Ook bij een kortdurend en overzichtelijk project als dit is het belangrijk dat er gedurende het proces kan worden bijgestuurd en aangevuld. In een later stadium van het project hebben we een extra functionaliteit toegevoegd met betrekking tot weergave van brongegevens per zoekresultaat. Door middel van templating kan per type worden bepaald welke bronvermeldingen er moeten worden weergegeven. Een goede aanvulling wat in de toekomst moeiteloos kan worden uitgebreid.

Looptijd project
Van augustus 2010 tot november 2011.

Link
http://publications.maastrichtuniversity.nl

Project HBO Kennisbank

Surf is een webportal waarmee je door publicaties en scripties van studenten en docenten van verschillende hogescholen kunt zoeken. Je kunt ook waarderingen en recensies achterlaten.

Verschillende formaten, één zoekmachine
HBO Kennisbank begon in eerste instantie als een soort kopie van Darenet. Het was eenzelfde soort project alleen dan voor universiteiten. Toen we in 2006 met HBO Kennisbank begonnen, was het de eerste keer dat we verschillende formaten van metadata combineerden. We hadden metadata van leermiddelen, scripties en publicaties die allemaal op een andere manier werden aangeleverd. Een titel komt overal voor, maar staat in ieder formaat op een andere plek. De uitdaging was om een systeem te bouwen waarin je door de verschillende repositories kon zoeken, maar de resultaten samen presenteert.

Nieuwe fase
De portal krijgt een betere vormgeving en we zitten in een overgangstraject naar een nieuw metadata formaat. We ondersteunen tijdelijk zowel de nieuwe als de oude formaten. Als je dat niet doet, dan ga je onherroepelijk bepaalde repositories van participerende HBO’s missen. Er zijn 13 verschillende instellingen die hun eigen processen hebben en als portal ben je afhankelijk van de data die via de verschillende repositories worden aangeleverd. Je wilt ze dus allemaal rustig meenemen naar een nieuwe fase en niemand achterlaten.

Combinatie drill-down
De nieuwste feature in HBO Kennisbank is de combinatie drill-down. Een drill-down is een weergave van metadata, in een combinatie drill-down relateer je twee verschillende metadatavelden aan elkaar. In je zoekresultaten ga je dus twee lagen diep. Bijvoorbeeld bij het aantal records van een specifieke classificatie, ‘ICT & Media’, laten we ook het aantal records per bijhorende trefwoorden zien: Marketing, Communicatie, e.d. zien. Het is een soort tweetrapsraket.

Prettige hoofdpijn
Initieel is niet altijd bekend wat de wens van de opdrachtgever voor effect heeft op de techniek. Als je iets specifieks wilt, dan matcht dat niet altijd met het systeem. Soms moet je hele systeem een kwartslag gedraaid worden. De volgende keer is het andersom, dan zijn juist de dingen die groot lijken voor de opdrachtgever, klein voor ons. Daarom is het belangrijk om met elkaar in gesprek te gaan om goed in te kunnen schatten wat de wensen voor gevolg hebben voor het budget of het systeem. Op het wensenlijstje van de opdrachtgever denkt men soms al mee over wat er kan, maar als je niet uitkijkt worden er wensen bedacht met de beperkingen van het huidige systeem. Daarom willen we leren wat de vraag achter de vraag is. We vinden het fijn als de klant ons een beetje hoofdpijn bezorgt. Bijvoorbeeld wanneer men iets wil wat het systeem nog niet kan. Juist die vragen helpen ons om out-of-the-box te denken.

Gedeelde kosten
Wat we ook graag doen is mensen bij elkaar brengen. Bijvoorbeeld opdrachtgevers met hetzelfde probleem. Dat deden we met SURFfoundation en Universiteit Maastricht. Beiden hadden eenzelfde probleemvraag en de oplossing was te duur om individueel te bekostigen. Wij hebben hen toen bij elkaar gebracht en samen hebben ze de feature (combinatie drilldown) bekostigd.

Looptijd
Vanaf 2007

Link
http://www.hbo-kennisbank.nl