Wie mag wat waar: integrated access management

Om eindgebruikers van het zoekplatform van bibliotheek.nl toegang te geven tot andere bibliotheekdiensten, schrijven we nu code voor een goede afhandeling daarvan. Dit stukje functionaliteit laat de systemen van de bibliotheek weten met wie ze te maken hebben, zonder dat daarbij passwords of inlogcodes van de gebruiker bij het zoekplatform zelf bekend hoeven te zijn. De afhandeling vindt plaats via OAuth 2.0. Deze service geeft een ‘sleutel’ af bij het inloggen, en herkent die als er gevraagd wordt een actie uit te voeren. Boekje lenen? Is goed. Reserveren? Kan! Vanaf de kant van de bibliotheek gezien, biedt deze toegangspoort een prettige flexibiliteit in de dienstverlening. Er zijn immers legio diensten denkbaar, die achter zo’n intelligente toegangspoort beheersbaar uitgerold kunnen worden. Voor de huidige case beperken we ons tot het reserveren van boeken.

Handig voor de opdrachtgever is dat we de uitwerking van ons voorstel op onze demo-pagina zetten. Daarmee kunnen we snel laten zien hoe zaken werken, en kunnen we alternatieven of coole features tonen.

Big Data mogelijkheden voor het Drents Archief

Eind deze maand hebben we een kick-off meeting met het Drents Archief voor een bijzonder project. Drenthe is een provincie met een rijke cultuurhistorie, vol met unieke verhalen en lokaties. De uitstalling daarvan wordt met de keuze voor Seecr en haar rijke tools als Meresco en Ginger, verbeterd. Door het initiatief te nemen om de mogelijkheden van geavanceerde zoek- en analysesoftware toe te passen op haar bezit, heeft het Archief een strategische stap gemaakt. Met onze dienstverlening kan het Archief relatief verborgen erfgoed beter zichtbaar en toegankelijker gaan maken, omdat we ervoor zorgen dat voorheen niet-vindbare data, boven water komen en op aantrekkelijke wijze gepresenteerd kunnen worden.

Mijn eerste werkweek @SEECR

Altijd spannend, beginnen bij een nieuw bedrijf. Per augustus ben ik deel van het team van SEECR. Ergens starten voelt als opnieuw leren zwemmen. Als de eerste slagen op natuurijs. Is het water warm genoeg? Het ijs sterk?

Ik wind er geen doekjes om: wat ik hier zie, heb ik nog nergens meegemaakt. Op vaste momenten op de dag, in een natuurlijk ritme, wordt met stand-ups op een transparante manier onderling kennis gedeeld. Teamsgewijs werken, elkaar aanvullen en helpen is hier volkomen natuurlijk. Ik verkeer niet nabij koud of diep water, maar in een biotoop die natuurlijke groei mogelijk maakt. Behalve efficiënt en slim, komt het mij gezond en menselijk over. Ik ben reuze benieuwd hoe hier wordt gewerkt aan met code relevant maken van Big Data voor zoekers. Daar word ik vrolijk van!

HBO-Kennisbank met verbeterde links

De HBO-Kennisbank is een portal gebouwd in opdracht van SURF door Seecr. Vanuit verschillende bronnen worden scripties en publicaties verzameld en doorzoekbaar gemaakt.Verschillende partijen willen een deel van de informatie beschikbaar stellen voor derden. Een goede link naar het record is duidelijk, kort en geschikt als permalink. Oude formaat voldeed hier niet aan. Bij een aanpassing moeten links vanuit search-engines blijven werken.

Verandering

Geen bron identifier

De zichtbare veranderingen zijn hierboven goed te zien. Een belangrijk detail valt minder op: de bronidentifier komt in de nieuwe link niet terug. Van belang om te weten is waar de originele informatie vandaan komt, dit was ook altijd te zien aan de identifier die we gebruikten voor de records. Hiermee lekken we een interne abstractie, die niet nodig is omdat bijna alle bronnen van HBO-Kennisbank OAI identifiers gebruiken die uniek zijn. Zonder bron identifier is de link korter.

Oude links blijven werken

HBO-Kennisbank wordt gecrawld door verschillende zoekmachines. Een aanpassing van links zou de vindbaarheid kunnen schaden. De oude links zijn aangepast zodat ze redirecte naar de juiste link. Hiervoor gebruiken we http status 301, die staat voor “Moved Permanently”.  Search engines blijken dit snel op te pakken en de opgeslagen links aan te passen. Veel zoekresultaten in Google gebruiken al de nieuwe links.

NWO-strategie en Seecr

Vandaag wordt de meerjarenstrategie tot 2018 van het NWO aangeboden aan staatssecretaris Sander Dekker.  Ik kreeg een uitnodiging om dit bij te wonen, vanmiddag in het Gemeentemuseum Den Haag.

Wetenschap en het MKB

De afgelopen jaren heb ik verschillende interessante mensen ontmoet bij het NWO. Mensen die op een hele positieve manier op waren naar de koppeling tussen wetenschap en bedrijfsleven.  Het idee dat toepassing van wetenschap vooral door bedrijven plaats vind ligt hier aan ten grondslag.

Deelname van Seecr

Ook was er een prettige voorkeur voor het MKB.  Als klein bedrijf is Seecr daar natuurlijk heel blij mee.  We hebben veel geleerd en gedaan in het NWO Catchplus programma. Dit heeft onder andere geleid tot een hele mooie standaard: http://www.openannotation.org.  Deze passen wij nu toe in de nieuwste aggrgators van de Digitale Collectie.

In 2013 hebben we een meegedaan aan een onderzoeksweek met “ICT with Industry“.  Samen met topwetenschappers hebben we ons een week gelang gebogen over een door Seecr ingebrachte casus. Dit was buitengewoon inspirerend!  Dank ook special voor Rosemarie van der Veen-Oei voor haar enthousiaste koppelen!

Perspectief

In 2014 kreeg ik het verzoek van het STW om als commissielid programmavoorstellen te beoordelen in de Perspectiefronde 2013/2014 High Tech Systemen en Materialen.  Zo kreeg ik een goed beeld van hoe zo’n proces gaat en op welke manier NWO en STW hun strategie uitvoeren. De drive om gemeenschapsgeld op zo concreet mogelijke manier te laten bijdragen aan diezelfde gemeenschap is mooi om te zien!

Vandaar dat ik heel benieuwd ben naar vanmiddag en de komende 3 jaar.

Open Source Erfgoed Software: Meresco

In Schudden voor gebruik – Nationale strategie voor landelijke voorzieningen voor digitaal erfgoed (zie Openbare Review Nationale Strategie Digitaal Erfgoed) wordt gezegd:

“Het ICT-maatwerk heeft in de voorbije jaren veel kunnen betekenen voor instellingen en hun klanten, maar leidt nu ook tot beperkingen bij de ontwikkeling van een goed functionerend informatienetwerk. Er moet daarom nu meer aandacht uitgaan naar gestandaardiseerde en toegankelijke basisvoorzieningen, om daar bovenop eenvoudiger en voordeliger maatwerktoepassingen te kunnen maken.

80/20
Ja! In de Erfgoedsector kan 80% van de software gedeeld worden. Je doet zoveel mogelijk samen, zonder dat je wordt beperkt in je vrijheid om je eigen ding te realiseren. 20% maatwerk daar bovenop is het interessante deel waarmee je je onderscheidt en waar besteding van het budget te rechtvaardigen is, omdat het meerwaarde oplevert.

Nu al beschikbaar
Wat dat betreft is er goed nieuws. In de afgelopen jaren heeft Seecr al veel gemeenschappelijke software ontwikkeld voor het publiceren en toegankelijk maken van grote hoeveelheden data. Deze software is:

  • beschikbaar onder Open Source licentie;
  • onder copyright van erfgoedinstellingen;
  • gesmeed tot een geheel van herbruikbare componenten;
  • als source gepubliceerd op GitHub;
  • als binaire packages installeerbaar op Debian of RedHat;
  • bewezen technologie: productierijp en grootschalig inzetbaar.

Bewezen technologie
Vandaag de dag draaien grote landelijke netwerken op deze software. In het domein van onderwijs, erfgoed, openbare en wetenschappelijke bibliotheken. Deze bevatten zeer veel gecombineerde data en hebben dagelijks een groot publiek van institutionele gebruikers en eindgebruikers.

bron Elsbeth Kwantbron: Elsbeth Kwant
In bovenstaande afbeelding van Elsbeth Kwant geeft de oranje kleur in stam en wortels aan waar deze software aanwezig is. Deze data wordt al dagelijks gebruikt en onder elkaar uitgewisseld.

Verbetering componenten
Herbruikbare componenten bedenk je niet, die groeien. Ze ontstaan als gevolg van hergebruik: de eerste maakt iets, de volgende past het aan en bij de derde kun je gaan spreken van een herbruikbaar component. Als dat enkele jaren doorgaat, ontstaat er een enorme hoeveelheid aan meer generieke en steeds betere componenten. Dit is precies wat met deze software de afgelopen jaren is gebeurd en wat dagelijks plaatsvindt.

Copyright en licenties
Een open source licentie is mooi, maar daarmee heb je nog geen controle over wat er met die software gebeurt, want die ligt bij de copyright eigenaar. Het copyright van deze software ligt bij grote spelers uit de erfgoed sector waaronder Stichting Beeld en Geluid, de Koninklijke Bibliotheek, de Koninklijke Nederlandse Academie van Wetenschappen (KNAW) en Stichting Kennisnet.

Publicatie en packaging
De publicatie en packaging is de afgelopen jaren om niet gedaan door Seecr. De binaire packages kunnen in enkele minuten geïnstalleerd worden. In een handomdraai heb je dan een eigen netwerk waar je een eigen toepassing op kunt bouwen zonder je zorgen te hoeven maken over de gemeenschappelijke delen. Een goed voorbeeld hiervan is Narcis die door DANS wordt onderhouden.

Heeft deze software al een naam? Ja! In 2007 hebben wij met vier partijen die hiermee begonnen zijn de naam Meresco bedacht. Onder die naam is het sindsdien gepubliceerd en onderhouden tot op de dag van vandaag: zie github.com/seecr?query=meresco

Wat is er met deze software allemaal mogelijk? In een volgende blog zal ik hier dieper op in gaan.