Helderziend, of gewoon ‘smart’?

Sommigen van ons bezitten in de virtuele wereld diverse magische krachten, maar in de ‘echte’ wereld werken we gewoon ‘op de slimme manier’. Onze hokus-pokus bestaat uit de inzet van onze service ‘Continubeheer’ op de systemen van onze opdrachtgevers. Daarmee voeren we op allerlei plekken metingen uit, wat een reeks aan indicatoren en grafieken oplevert. Zodoende kunnen we tijdig, als we daar aanleiding voor zien, de performance beïnvloeden van de systemen die we voor onze opdrachtgevers in beheer hebben. We wachten bij wijze van spreken niet tot er rookpluimen uit de auto komen, maar grijpen veel eerder in, als we niet tevreden zijn over een tussentijds gemeten uitkomst.

Transparant

Is dat alles? Nee. Ons Continubeheer levert in de praktijk meer op. Deze manier van werken leidt tot transparantie van de performance van onze systemen voor onze klanten. Continubeheer is een uitnodiging voor een continu verbeterproces. En het is een reden voor een feestje, dan wel reden voor een ongestoorde nachtrust voor onze opdrachtgevers: het laat zien, dat we kwaliteit leveren, ruim binnen de marges van de afgesproken SLA’s.

Schermafbeelding 2016-01-25 om 10.39.40

Ja, het gaat goed. Zie onze blog van vorige maand over optimalisatie.

Autocomplete Zoekplatform passend maken met lokale bibliotheekcollectie

Bij het intikken van een zoekopdracht zijn gebruikers erg geholpen wanneer automatisch mogelijk relevante zoektermen worden gesuggereerd. Het NBC+ zoekplatform biedt deze zogenaamde ‘autocomplete’ functie aan, zodat bibliotheken deze kunnen opnemen in hun website. De NBC+ autocomplete functie biedt bij de de gesuggereerde zoektermen bovendien het type (bijv. een boek of track) van het zoekresultaat dat ermee overeenkomt (zie afbeelding).

Screen Shot 2016-01-14 at 09.10.37

De suggesties waren tot nu toe gebaseerd op alle titels die bekend zijn in de landelijke catalogus. Voor specifieke toepassingen is dat echter onwenselijk, zoals op de website die gericht is op het uitlenen van e-books. Voor een gebruiker zou het hier verwarrend zijn om suggesties te krijgen van titels die niet als e-book beschikbaar zijn. Op dezelfde manier geldt dat een bibliotheek natuurlijk geen suggesties wil geven van materiaal uit een specifieke lokale collectie van een andere bibliotheek.

Op dit moment ontwikkelen we de code die het mogelijk maakt de suggesties te beperken tot precies het deel van de nationale collectie dat een lokale bibliotheek daadwerkelijk aanbiedt op haar website. Zo vinden gebruikers nog makkelijker wat ze zoeken.

 

WaaS 2.0 aansluiting op NBC+

Stichting Bibliotheek berichtte recent dat in de komende maanden de landelijke diensten volledig worden geïntegreerd in WaaS 2.0. Het gaat hierbij onder andere om de content en functionaliteiten op www.bibliotheek.nl: de pagina’s over e-books, jeugd, literatuur en WelkBoek. Ook wordt landelijk zoeken op basis van de NBC+ opgeleverd.

Hiermee wordt de door Seecr ontwikkelde zoekmachine de motor achter deze functies.

Voordelen aansluiting NBC+
De aansluiting van WaaS 2.0 op het Zoekplatform biedt tal van nieuwe mogelijkheden en functies. Naast bronnen zoals kranten, e-books en de consumentengids, worden ook alle lokale bronnen van bibliotheken opgenomen in het landelijk Zoekplatform en zullen er in de toekomst nog meer volgen, zoals bijvoorbeeld de Digitale Collectie.

Tegelijk komen ook centrale functies voor iedereen beschikbaar. Wat lokaal vaak niet mogelijk is, kan centraal wel worden geregeld. Denk bijvoorbeeld aan deduplicatie en het uniformeren van metadata. Het mooie is dat het dan over al deze bronnen heen gebeurt, in plaats van binnen één collectie.

Uniformeren van auteurs
Een voorbeeld van een nieuwe functie is het uniformeren van auteurs en onderwerpen. Verschillende bronnen hebben vaak een eigen manier om te refereren aan auteurs. Op basis van de verzamelde gegevens, gaan wij de identifiers over dezelfde auteurs op elkaar afbeelden. We werken hierbij onder meer met Wikipedia, GTAA, NTA en Viaf. Al deze data is/wordt als Linked Open Data gepubliceerd.

Een analoog verhaal geldt voor onderwerpen of trefwoorden. Iedereen heeft zo zijn eigen classificatiesysteem, vaak meerdere binnen dezelfde collectie. Het verzamelen van de gegevens en het bij elkaar zoeken van de overeenkomsten is in volle gang. De planning is om in 2015 grote stappen te kunnen zetten.

Vooruitblik
Wij zijn enthousiast over de aansluiting van WaaS 2.0 op het NBC+. Een goed startpunt van een mooie doorontwikkeling van het Zoekplatform die het voor elke bibliotheek mogelijk maakt om het hele Nederlandse Erfgoed te relateren aan haar eigen collectie.

Deelname Hack-a-LOD

Afgelopen zaterdag vond in het Brabantse Veghel de Hack-a-LOD plaats. Een hackaton waar het allemaal draaide om het maken van toepassingen met Linked Open Data van onder andere de openbare bibliotheken. Deze Hack-a-LOD is onderdeel van het project Brabantse Collecties en Content. Voor meer informatie http://www.hackalod.com/.

De Nederlanse Bibliotheek Catalogus NBC+
De Nederlandse Bibliotheek Catalogus (NBC+) was hiervoor beschikbaar via de API en als ruwe data in RDF-vorm (en via sparql).  Beide technisch beschikbaar gemaakt door Seecr.  Tevens waren er verrijkingen toegevoegd door Roland Cornelissen van Metamatter.

Impressie op YouTube
Voor een korte impressie van de Hack-a-LOD, zie dit filmpje.

De catalogus en beschikbaarheid
Erik was als ‘kijker’ aanwezig en zag hoe veelal jonge mensen met de data aan de slag gingen.  De catalogus is daadwerkelijk door een team gebruikt om relevante informatie te vinden terwijl je onderweg bent.  Ze waren enigszins teleurgesteld.  Op de vraag waarom was het antwoord: “het is maar een catalogus”.  Ze bedoelden hiermee: “we vonden wel wat, maar we konden niet doorlinken, er staat alleen dat het er is”.

Het was te laat om ze te wijzen op het  NBC+ /available end-point helaas; dat had misschien in een deel van hun wensen voorzien. Het toont maar weer eens aan hoe belangrijk het is om daadwerkelijk links te geven, ook naar de inhoud zelf!

Relevante zoekresultaten door middel van ranking

Het is bijna traditie in de bibliotheekwereld dat er (eindeloos) wordt getweakt aan allerlei ranking-parameters. Dit is echter een doodlopende weg, daarom heeft de NBC+ een topic rank en een static rank geïntroduceerd.

Topic rank
Topic ranking heeft alles te maken met de functionele/technische integratie van verschillende types objecten in één search engine. De NBC+ beschikt over verschillende soorten objecten zoals boeken, muziek, krantenartikelen, evenementen e.d. De uitdaging is om het ene object niet dominanter te laten zijn dan het andere. Miljoenen krantenartikelen kunnen eenvoudig honderden events overschaduwen.

Dit is opgelost door te denken over objecten alsof ze een relevantie hebben ten opzichte van een onderwerp (de topic rank). Daarmee wordt afgestapt van de traditionele gedachte dat hoe vaker de zoekterm in een object voorkomt, hoe hoger de score (term frequentie) is. Dit geeft een goede basis voor de volgende stap, de static rank.

Met een topic rank ontstaat een ranking met een technische waarheid. De algoritmes vinden een bepaalde relevantie en hebben daarin op een bepaalde manier altijd gelijk. Zo vinden deze algoritmes bij de zoekopdracht “tirza” verschillende groepen resultaten die allemaal even relevant zijn (boek “Tirza” van Grunberg, serie jeugdboeken met Tirza in de hoofdrol, etc). Maar collectiebeheerders willen soms bepaalde resultaten meer onder de aandacht brengen.

Static rank
De oplossing hiervoor is een static rank. Dit is een aparte index met hierin een rank voor elk object. Deze rank wordt statisch bepaald aan de hand van verschillende eigenschappen van het object of simpelweg volgens de wens van de beheerder. Bij het zoeken kan deze ranking worden meegenomen om de resultaten, na de toepassingen van de topic rank, te herwegen.

Statisch maar wel dynamisch
De beheerder kan heel specifiek aan de hand van allerlei mogelijke wensen de ranking doorvoeren. Boeken scoren bijvoorbeeld iets hoger, net als recente objecten en alle Nederlandstalige dingen. Het is ook mogelijk om de hoeveelheid door bibliotheken aangeschafte exemplaren te laten meewegen of eenvoudigweg de bron. Ook de leeftijd (van de doelgroep) kan als rank worden meegenomen.

In de NBC+ is deze static rank voor aangesloten partijen afzonderlijk te configureren. Elke bibliotheek kan er zelf invulling aan geven. In die zin is ook de static rank dynamisch, het kan zonder meer worden aangepast en de resultaten zijn direct zichtbaar.

Deze twee-traps ranking draait nu proef en zal in oktober in productie gaan.

Geen verrassingen meer…

Vandaag vindt er een nieuwe release van het NBC+ Zoekplatform plaats. In deze release zit onder andere de nieuwe feature: verkrijgbaarheid. Deze feature is nog in testfase, maar we willen hier alvast graag meer over vertellen.

Verwijzing naar bron zoekresultaat
Een zinvolle search engine zal gebruikers altijd moeten leiden naar de bron van het zoekresultaat. Bij internet search engines is dat eenvoudigweg naar een webpagina. Bij de NBC+ kunnen dat ook verwijzingen zijn naar bijvoorbeeld onderstaande services:

  • reserveren (eigen bibliotheek)
  • aanvragen (landelijk)
  • downloaden e-book
  • inzien (betaald/online)
  • inzien op locatie
  • inzien online + abonnement
  • streaming (preview)

Als je bijvoorbeeld op zoek bent naar een boek zijn er vaak meerdere mogelijkheden om het boek te kunnen verkrijgen. Wij hebben een methode ontwikkeld die de verwijzingen naar alle services mogelijk maakt. Per zoekresultaat wordt op gestructureerde wijze aangegeven wat de opties zijn. Dit hebben we bereikt met (een uitbreiding op) de “Document Availability Information API” (DAIA), zoals ontwikkeld in het Gemeinsamen Bibliotheksverbund.

Geen verrassingen meer voor de gebruiker
Met deze feature is het in de zoekresultaten nu direct zichtbaar waar je naar toe wordt doorverwezen met daarbij de informatie wat die verwijzing inhoudt. Geen verrassingen meer voor de gebruiker wat er bij volgende stap kan worden verwacht. In één oogopslag zijn alle mogelijkheden tot verkrijgbaarheid zichtbaar per zoekresultaat.

 

 

Beheer NBC+ Zoekplatform

Sinds vandaag voert Seecr’s Continubeheer het volledige beheer, van applicatie tot hardware, van het Zoekplatform van de Nationale Bibliotheekcatalogus (NBC+) van Bibliotheek.nl.

Het NBC+ Zoekplatform bestaat uit een negental services, waarvan vier meervoudig uitgevoerd ten behoeve van fail-over en voldoende capaciteit.  De diensten worden geleverd aan alle openbare bibliotheken in Nederland en houden in:

  1. Vergaren van data, het combineren, opschonen, verrijken en dagelijks actueel houden hiervan.
  2. Toegang tot de catalogus en andere bronnen (18.000.000 titels) via verschillende supersnelle zoekfuncties.
  3. Zoeken in het bezit van eigen en andere bibliotheken en vestigingen (39.000.000 exemplaren).
  4. Het opbouwen en onderhouden van een kennisbank waarin relaties tussen titels worden vastgelegd.

Procesverbetering

Agile werken wordt meer en meer de norm. Beheerprocessen moeten daarbij aansluiten. Wat heb je aan supersnelle realisatie van nieuwe features als het maanden duurt om die live te zetten?  Continubeheer is Agile, maar dan voor beheer. Snel schakelen, zonder gedoe. Dat kan door een zeer geoliede beheerorganisatie die zich uitstrekt tot de toeleveranciers. Alleen een op vertrouwen gebaseerde hechte samenwerking leidt tot snelle actie zonder fouten. En dat bespaart ook nog eens kosten bij alle betrokken partijen.

Samen met andere grootschalige landelijke diensten die bij Continubeheer van Seecr zijn ondergebracht, zoals de Nationale Aggregator van de Digitale Collectie en de Educatieve Contentketen van Kennisnet (Edurep) is gebleken dat we in staat zijn om dagelijks grote hoeveelheden data op een efficiënte manier te verwerken en aan te bieden. Daar zijn we trots op!