Helderziend, of gewoon ‘smart’?

Sommigen van ons bezitten in de virtuele wereld diverse magische krachten, maar in de ‘echte’ wereld werken we gewoon ‘op de slimme manier’. Onze hokus-pokus bestaat uit de inzet van onze service ‘Continubeheer’ op de systemen van onze opdrachtgevers. Daarmee voeren we op allerlei plekken metingen uit, wat een reeks aan indicatoren en grafieken oplevert. Zodoende kunnen we tijdig, als we daar aanleiding voor zien, de performance beïnvloeden van de systemen die we voor onze opdrachtgevers in beheer hebben. We wachten bij wijze van spreken niet tot er rookpluimen uit de auto komen, maar grijpen veel eerder in, als we niet tevreden zijn over een tussentijds gemeten uitkomst.

Transparant

Is dat alles? Nee. Ons Continubeheer levert in de praktijk meer op. Deze manier van werken leidt tot transparantie van de performance van onze systemen voor onze klanten. Continubeheer is een uitnodiging voor een continu verbeterproces. En het is een reden voor een feestje, dan wel reden voor een ongestoorde nachtrust voor onze opdrachtgevers: het laat zien, dat we kwaliteit leveren, ruim binnen de marges van de afgesproken SLA’s.

Schermafbeelding 2016-01-25 om 10.39.40

Ja, het gaat goed. Zie onze blog van vorige maand over optimalisatie.

Autocomplete Zoekplatform passend maken met lokale bibliotheekcollectie

Bij het intikken van een zoekopdracht zijn gebruikers erg geholpen wanneer automatisch mogelijk relevante zoektermen worden gesuggereerd. Het NBC+ zoekplatform biedt deze zogenaamde ‘autocomplete’ functie aan, zodat bibliotheken deze kunnen opnemen in hun website. De NBC+ autocomplete functie biedt bij de de gesuggereerde zoektermen bovendien het type (bijv. een boek of track) van het zoekresultaat dat ermee overeenkomt (zie afbeelding).

Screen Shot 2016-01-14 at 09.10.37

De suggesties waren tot nu toe gebaseerd op alle titels die bekend zijn in de landelijke catalogus. Voor specifieke toepassingen is dat echter onwenselijk, zoals op de website die gericht is op het uitlenen van e-books. Voor een gebruiker zou het hier verwarrend zijn om suggesties te krijgen van titels die niet als e-book beschikbaar zijn. Op dezelfde manier geldt dat een bibliotheek natuurlijk geen suggesties wil geven van materiaal uit een specifieke lokale collectie van een andere bibliotheek.

Op dit moment ontwikkelen we de code die het mogelijk maakt de suggesties te beperken tot precies het deel van de nationale collectie dat een lokale bibliotheek daadwerkelijk aanbiedt op haar website. Zo vinden gebruikers nog makkelijker wat ze zoeken.

 

WaaS 2.0 aansluiting op NBC+

Stichting Bibliotheek berichtte recent dat in de komende maanden de landelijke diensten volledig worden geïntegreerd in WaaS 2.0. Het gaat hierbij onder andere om de content en functionaliteiten op www.bibliotheek.nl: de pagina’s over e-books, jeugd, literatuur en WelkBoek. Ook wordt landelijk zoeken op basis van de NBC+ opgeleverd.

Hiermee wordt de door Seecr ontwikkelde zoekmachine de motor achter deze functies.

Voordelen aansluiting NBC+
De aansluiting van WaaS 2.0 op het Zoekplatform biedt tal van nieuwe mogelijkheden en functies. Naast bronnen zoals kranten, e-books en de consumentengids, worden ook alle lokale bronnen van bibliotheken opgenomen in het landelijk Zoekplatform en zullen er in de toekomst nog meer volgen, zoals bijvoorbeeld de Digitale Collectie.

Tegelijk komen ook centrale functies voor iedereen beschikbaar. Wat lokaal vaak niet mogelijk is, kan centraal wel worden geregeld. Denk bijvoorbeeld aan deduplicatie en het uniformeren van metadata. Het mooie is dat het dan over al deze bronnen heen gebeurt, in plaats van binnen één collectie.

Uniformeren van auteurs
Een voorbeeld van een nieuwe functie is het uniformeren van auteurs en onderwerpen. Verschillende bronnen hebben vaak een eigen manier om te refereren aan auteurs. Op basis van de verzamelde gegevens, gaan wij de identifiers over dezelfde auteurs op elkaar afbeelden. We werken hierbij onder meer met Wikipedia, GTAA, NTA en Viaf. Al deze data is/wordt als Linked Open Data gepubliceerd.

Een analoog verhaal geldt voor onderwerpen of trefwoorden. Iedereen heeft zo zijn eigen classificatiesysteem, vaak meerdere binnen dezelfde collectie. Het verzamelen van de gegevens en het bij elkaar zoeken van de overeenkomsten is in volle gang. De planning is om in 2015 grote stappen te kunnen zetten.

Vooruitblik
Wij zijn enthousiast over de aansluiting van WaaS 2.0 op het NBC+. Een goed startpunt van een mooie doorontwikkeling van het Zoekplatform die het voor elke bibliotheek mogelijk maakt om het hele Nederlandse Erfgoed te relateren aan haar eigen collectie.

Geen verrassingen meer…

Vandaag vindt er een nieuwe release van het NBC+ Zoekplatform plaats. In deze release zit onder andere de nieuwe feature: verkrijgbaarheid. Deze feature is nog in testfase, maar we willen hier alvast graag meer over vertellen.

Verwijzing naar bron zoekresultaat
Een zinvolle search engine zal gebruikers altijd moeten leiden naar de bron van het zoekresultaat. Bij internet search engines is dat eenvoudigweg naar een webpagina. Bij de NBC+ kunnen dat ook verwijzingen zijn naar bijvoorbeeld onderstaande services:

  • reserveren (eigen bibliotheek)
  • aanvragen (landelijk)
  • downloaden e-book
  • inzien (betaald/online)
  • inzien op locatie
  • inzien online + abonnement
  • streaming (preview)

Als je bijvoorbeeld op zoek bent naar een boek zijn er vaak meerdere mogelijkheden om het boek te kunnen verkrijgen. Wij hebben een methode ontwikkeld die de verwijzingen naar alle services mogelijk maakt. Per zoekresultaat wordt op gestructureerde wijze aangegeven wat de opties zijn. Dit hebben we bereikt met (een uitbreiding op) de “Document Availability Information API” (DAIA), zoals ontwikkeld in het Gemeinsamen Bibliotheksverbund.

Geen verrassingen meer voor de gebruiker
Met deze feature is het in de zoekresultaten nu direct zichtbaar waar je naar toe wordt doorverwezen met daarbij de informatie wat die verwijzing inhoudt. Geen verrassingen meer voor de gebruiker wat er bij volgende stap kan worden verwacht. In één oogopslag zijn alle mogelijkheden tot verkrijgbaarheid zichtbaar per zoekresultaat.

 

 

Beheer NBC+ Zoekplatform

Sinds vandaag voert Seecr’s Continubeheer het volledige beheer, van applicatie tot hardware, van het Zoekplatform van de Nationale Bibliotheekcatalogus (NBC+) van Bibliotheek.nl.

Het NBC+ Zoekplatform bestaat uit een negental services, waarvan vier meervoudig uitgevoerd ten behoeve van fail-over en voldoende capaciteit.  De diensten worden geleverd aan alle openbare bibliotheken in Nederland en houden in:

  1. Vergaren van data, het combineren, opschonen, verrijken en dagelijks actueel houden hiervan.
  2. Toegang tot de catalogus en andere bronnen (18.000.000 titels) via verschillende supersnelle zoekfuncties.
  3. Zoeken in het bezit van eigen en andere bibliotheken en vestigingen (39.000.000 exemplaren).
  4. Het opbouwen en onderhouden van een kennisbank waarin relaties tussen titels worden vastgelegd.

Procesverbetering

Agile werken wordt meer en meer de norm. Beheerprocessen moeten daarbij aansluiten. Wat heb je aan supersnelle realisatie van nieuwe features als het maanden duurt om die live te zetten?  Continubeheer is Agile, maar dan voor beheer. Snel schakelen, zonder gedoe. Dat kan door een zeer geoliede beheerorganisatie die zich uitstrekt tot de toeleveranciers. Alleen een op vertrouwen gebaseerde hechte samenwerking leidt tot snelle actie zonder fouten. En dat bespaart ook nog eens kosten bij alle betrokken partijen.

Samen met andere grootschalige landelijke diensten die bij Continubeheer van Seecr zijn ondergebracht, zoals de Nationale Aggregator van de Digitale Collectie en de Educatieve Contentketen van Kennisnet (Edurep) is gebleken dat we in staat zijn om dagelijks grote hoeveelheden data op een efficiënte manier te verwerken en aan te bieden. Daar zijn we trots op!

Het NBC+ Zoekplatform vanuit technisch perspectief

Wat is de Nationale Bibliotheek Catalogus (NBC) eigenlijk precies? In dit artikel wordt vanuit een technisch perspectief belicht wat er inmiddels is ontwikkeld voor de Nationale Bibliotheek Catalogus (NBC).

Nationale catalogus

De meerderheid van de Nederlandse openbare bibliotheken maakt gebruik van een centrale catalogus met publicaties en registreren alleen de lokale voorraad. Deze registraties hebben betrekking op de centrale catalogus. De beperkte informatie die uniek is voor de desbetreffende bibliotheek wordt toegevoegd.

Veel bibliotheken beschikken ook over extra uitgaven die niet zijn opgenomen in de nationale catalogus. Bijvoorbeeld muziek, albums, kranten, consumenten testrapporten etc. Het zoekplatform brengt hier verandering in.

Het zoekplatform

Het zoekplatform maakt de publicaties uit al deze bronnen beschikbaar via een Application Programming Interface (API). Hiermee is het mogelijk om de enorme hoeveelheid bibliotheek gerelateerde gegevens te gebruiken op elke denkbare manier en om applicaties voor de eindgebruiker te creëren.

Het zoekplatform maakt onderstaande toegankelijk:

  • Beknopte en uniforme metadatabeschrijving van alle publicaties.
  • Gedetailleerde informatie over organisaties (bibliotheken, uitgeverijen, musea, etc).
  • Eenduidige typologie van alle producten binnen het Platform: muziek, boeken, e-books, mensen, video, software, games, artikelen, etc.
  • Details van toonaangevende auteur thesauri, classificaties, etc.
  • Zowel de uniforme data en bron(meta)data.

De API beschikt over onderstaande functionaliteiten:

  • Geïntegreerd zoeken met autocomplete en zoeksuggesties.
  • Statische en dynamische ranking.
  • Object herleiden.
  • Gestructureerde queries.
  • Harvesten van data.
  • Pictogrammen en thumbnails.
  • Get-IT-diensten voor: lenen, downloaden, reserveren, enzovoort.

Semantische data

Het zoekplatform werkt met semantische data. In plaats van diep in te gaan op alle technische details van RDF en LOD, hebben we een opsomming gemaakt dat eenvoudig weergeeft wat er daadwerkelijk is bereikt voor API-gebruikers:

  • Uniforme datarepresentatie ongeacht hoe het wordt geopend.
  • Duidelijke en ondubbelzinnige relaties tussen objecten.
  • Open en gedetailleerde gegevens die rechtstreeks zijn gekoppeld aan de bron zonder verlies van informatie.
  • Multi-gestructureerd: kies je favorieten uit vele ontologieën.
  • Eenvoudige integratie met andere tools en technieken.

Innovatie

Het zoekplatform heeft twee belangrijke vernieuwingen:

  1. “Late Integration”. Bij deze methode worden er meerdere indexen separaat bijgehouden en worden de zoekresultaten bij het uitleveren geïntegreerd. Het onderhoud van de indexen kan sneller en specifieker, terwijl de integratie plaatsvindt in milliseconden. Dit vereist een technische innovatie. In het artikel “Reducing Index Maintenance Costs” kunt u hier meer over lezen.
  2. Het overbrugt de kloof tussen statistische “information retrieval” en “linked data” door deze technologieën op een slimme manier te koppelen in de API.

Status

Het zoekplatform is inmiddels in gebruik genomen door de Openbare Bibliotheek van Amsterdam. De nationale catalogus wordt gecombineerd met onder andere de muziekcollectie van Muziekweb.nl en met lokale evenementen van Uitburo.nl. Door de toepassing van ‘Late Integration’ is de index eenvoudig te beheren.

Andere kenmerken (al gereed of nog in ontwikkeling) zijn:

  • Statische en dynamische ranking; voor iedere zoekopdracht wordt een aparte ranking query uitgevoerd waarmee de zoekresultaten worden herwogen op basis van statische ranking gegevens, zoals leeftijd, holdings, bronnen en types. De statische ranking gegevens worden bijgehouden in een aparte index.
  • Door het uploaden van ontologieën is het mogelijk op op een andere manier door de data te navigeren.
  • Uitgebreide beschikbaarheidsdiensten bieden gedetailleerde informatie over hoe, waar en onder welke voorwaarden een object te verkrijgen is.

Vooral het laatste punt is een interessante toegevoegde waarde van het zoekplatform. In de bibliotheek- en het cultureel erfgoedsector is het aanbieden van een link te beperkt. De gebruiker wil vaak meer gegevens zoals beschikbaarheid en dergelijke.

Het platform maakt gebruik van een zowel algemene en gespecialiseerde uitvoering van de DAIA (Document Availability Information API). In een volgend artikel zullen we verder ingaan op de architectuur en de toepassing van DAIA.