Federatief zoeken

Tijdens de NVB-HB dag gisteren over federatief zoeken zijn mij een aantal dingen opgevallen die in ter plekke niet gelijk wilde roepen of vragen, maar de mi toch wel belangrijk zijn om te vermelden. Ik heb gemerkt dat de kennis bij een deel van de bibliothecarissen/informatiespecialisten over dit soort toepassingen nog heel pril is en dat alle aanvullende informatie van harte welkom is. Vandaar deze posting.

Er bestaan allerlei aanvullende tools die een bibliotheek nodig kan hebben op het moment dat het aantal e-journals en/of het aantal databases toe neemt en je eea niet meer handmatig in bv je catalogus kunt of wilt verwerken. Denk dan aan een link resolver en aan een federatieve zoekmachine. De aanschaf van beide oplossingen loopt vaak gelijk op. Een eindgebruiker haakt nl af als je iets gevonden hebt en het is niet mogelijk om door te kunnen klikken naar de fulltext. Idealiter schaft een bibliotheek dan ook gelijktijdig beide oplossingen aan. Als je toch moet kiezen, zou ik afhankelijk van de aard van de bronnen, in eerste instantie een link resolver kiezen.

Bij toename van het aantal bronnen (denk dan aan vele duizenden e-journals ‘verborgen’ in de databases) krijg je in toenemende mate behoefte aan het inzicht in die bronnen. Dan komt een ERM (electronic resource management) oplossing om de hoek kijken. Vergelijk dit voor het gemak maar even heel simpel gesteld als een soort tijdschriftenmodule voor je electronische bronnen.

Tot slot heb je nog te maken met het hele toegangsbeheer, problemen met thuistoegang, wachtwoorden etc.

Wat mij gisteren opviel was het volgende:

Tijdens de presentatie van Infor kon Filip, PiCarta niet als bron selecteren omdat hij van buiten kwam. V-link presenteerde echter wel een link naar PiCarta. Dat is vreemd want een link resolver hoort ook ‘real time on the fly’ (zoals de uitvinder van OpenURL linken, Herbert van de Sompel altijd zegt) te checken of je überhaupt toegang hebt. Dat gebeurde blijkbaar niet? (reactie Infor???)

Hans-Peter vertelde dat het bundelen van te doorzoeken bronnen op onderwerp bedoeld is als extra service voor de gebruikers. Tijdens CIL2008 werd door verschillende experts echter verteld dat de belangrijkste reden waarom bijna alle producten deze functionaliteit bieden, de hoeveelheid maximaal gelijktijdig te doorzoeken bronnen is. Als je heel veel (ik weet niet waar de grens van ieder product ligt) bronnen tegelijkertijd zoekt, kan je zoekmachine vast lopen of onacceptabele responstijden geven.

Wat mij ook verbaasde was het uitblijven van vragen over de toekomst van WebFeat. Vorige week vertelde de Director International Sales van Serials Solutions (waar WebFeat nu onder valt) nog ten overstaan van een grote groep Nederlandse informatiespecialisten, dat alle connectoren van WebFeat nu met een snelheid van meer dan 50 per week worden omgezet naar 360 SEARCH…

Reacties zijn van harte welkom…

NVB-HB dag over Federated Searching 22 mei 2008

Vandaag is de NVB-HB dag over Federatieve zoekmachines bij Avans in Breda. Goede opkomst van circa 60 mensen en dat terwijl de bussen niet rijden. Dat was dus lopen van het station naar de Hogeschoollaan…
Je kon goed zien dat Dorine Korsten van de HU een cursus event-management volgt, mede dankzij haar een perfect georganiseerde dag. Extra studiepunten graag… ;-)

Programma:
10.00-10.45 Ledenvergadering NVB HB

11.00 Inleiding over federated search door Frank Hofstede. Na wat opstartproblemen (beeldweergave op scherm en laptop, microfoon) een korte introductie over hemzelf en over zijn bedrijf het Search Expertise Centrum.Waarom fed.search:
- google als voorbeeld
- veel bronnen veel werk;
- onbekendheid bestaan bronnen;
- diverse query talen en navigatiestructuren
- ….
Zijn verhaal was een introductie in fed.search voor allerlei informatieproblemen en bedrijfsmatige toepassingen en minder over toepassingen voor de ‘normale’ bibliotheekbronnen, databases en dergelijke.

Wat voor oplossing je ook zoekt, architectuur is altijd pluriform. Alle aanbieders vechten om je de mooiste user interface te kopen. Daar staat Frank niet achter. Een webservers interface is in zijn opinie belangrijker dan de userinterface.

Soorten koppelingen:

- HTML. door opmaak aan verandering onderhevig
- XML. al stuk beter maar steeds wiel uitvinden
- Webservice/SRW. mooie standaard maar niet futureproof
- Broker2Broker. werkt momenteel met 1 merk zoekmachine

Uitbesteden:

- als je een vaste set bronnen hebt
- heel veel of sterk vanderende bronnen
- …

Koop je een tool of een dienst bij je leverancier??
Denk om de rechten en verplichtingen! (toegangsrechten)

Gartner verwacht dat in 2012 een fed. zoekmachine de identiteit van de gebruiker mee stuurt met de Query zodat iedere gebruiker een ander, persoonlijk resultaat krijgt!!
In de toekomst ook doorzoeken van multimedia, foto’s video’s etc.

Demotip waarbij zoekacties die 0 resultaten laten zien, niet meer bestaan, de Flamenco Search Engine. Daarmee zou je taal- en/of spellingsvarianten misschien kunnen ondervangen. Later maar eens uitproberen…

Presentatie staat niet online, omdat er veel materiaal in zit wat voor klanten is gemaakt. Wellicht dat er een gecensureerde versie beschikbaar komt.

12.00 Presentatie V-Spaces door Filip Trenson van Infor. Filip is de Belgische vertegenwoordiger van Infor voor de Benelux. Er is nu een nieuw webbased bibliotheeksysteem in de maak, V-Smart. Infor biedt verder een hele suite van producten aan, Vubis Smart, V-Link, V-Sources.
V-Spaces bestaat sinds november 2006, 10 systemen verkocht. (waaronder 4, bibliotheek + website, bij de ontwikkelende bibliotheken TU/E en VUB).

Look en feel is duidelijk aan de hand van veel schermafbeeldingen. Doordat in de presentatie veel bronnen zaten die extern niet toegankelijk waren, kwam eea niet helemaal goed uit de verf. Jammer genoeg waren er in de demo geen openbaar toegankelijke bronnen opgenomen.

Binnenkort komt een nieuwe versie van V-Spaces uit.

12.30 Presentatie Aquabrowser door Helga van Gelder van Medialab. Aquabrowser is geen federative search engine maar een zoekmachine voor bibliotheken. Vorig jaar heeft Bowker (ProQuest CSA) Medialab gekocht.
Korte demo Aquabrowser van de Haagse Hogeschool
Aquabrowser integreert de federatieve zoekmachine die de bibliotheek evt al heeft. Aquabrowser praat oa met V-spaces, webfeat en 360 Search (beiden van Serials Solutions).
Grootste verschil is dat de eigen catalogus ‘groot’ wordt getoond, als belangrijkste bron. In echte federatieve zoekmachines is de catalogus slechts één van de bronnen.
Aquabrowser heeft imago voor openbare bibliotheken te zijn, terwijl er toch ook zo’n 40 installaties wereldwijd zijn bij hogeschool en universiteitsbibliotheken. Voorbeeld BOSS van Oklahoma State University. Ander voorbeeld van Aquabrowser in combinatie met onderliggend VubisSmart bij Croydon College. Gebruik van de catalogus en het aantal uitleningen nam daar zeer fors toe. Goed om te zien dat er ook heel van managementinformatie te vinden is aan de achterkant van het systeem. Nieuw bij AB is MyDiscoveries, de web 2.0 achtige toevoeging. Verder ook de integratie van FRBR en Synditics ICE, waar ik al eerder over schreef nav de ProQuest informatiedag van 15 mei jl.

Omdat Hans-Peter van EBSCO nog in de file stond werd het programma iets omgegooid.

14.00  Eerst de bijdrage van Gerard Bierens van de Fontys Mediatheek over Felix (Federated Library Explorer), de naam die zij hebben gegeven aan hun WebFeat applicatie, de opvolger van iPort.

Felix is geen vervanging van je catalogus en admin modules; geen vervanging van de interfaces van de individuele databases en het is niet het bibliotheek antwoord op Google.
Wat is het wel: een centrale uniforme toegang tot de digitale collectie. (= springplank naar meer inhoud).

Doel is het streven naar een geïntegreerde oplossing voor:
- federatief zoeken;
- koppelen annotaties aan FT;
- toegankelijk maken e-journals collectie;
- statistieken gebruik databanken.

Daarna volgde een hele toelichting op het project en alles wat bij het selecteren en implementeren van een federatieve zoekmachine komt kijken. Totale projectbudget was 80.000 euro.

Fontys heeft nu:
- WebFeat,
- LinkSource,
- A-Z,
- SMART
PLUS meervoudige toegang en volledige integratie in de mediatheek-site.

Tot zover de Fontys kant. De trends en ontwikkelingen komen van de presentatie van Frank Cervone en Jeff Wisnieski die zij tijdens CIL2008 hielden.
- leveranciers neemt snel af;
- open source opties neemt toe; (LibraryFind, MasterKey, VuFind)
- vooruitgang in standaardprotocollen (meer migraties naar SRU/SRW; Open Translators.
- meer visueel aantrekkelijke interfaces (Aquabrowser, Primo, Bibliocommons)
- data pre-processing; (indexering a la Google)
- meer betaalbare oplossingen; (off-site hosting; out of the box oplossingen)

Toekomst volgens Gerard: federatief zoeken wordt een eenvoudig te integreren en beheren component ter ondersteuning van ….

Zijn presentatie komt ongetwijfeld snel op zijn blog beschikbaar.

14.30 Presentatie Webfeat door Hans Peter Meulekamp van EBSCO.
WebFeat is oudste federatieve zoekmachine sinds 1998. In gebruik bij ruim 16500 instellingen. Gepatenteerde technieken, innovatief bezig. Nu overgenomen door ProQuest, waar het nu wordt geintegreerd in de producten van Serials Solutions.
Klanten in Nederland Fontys, Haagse Hogeschool en (nog niet getekend) Christelijke Hogeschool Windesheim en Hogeschool Utrecht.

Verder bevatte de presentatie mn screenshots van hoe je WebFeat kunt inrichten + prijsinformatie. Voor max 50 databanken geldt een richtprijs van $7950 per jaar. (5% korting voor 2 jaar abonnement en 10% korting voor 3 jaar abonnement. Per additionele databank geld een meerprijs van $85. De SMART (statistiek optie) kost $2000 per jaar. (prijzen excl. 19% BTW).

Leuk dan Hans-Peter onze Hidden Automatic Navigator (HAN) regelmatig noemt als oplossing voor het hele toegangsbeheer!

15.00 Tot slot de Aquabrowser ervaringen Jan Companjen van Bibliotheek Haagse Hogeschool 
Ziet de voordelen oa in de meertaligheid van het systeem (dmv digitaal woordenboek legt relaties tussen termen in verschillende talen), mogelijkheid tot het inbouwen thesaurus. Bereiken integraal aanbod (zonder externe bronnen, mede vanwege licentierechten). Geen Google alternatief, maar complementair (niet 100% waar). Oplossing voor tijdschriften in catalogus met flink aanbod van e-journals, door A-Z lijst voor elektronische en gedrukte tijdschriften. Bieden via de Aquabrowser catalogus, scriptiebank, A-Z, interne publicaties en Davindi aan. Conclusie grote meerwaarde van de Aquabrowser!

Nadelen. Studenten hebben niet door wat ze voor zich hebben. Docenten kunnen het niet goed uitleggen. Het is niet het ultieme zoekmechanisme. Afstand tussen student en de daadwerkelijke database is erg groot.

Gaan met deze conclusies het volgende doen. Externe bestanden worden doorzocht met WebFeat. Gaat nu ook afzonderlijk aangeboden worden. Hoe ze dan omgaan met de resultatenlijst van WebFeat in Aquabrowser is nog onduidelijk.

Informatiedag digitale ontwikkelingen

Gisteren, donderdag 15 mei, was de informatiedag digitale ontwikkelingen die we samen met Tomislaw Dalic van ProQuest CSA hadden georganiseerd in de Doelenzaal van de UB Amsterdam. Na een korte introductie volgen productpresentaties van vertegenwoordigers van RefWorks, Medialab, Bowker en Serials Solutions . Aan het einde van de middag mochten wij zelf afsluiten met een presentatie van Hidden Automatic Navigator (HAN).

Korte impressie:
Locatie was goed gekozen, mooi en goed bereikbaar;
Opkomst was redelijk, mensen die zich hadden aangemeld kwamen in sommige gevallen niet. Met gratis evenementen heb je daar vaker mee te maken. Bovendien zijn er deze maand heel veel evenementen, zodat mensen keuzes moeten maken;
Leuke gesprekken en contacten tijdens de pauzes;
Gezellige afsluitende borrel in Cafe de Heerengracht.

Voor mij waren RefAware en SyndeticsICE in combinatie met de Aquabrowser de nieuwigheden die ik nog niet kende en waarbij ik echt een goed gevoel kreeg.

RefAware - a web based current awareness service designed to provide researchers and other members of the academic community with immediate access to new research and publications in their field - all within hours of being posted online. Providing one source for a variety of research data, RefAware constantly scours the internet for the latest information and automatically delivers new information directly to the user. Covering over 8,000 peer-reviewed sources and other non-refereed sources of information, RefAware provides a comprehensive, up-to-the minute picture of today’s global research.

Mijn eerste indruk: Het lijkt een soort Netvibes Universe voor RSS attendering, maar dan vele malen beter en met meer mogelijkheden. Tot dusver het mooiste RSS portal dat ik heb gezien.

Syndetics ICE (Indexed Content Enrichment) is an enhancement to Syndetic Solutions that allows patrons to search valuable Syndetics content right through your library’s online catalog, helping them discover titles that are undetectable through traditional MARC data searches.

Wauw! Icm met de Aquabrowser kun je nu zoeken in de inhoudsopgaves, de samenvattingen en de recensies. Daarmee kun je informatie vinden in je catalogus, die obv het bibliotheekrecord nooit gevonden hadden kunnen worden. Ook de FRBR mogelijkheden van de Aquabrowser zijn prachtig. Een FRBR catalogus zonder dat je zelf iets aan de data hoeft te doen… Prachtig!

Informatiedag 15 mei

Donderdag 15 mei organiseren Ingressus, ProQuest CSA, RefWorks, Medialab, Bowker en Serials Solutions een informatiedag in de Openbare Bibliotheek Amsterdam.

Tijdens deze dag wordt u helemaal bijgepraat over alle ontwikkelingen met betrekking tot online content, databases, e-journals en alle technische oplossingen die het beheer van een digitale bibliotheek ondersteunen en vergemakkelijken.

Binnenkort volgt meer informatie over het programma en de verschillende sprekers. U kunt zich HIER inschrijven voor deze dag. Het aantal beschikbare plaatsen is nog beperkt, dus schrijft u zich snel in

A103 What’s new with federative search

Presentatie van Frank Cervone (tot voor kort Northwestern University maar nu University of Chicago) en Jeff Wisniewski (Universiteit van Pittsburgh). Frank heeft vorig jaar tijdens ILI2007 in London ook vergelijkbaar verhaal gehouden. Omdat de wereld van federatieve zoekmachines zo sterk in beweging is oa vanwege overnames, was ik zeer geinteresseerd in dit verhaal.

IMG_5574

Op de site van de UvP bibliotheek zie je bewust geen link naar een A-Z lijst. De bibliothecarissen denken dat mensen hun weg toch niet kunnen vinden in de lange lijst met beschikbare bronnen. Al mensen via een onderwerpslijst gaan zoeken met de onderliggende federatieve zoekmachine (WebFeat) zijn een aantal bronnen, relevant voor dat vakgebied, al aangevinkt. Gebruikers leren dan vanzelf (?) welke bronnen voor hen relevant zijn en/of de beste resultaten opleveren.

Verwijzing naar een rapport van de College & Research Libraries van november 2007 “undergraduate use of federative searching”.  Conclusies:
- Weinig kwaliteitsverschil tussen het al dan niet gebruiken van federated searching;
- Gebruikers zijn erg enthousiast over federated searching.
Daarom maar doen om aan te sluiten bij de wens van de gebruikers.

Er zijn ook OpenSource oplossingen:
- LibraryFind (Oregon State University);
- dbWiz (mn in Canada en onderdeel van een suite van producten);
- Masterkey (een heel nieuw product).

Masterkey heeft oa als kenmerk dat het grote hoeveelheden databanken in 1 keer kan doorzoeken. WebFeat kan dat bv niet. Vandaar dat Pittsburgh ook gebruik maakt van op onderwerp geclusterde sets van databanken! Snelheid van het retrieven van resultaten is een andere reden om dat te doen.

Gesignaleerde trend is dat federatieve zoekmachines onderdeel worden van zgn discovery tools. Daarom schuift de Aquabrowser ook binnen bij Serials Solutions als onderdeel van de complete suite met 360 producten.

IMG_5570

Al met al een hele leuke informatieve presentatie van 2 mannen die prima op elkaar inspelen en aanvullen daar waar nodig.

Meer over deze presentatie oa bij:
Deetjes
InfoToday Blog

licentiecontactpersonendag Surfdiensten

Gisteren was de licentiecontactpersonendag van SURFdiensten en de SHB. Omdat wij sinds kort officieel een licentieovereenkomst voor Hidden Automatic Navigator (HAN) hebben met SURFdiensten, mocht ik een presentatie over HAN geven.

Het ochtendprogramma was besloten en daar was ik niet bij dus daar kan ik niets over vertellen, wel over het middagprogramma waar ook andere productpresentaties waren. Wat ik heel erg netjes vond van SURF is dat aan alle leveranciers gevraagd werd of het bezwaarlijk was als andere leveranciers bij de presentatie aanwezig zouden zijn. (Iets wat ik nog nooit eerder heb meegemaakt). Behalve voor OCLC met een verhaal over NetLibrary was dat voor niemand een probleem. Omdat het nog een voorstel mbt NetLibrary betrof, was ook dat te begrijpen.

De eerste presentatie na de lunch was van Hans-Peter Meulekamp (EBSCO) en Jaap Kuipers (SURFfederatie) over federatieve authenticatie. Er zijn meerdere contentaanbieders die Shibboleth hebben geimplementeerd en ook al diverse instellingen die er mee werken. Windesheim kreeg een pluim vanwege de snelheid en voortvarendheid waarmee men aan tot een implementatie was gekomen. Raymond heeft daar zelf ook al over geblogd.

Daarna was de beurt aan Karin Jensma van Swets met een voorstel omtrent de tijdschriften van de The Association of Learned and Professional Society Publishers ALPSP . Betreft zo’n 728 tijdschriften onder de naam ALPSP Learned Journals Collection. Zo’n 30% wordt door ISI geindexeerd in de Citation Index. De toptijdschriften die Karin liet zien, waren voor mij allemaal onbekend. Lijkt mij dus een echte niche aanbieding van uitgevers waarmee Surf in sommige gevallen IOS Press en OECD al overeenkomsten heeft. Het totale pakket wordt wel met een aantrekkelijke korting aangeboden. Referenties uit Griekenland en Turkije maakten echter geen indruk op de aanwezigen.

Daarna was het mijn beurt om iets over HAN te vertellen. HAN sluit mooi aan op de authenticatie methoden waar de SURFfederatie al mee bezig is en waar eerder op de dag over werd gesproken. Afgesproken om samen met SURF te kijken hoe we beide complementaire oplossingen optimaal op elkaar kunnen afstemmen. Behalve de authenticatie en het beheer van wachtwoorden bieden de statistieken een goede onderbouwing voor het collectiebeheer.
Op naar de volgende licentie die we met Surf willen sluiten, bijvoorbeeld voor Serials Solutions.

Dan Scott van Emerald vertelde over de verschillende pakketten die zij aanbieden. Emerald richt zich mn op de management titels en ze hebben net een aantal e-book titels van Elsevier overgenomen.

Tot slot mocht Robert Dowding zijn presentatie over Research for Libraries houden. Er waren ondertussen al wat mensen naar huis, wat misschien de reden was dat Robert zijn presentatie een beetje afraffelde in 5 minuten. Het is mij enigszins ontgaan wat hij nu verkoopt, maar dat kwam ook door mijn enthousiasme over de toekomstige mogelijkheden die Jaap Kuipers en ik zagen voor samenwerking.

Lees ook het verslag van Raymond over deze dag.

Connectoren

Momenteel wordt er bij Serials Solutions hard gewerkt om de connectoren van WebFeat te integreren in 360 Search, de federatieve zoekmachine van Serials Solutions. Naar verwachting kunnen een groot deel van de connectoren op korte termijn worden opgezet zonder al te grote inspanning, want in het verleden maakte SerSol ook al gebruik van de connectoren van WebFeat.

Binnenkort verschijnt een officiele aankondiging om welke connectoren het gaat.

Federatieve zoekmachines

Gisteren las ik op Biebmiepleen over de aanstaande NVB themadag “federatieve zoekmachines”. Toevallig werden er bijna tegelijkertijd een aantal posts op andere blogs gepubliceerd die daar erg mooi bij aansluiten.

Op Federated Search kwam een bericht over Discovery layers, zeg maar de tweede generatie federatieve zoekmachines langs. Toen ik dit las moest ik gelijk aan de activiteiten in Groningen denken en dan met name hun LiveTrix.
LiveTriX logo
Daarbij kwam een aantal voor mij nieuwe blog voorbij die ook over dit onderwerp gaan en die ik gelijk aan mijn feeds heb toegevoegd.

Update (op verzoek van BiebMiepLeen): Het betreft het blog van New Jack Librarian en het portal van de Discovery Tools Sub-Group of Scholars Portal.