(openPR) Der Traditionsverlag Springer Science+Business Media startet ein Großprojekt: Der gesamte Titelbestand des Verlages, beginnend im Jahr 1842, soll erschlossen werden. Dies ist insbesondere deshalb ein Novum, weil dadurch auch alle vergriffenen Titel der Backlist, wieder verfügbar gemacht werden. In Zukunft wird eine webbasierte Recherche im gesamten Bestand möglich sein. Zudem können alle Titel sowohl als e-Book und Print On Demand erworben werden. Ziel ist es, dass jeder jemals bei Springer erschienene Titel wieder gekauft werden kann.
Im Rahmen dieses Mammut-Projektes, das auf mehrere Jahre angelegt ist, stellt Springer seine gesammelten bibliographischen Daten von ca. 150.000 Titeln zur Verfügung – NEWBOOKS Services und iucon übernehmen die Verstichwortung. Dazu generiert die Fachredaktion von NEWBOOKS Services einen Stichwortindex, der sich an den Themen der jeweiligen Titel orientiert. Auf Basis dieser Stichwortliste und der bibliographischen Informationen ordnet das von iucon implementierte System jedem Titel themensensitive Stichwörter zu, etwa aus der „Thermodynamik“ oder dem „Gesellschaftsrecht“.
Diese Schritte sind erforderlich, um gerade bei technischen Themenfeldern eine klare Zuordnung und relevante Suchergebnisse zu ermöglichen. So unterscheidet das System beispielsweise eindeutig zwischen Java aus dem Themengebiet Programmiersprachen und der Insel Java aus dem Themengebiet Reiseführer. Gegenüber der Vergabe von Stichworten im Freitext überzeugt die thematisch gebundene Verstichwortung mit Präzision und Konsistenz. Sie gewährleistet zielführende Recherchen mit schnellen Ergebnissen und steigert damit die Kundenzufriedenheit.
Um die Datenqualität weiter zu erhöhen, werden nicht nur die bibliographischen Daten, sondern auch die Inhaltsverzeichnisse in die Zuordnung mit einbezogen. Der Prozess ist sehr rechenintensiv, weil hunderttausende Stichworte durch einen komplexen Algorithmus mit jedem Titel des Datenbestandes abgeglichen werden müssen. Um die Zuordnung zu beschleunigen, greift iucon auf den Cloud-Dienst von Microsoft zurück. Bisher wurden Verstichwortungen lokal mit dem Microsoft SQL-Server durchgeführt. Mit der Cloud-Datenbank SQL-Azure kann die Rechenlast weitaus effizienter verteilt werden.
Wissenschaftler und Bibliothekare in aller Welt sind gespannt, welche Fundstellen der Backlist zukünftige Suchanfragen ans Tageslicht fördern werden.












