(openPR) Hamburg, 20.07.2009 - 500.000 Seiten Parlamentsdebatten aus den Jahren 1879 bis 1910 lässt die Österreichische Nationalbibliothek durch CCS Content Conversion Specialists digitalisieren. Die historischen Texte wurden OCR-gelesen, für die Volltextsuche aufbereitet und werden später über die Webseite der Österreichischen Nationalbibliothek sowie über The European Library den Nutzern zugänglich gemacht.
„Historische Rechtstexte gehören neben Zeitungen zu den sehr häufig genutzten Materialien“, so Johanna Rachinger, Generaldirektorin der Österreichischen Nationalbibliothek in Wien. „Aufgrund des komplexen strukturellen Aufbaus dieser Texte wird die Volltextsuche in Zukunft das Auffinden bestimmter Textstellen wesentlich erleichtern.“
Ziel des von der EU-Kommission im Rahmen des eContentplus-Programms teilfinanzierten Projekts ist die Erweiterung des Online-Portals der europäischen Nationalbibliotheken (The European Library, www.theeuropeanlibrary.org/) und die Vorbereitung der Europäischen Digitalen Bibliothek (Europeana, www.europeana.eu). Es kommt darauf an,die Anzahl der über The European Library zugänglichen digitalen Inhalte signifikant zu erhöhen, um eine kritische Masse zu erreichen. Bereits digitalisierte Bestände der europäischen Nationalbibliotheken werden OCR-gelesen und ab Ende 2009 für Benutzer im Volltext angeboten. Die Österreichische Nationalbibliothek koordiniert in diesem Projekt die OCR-Aktivitäten der beteiligten Bibliotheken.
Die technische Herausforderung bestand im Fall der Parlamentsdebatten darin, dass die stenografischen Protokolle mit allen zugehörigen Materialien wie Tischvorlagen oder Eingaben zu einem einzigen digitalen Original zusammengeführt werden mussten.




