(openPR) PLAUE, 16.April 2007 - Die vom Thüringer Software-Entwickler metux IT service betriebene Opensource-Quellpaket-Datenbank (CSDB) wurde überarbeitet und in neuem Layout freigegeben. Die CSDB erfäßt weit über tausend Opensource-Pakete mit ca. 12.000 Releases und 70.000 URLs, die sich auch von vollautomatischen Systemen leicht abrufen lassen. Damit entfällt beispielsweise für Distributoren und System-Integratoren der Aufwand für das Pflegen eigener Datenbanken.
Wozu dient die "Comprehensive Source Database" ?
In der CSDB werden mehr als tausend OpenSource-Pakete mit ihren Releases und den dazugehörigen Download-URLs erfaßt. Dabei läßt sich die Datenbank mittels Robot-Schnittstellen vollautomatisiert abfragen. Somit dient sie nicht nur als Hilfsmittel für Distributions-Manager, sondern kann auch direkt in automatiserten Build-Systeme, wie viele Distributionen sie einsetzen, integriert werden.
Der Vorteil für den Anwender besteht darin, daß durch eine direkte Integration von CSDB-Abfragen der oftmals imense Aufwand für die Pflege eigener Paket/URL-Datenbanken und die manuelle Suche nach neuen Releases entfällt.
Die CSDB ist kein feshmeat-Nachbau !
Auf den ersten Blick mag es den Leser verwundern, wo der Vorteil gegenüber dem bereits seit vielen Jahren etablierten Software-Index auf freshmeat.net besteht. Die Antwort ist einfach:
CSDB verfolg eine gänzlich andere Zielstellung: während freshmeat.net voriegend als ausführlicher Software-Index für den humanoiden Nutzer gedacht ist, dient die CSDB hauptsächlich als Datenbasis für automatisierte Systeme, die - ohne zusätzlichen manuellen Aufwand - bestimmte Pakete auf neue Releases überwachen und direkte URLs zu den Quellpaketen abrufen möchten.
Einfaches Handling durch strenge Normalisierung
Innerhalb der Opensource-Gemeinde gibt es kein streng standardisiertes Versionsschema - jedes Projekt verwendet sein eigenes. Das OpenSSL-Projekt zB. nummeriert in der Form "0.9.8e", die GNU-Projekte hingegen die Formen "1.7", "1.7.1" - das sind noch triviale Beispiele. Zwar sind die Nummerierungen für Menschen offentsichtlich, Computer können damit jedoch - ohne zusätzliche Rechenregeln nicht viel anfangen, wenn zB. zwei Versionen miteinander verglichen werden sollen.
Dieses Problem wird von der CSDB durch eine Normalisierung: jede Versionsnummer hat hier die feste Form "0.1.2.3", wobei für jede der einzelnen Stellen beliebige Ganzzahlen erlaubt sind. Somit sind sämtliche nötigen Operationen trivial und eindeutig definiertbar. Client-seitig wird ausschließlich diese normalisierte Schreibweisen verwendet - die Transformation von der Originalschreibweise wird dabei von der CSDB automatisch erledigt.
Ein weiteres Problem sind zum Einen kollidierende Paketnamen verschiedener Projekte, zum Anderen gänzlich inkompatible bzw. unabhängige Entwicklungsbranchen unter gleichem Namen. So existieren zB. vom bekannten GUI-Toolkit "GTK " zwei unterschiedliche Varianten, die jedoch unter gleichem Namen veröffentlicht werden und nur anhand der Versionsnummer auseinander zu halten sind. Einige Distributionen umgehen das Problem mit obskuren Techniken wie Gentoo's "Slotting".
In der CSDB wird das Problem jedoch damit abschließend gelöst, daß solche Pakete mit unterschiedlichen Namen versehen werden. So ist der normalisierte Name des GTK Version 2.x nun "gtk2". Verwechslungsprobleme wie zB. "gtk-2.3.4" für ein echte (abwärtskompatible) Nachfolgeversion von "gtk-1.2.3" gehalten wird, sind somit vom Tisch.
Quo vadis ?
Für die Zukunft stehen noch weitere Features auf dem Programm:
* RSS-Feeds
* eMail-Benachichtigung
* Stabilitäts-Tags
* nutzerdefinierte Tags
* Patch-Datenbank
* u.v.m
Weitere Informationen sind unter http://www.metux.de/csdb/ zu finden.
Ansprechpartner:
Enrico Weigelt
eMail:
Web: www.metux.de/
Anschrift: Heydaer Straße 23, 99338 Plaue
Telefon: +49-36207-519931 oder +49-174-7066481









