(openPR) (Herne, 27.07.2010) Die Software lid der Lingua-Systems Software GmbH ermöglicht es, automatisch die Sprache und Zeichenkodierung von Textdaten zu bestimmen. Der Umfang der unterstützten Sprachen wurde in Version 3.1.0 um Chinesisch (Mandarin) auf insgesamt 26 Sprachen erweitert. Die unterstützten Zeichenkodierungen wurden um Big5 und GB2312 ergänzt.
Diese Informationen gewinnen in einer zunehmend globalisierten Welt immer mehr an Bedeutung, weil sie eine sprachspezifische und solide Verarbeitung ermöglichen. Es lassen sich zum Beispiel Besonderheiten einzelner Sprachen berücksichtigen oder die Sprache als Ordnungskriterium in der Flut von Informationen einsetzen.
Prototypische Anwendungsbereiche finden sich vor allem im Umfeld der Internettechnologien, vom E-Mail Routing über Information Retrieval bis zu Suchmaschinen. Generell bereichert das Wissen über Sprache und Zeichenkodierung alle Anwendungen, die Text in großen Mengen automatisch verarbeiten.
Der Sprachidentifizierer lid steht als C/C++ Bibliothek für alle gängigen Unix-artigen Betriebssysteme (Linux, Solaris, FreeBSD) und Microsoft Windows zur Verfügung. Ein besonderer Schwerpunkt liegt in der Auswahl der von lid unterstützten Sprachen, die sich an Studien zur Verbreitung in digitalen Medien orientiert. Nicht zuletzt durch diese Auswahl kann lid solide Ergebnisse liefern und zudem schnell und ressourcenschonend arbeiten. Um den Anforderungen moderner Softwareentwicklung Rechnung zu tragen ist lid thread-sicher und durch eine kompakte Programmierschnittstelle leicht zu integrieren.
Weiterführende Informationen finden Sie unter http://www.lingua-systems.de/lid









