openPR Recherche & Suche
Presseinformation

Effiziente Analyse multimodaler Dokumente mit KI

16.02.202615:52 UhrIT, New Media & Software
Bild: Effiziente Analyse multimodaler Dokumente mit KI

(openPR) Trotz zunehmender Digitalisierung werden Dokumente wie Rechnungen, Geschäftsberichte, Beschwerden, Formulare und Verträge weiterhin häufig genutzt und laufen als Massendaten in Banken, Versicherungen und Behörden auf. Für die Effizienz vieler Geschäftsprozesse, wie die Weiterleitung von Anfragen, die Extraktion und Speicherung von Daten sowie die Unterstützung bei Suchanfragen, ist die Verarbeitung solcher – in der Informatik als unstrukturiert bezeichneten – Dokumente von großer Bedeutung. Wie Künstliche Intelligenz (KI) zur automatisierten Dokumentenauswertung eingesetzt werden kann, untersuchen Forschende der Hochschule RheinMain (HSRM) im Projekt SLIMDOC (Synergetic LIghtweight Multimodal DOCument Analysis).

Automatisierte Analyse multimodaler Dokumente

Für die Interpretation von Dokumenten stellt die KI-basierte Dokumentanalyse eine Schlüsseltechnologie dar, die sich etwa mit Informationsextraktion (beispielsweise von Produktpreisen), Entitätserkennung (wie von Orten oder Rechnungspositionen), der Klassifikation von Dokumenten oder mit der automatischen Beantwortung von Fragen zum Dokumentinhalt beschäftigt. Besonders herausfordernd ist es, multimodale Dokumente zu verstehen: Diese beinhalten neben Text auch Bilder wie Grafiken oder Fotos. Die KI muss folglich nicht nur textliche Informationen, sondern auch visuelle Signale und die räumliche Anordnung der Layoutelemente berücksichtigen. Bei der Schadenregulierung in Versicherungen müssen KI-Modelle etwa prüfen, ob Schadendokumente in sich kompatibel und plausibel sind.

Verkleinerung von KI-Modellen

„Mit dem Projekt SLIMDOC möchten wir KI-Modelle entwickeln, die solche Dokumente zuverlässig analysieren, und zwar leichtgewichtig“, erklärt Projektleiter Prof. Dr. Adrian Ulges. Bisherige KI-Modelle lassen sich in zwei Arten unterteilen: einerseits Large Language Models (LLMs) wie die Modelle der GPT-Reihe, die als generelle Problemlöser überzeugen, aber einen enormen Ressourcenverbrauch mit sich bringen und nur eingeschränkt lokal betrieben werden können. Daneben gibt es auf die Verarbeitung von Dokumenten spezialisierte Modelle, die Bildinhalt, Text und Layout in Kombination interpretieren, dafür jedoch händisch annotierte Daten benötigen, was mit einem Mehraufwand für die Kunden einhergeht, die diese Annotationen liefern müssen.
Das Ziel von SLIMDOC ist es, beide Modelltypen synergetisch zu verbinden. Mittels eines als Distillation bezeichneten Verfahrens sollen die Fähigkeiten von LLMs auf sehr kleine, task-spezifische Modelle zur Dokumentenanalyse übertragen werden. So soll ein effektiveres Modell entstehen, das dieselbe Aufgabe im Sinne von Nachhaltigkeit und digitaler Souveränität ressourcenschonend löst. Die KI-Modelle sollen außerdem in der Lage sein, die benötigten Trainingsdaten mittels Dokumentengenerierung selbstständig zu erstellen, sodass teures Datensammeln und die händische Annotation überflüssig werden.

Zusammenarbeit mit Praxispartnern

Das Projekt bearbeitet zwei Anwendungsfälle mit drei Praxispartnern. Gemeinsam mit der Insiders Technologies GmbH als mittelständischem Anbieter von Softwarelösungen für die Automatisierung dokumentenzentrierter Geschäftsprozesse werden neue hocheffiziente KI-Modelle für Spezialtasks in der Dokumentanalyse entwickelt. Der Dokumentanalyse als multimodalem Problem widmet sich die Zusammenarbeit mit der R+V Versicherung als Verarbeiter von Massendaten und der Doxis GmbH als Anbieter im Bereich Enterprise Content Management. Geplant ist der Einsatz von neu entwickelten KI-Modellen in der Informationsgewinnung aus mit Grafiken versehenen Geschäftsberichten sowie in der Plausibilitätsprüfung von Versicherungsfällen.

Die Hochschule RheinMain

Über 70 Studienangebote an zwei Studienorten mit einem internationalen Netzwerk – das ist die Hochschule RheinMain. Rund 12.600 Studierende studieren in den Fachbereichen Architektur und Bauingenieurwesen, Design Informatik Medien, Sozialwesen und Wiesbaden Business School in Wiesbaden sowie im Fachbereich Ingenieurwissenschaften in Rüsselsheim am Main. Neben der praxisorientierten Lehre ist die Hochschule RheinMain anerkannt für ihre anwendungsbezogene Forschung.

https://www.hs-rm.de/de/ | https://de-de.facebook.com/HSRheinMain/ | https://de.linkedin.com/school/hochschulerheinmain/ | https://www.instagram.com/hs_rheinmain/ | https://www.youtube.com/user/HochschuleRheinMain

wissenschaftliche Ansprechpartner:
Prof. Dr. Adrian Ulges (E-Mail)

Diese Pressemeldung wurde auf openPR veröffentlicht.

Verantwortlich für diese Pressemeldung:

News-ID: 1304040
 307

Kostenlose Online PR für alle

Jetzt Ihren Pressetext mit einem Klick auf openPR veröffentlichen

Jetzt gratis starten

Pressebericht „Effiziente Analyse multimodaler Dokumente mit KI“ bearbeiten oder mit dem "Super-PR-Sparpaket" stark hervorheben, zielgerichtet an Journalisten & Top50 Online-Portale verbreiten:

PM löschen PM ändern
Disclaimer: Für den obigen Pressetext inkl. etwaiger Bilder/ Videos ist ausschließlich der im Text angegebene Kontakt verantwortlich. Der Webseitenanbieter distanziert sich ausdrücklich von den Inhalten Dritter und macht sich diese nicht zu eigen. Wenn Sie die obigen Informationen redaktionell nutzen möchten, so wenden Sie sich bitte an den obigen Pressekontakt. Bei einer Veröffentlichung bitten wir um ein Belegexemplar oder Quellenennung der URL.

Pressemitteilungen KOSTENLOS veröffentlichen und verbreiten mit openPR

Stellen Sie Ihre Medienmitteilung jetzt hier ein!

Jetzt gratis starten

Weitere Mitteilungen von idw - Informationsdienst Wissenschaft

Bild: Altrektor Prof. Dr. Dres. h.c. Gert Kaiser verstorbenBild: Altrektor Prof. Dr. Dres. h.c. Gert Kaiser verstorben
Altrektor Prof. Dr. Dres. h.c. Gert Kaiser verstorben
Gert Kaiser wurde am 18. Juni 1941 in Hardheim im Odenwald geboren. Er studierte Germanistik, Geschichte und Romanistik in München und Heidelberg, wo er auch 1964 mit der Arbeit „Beiträge zu den Liedern des Minnesängers Rubin“ promoviert wurde. Im Jahr 1970 habilitierte er ebenfalls an der Universität Heidelberg im Fach Deutsche Philologie. 1973 wurde er zunächst Professor in Heidelberg, bevor er vier Jahre später einen Ruf an die Universität Düsseldorf auf den Lehrstuhl für Ältere Germanistik annahm. In den 20 Jahren seines Rektorats – Prof…
Deutscher Preis für Wirtschaftskommunikation 2026 zeichnet Kommunikationskampagnen aus
Deutscher Preis für Wirtschaftskommunikation 2026 zeichnet Kommunikationskampagnen aus
Unter dem diesjährigen Leitthema „Future Skills“ stand der Abend ganz im Zeichen der Frage, welche Fähigkeiten exzellente Kommunikation heute ausmachen und welche Kompetenzen die Branche künftig prägen werden. Neben den Preisverleihungen sorgte ein Panel mit Vertreterinnen und Vertretern aus Wissenschaft, Wirtschaft und Hochschule für Einblicke in die Zukunft der Kommunikationsbranche. Auch Berlins Senatorin für Wirtschaft, Energie und Betriebe, Franziska Giffey, richtete ein Grußwort an die Gäste. Aus zahlreichen Einreichungen wählte die st…

Das könnte Sie auch interessieren:

Bild: Vom Papier zum Prozess mit X4 ePaperBild: Vom Papier zum Prozess mit X4 ePaper
Vom Papier zum Prozess mit X4 ePaper
… 5 auf Stand G04. Einer der wichtigsten Herausforderungen für ein durchgehendes Business Process Management sind medienbruchfreie Geschäftsprozesse. Dazu gehört auch die effiziente Erfassung von Papierdokumenten wie Eingangsrechnungen oder Lieferscheine. X4 ePaper ermöglicht die Umwandlung dieser zunächst nur als Bild verfügbaren unstrukturierten Daten …
Bild: Effizientes Dokumentenmanagement ohne komplexe Software – SCHLESINGER.DigitalBild: Effizientes Dokumentenmanagement ohne komplexe Software – SCHLESINGER.Digital
Effizientes Dokumentenmanagement ohne komplexe Software – SCHLESINGER.Digital
… Dokumentenprozesse zu digitalisieren und gleichzeitig ihre bestehenden Arbeitsabläufe beizubehalten. Eine neue digitale Lösung für Dokumentenmanagement – SCHLESINGER.Digital - zeigt, dass effiziente Digitalisierung auch ohne komplexe Softwarelandschaften und langwierige IT-Projekte möglich ist.Im Mittelpunkt der Lösung steht ein Ansatz, der Dokumentenverwaltung und …
Bild: Dokumenten-Management: Kosteneinsparung durch DMSBild: Dokumenten-Management: Kosteneinsparung durch DMS
Dokumenten-Management: Kosteneinsparung durch DMS
… Schaubild) wird deutlich, wie ein leistungsfähiges DMS die Prozessabwicklung verschlanken und vereinfachen kann, und so zu einer gesicherten und effizienten Dokumentenbearbeitung beiträgt. Bei der DMS-unterstützten Rechnungsprüfung werden die gespeicherten Dokumente und Daten automatisiert verglichen, und etwaige Abweichungen dem Benutzer dargestellt: …
direct/ CRE-DO auf Wachstumskurs
direct/ CRE-DO auf Wachstumskurs
… mit neuen Inhalten ausgestattet, präsentiert sich auch die CRE-DO Website. Zusätzlich gibt die neue Firmenbroschüre kurz und bündig Auskunft über das, was CRE-DO ausmacht: Effiziente Output- und Dokumenten-Management-Lösungen. CRE-DO bietet alles aus einer Hand "Von der Analyse über die Beratung bis zur Realisierung entwickeln wir den optimalen Weg …
Bild: Neues Release FormsRec für das automatisierte Auslesen digitaler Geschäftsdokumente ab sofort verfügbarBild: Neues Release FormsRec für das automatisierte Auslesen digitaler Geschäftsdokumente ab sofort verfügbar
Neues Release FormsRec für das automatisierte Auslesen digitaler Geschäftsdokumente ab sofort verfügbar
… Das neue FormsRec Release 5.0 präsentiert sich mit vielen Neuigkeiten, welche die Datenqualität und Prozessgeschwindigkeit weiter steigern. FormsRec ist die effiziente Software-Lösung zur Dokumenten-Erkennung und Dokumenten-Analyse. Mit dieser Lösung können in kürzester Zeit alle Informationen aus Geschäftsdokumenten gewonnen werden, die für die weitere …
Bild: Umfrage ergibt Zeitersparnis als überzeugendsten Nutzen von SpracherkennungBild: Umfrage ergibt Zeitersparnis als überzeugendsten Nutzen von Spracherkennung
Umfrage ergibt Zeitersparnis als überzeugendsten Nutzen von Spracherkennung
… vorgestellte Gesamtkonzept von 4voice ermöglicht eine Analyse und Einstufung der Anwender hinsichtlich der bisherigen Nutzung und deren Arbeitsweise. Die anschließende effiziente Auswahl von Funktionsmodulen sowie das nachfolgende angepasste Schulungs- und Betreuungskonzept ist die Basis für eine dauerhaft hohe Nutzungsintensität der Spracherkennung. …
Bild: DOCBOX® und Innotax schließen strategische Partnerschaft für die digitale Steuer- und UnternehmensberatungBild: DOCBOX® und Innotax schließen strategische Partnerschaft für die digitale Steuer- und Unternehmensberatung
DOCBOX® und Innotax schließen strategische Partnerschaft für die digitale Steuer- und Unternehmensberatung
… fundierter Beratung schafft neue Möglichkeiten in den Bereichen:• Steuerberatung & Finanzbuchhaltung: Automatisierte Prozesse für eine effiziente Buchhaltung und Steuererklärung.• Gesellschaftsrecht & Unternehmensnachfolge: Sichere Dokumentenverwaltung für Unternehmensübergaben oder gesellschaftsrechtliche Regelungen.• Betriebswirtschaftliche …
Mit DOXiS4 geschäftskritische Informationen im Griff - eDiscovery gibt Rechtssicherheit in der Finanzkrise
Mit DOXiS4 geschäftskritische Informationen im Griff - eDiscovery gibt Rechtssicherheit in der Finanzkrise
… schnellstmöglich alle relevanten Dokumente zu überprüfen und Entscheidungsprozesse zu dokumentieren. Die eDiscovery-Funktionen von SER und Recommind in der DOXiS4-Suite bieten dabei effiziente Unterstützung. Die aktuelle Finanzmarktkrise wird in etlichen Unternehmen hektische Betriebsamkeit in den Rechtsabteilungen auslösen. Die Suche nach den Schuldigen für …
Bild: Cebit-Premiere 2008 - actindo präsentiert Shop-ERP in neuer VersionBild: Cebit-Premiere 2008 - actindo präsentiert Shop-ERP in neuer Version
Cebit-Premiere 2008 - actindo präsentiert Shop-ERP in neuer Version
Effiziente Bestellabwicklung durch Business-Intelligence und zeitgemäßes Ajax-Frontend. actindo präsentiert auf der Cebit 2008 seine mehrfach ausgezeichneten ERP-Lösungen für den Distanzhandel in neuem Gewand. Die Umstellung auf ein Ajax-Framework hat die Performance und Usability der Anwendung wesentlich verbessert. So lassen sich Artikel schneller …
Prisma und SAP veranstalten Fachtagung für effiziente Ermittlungsarbeit und Auswertung unstrukturierter Daten
Prisma und SAP veranstalten Fachtagung für effiziente Ermittlungsarbeit und Auswertung unstrukturierter Daten
… fokussiert Sicherheitsbereich Berlin. Gemeinsam mit SAP veranstaltet die prisma GmbH für Interessenten aus dem Sicherheitsumfeld eine Fachtagung, die über Möglichkeiten zur effizienteren Ermittlungsarbeit und Auswertung unstrukturierter Daten informiert. Im Fokus steht die inhaltliche Erschließung von Informationen aus Dokumenten, dem Internet, Geo-Systemen …
Sie lesen gerade: Effiziente Analyse multimodaler Dokumente mit KI