Energieversorger

Generelles Thema / Branche

Energieerzeuger, strukturierte Erfassung von Dokumenten

Problemstellung

Der Kunde ist einer der großen deutschen Energieversorger. Neben seinem konventionellen Kraftwerkpark verfügt er über mehrere Tausend Windkraftanlagen unterschiedlichen Typs, die durch verschiedene Regionalgesellschaften betrieben werden. Im Zuge einer Konsolidierung sollen alle Anlagen in einer Gesellschaft zusammen gefasst werden. Da zukünftig auch die Wartung der einzelnen Anlagen zentral gesteuert wird, sollen in einem ersten Schritt alle vorhandenen Wartungsprotokolle und Störungsmeldungen zentral erfasst und in elektronischer Form zur weiteren Planung und Analyse (z. B. zur Erkennung von Fehlerquellen) zur Verfügung gestellt werden. Ein Teil der Dokumente muss aus juristischen Gründen dauerhaft gesichert werden. Aufgabe war die Entwicklung eines Konzepts zur Erfassung und strukturierten Verwaltung all dieser Dokumente.

Lösungsansatz

Die Dokumente liegen zwar in elektronischer Form vor, jedoch nicht in Form von Excel-Tabellen oder Datenbanken, sondern als ausgefüllte Formulare und Formblätter in den Formaten Word, Excel, PDF sowie als Scan in verschiedenen Grafikformaten. Zudem enthalten die Dokumente teilweise Freitexteinträge beispielsweise bei der Beschreibung von Symptomen an einer Anlage. Aus diesem Grund müssen verschiedene Techniken miteinander kombiniert werden.

Die Verwendung eines revisionssicheren Dateisystems gewährleistet die permanente Sicherung der Dokumente, für die dies juristisch erforderlich ist. Für die inhaltliche Analyse kommt ein Big Data-fähiges Dateisystem zum Einsatz, das u. a. die redundante Abspeicherung sowie die parallele Verarbeitung großer Datenmengen unterstützt. Jedem Dokument, das neu aufgenommen wird, wird ein spezielles Analyse-Modul zugeordnet, das in Abhängigkeit von Dateityp und –form die relevanten Inhalte extrahiert und in einer zentralen Datenbank ablegt. Dabei kommen auch OCR sowie die Verarbeitung natürlicher Sprache1 zum Einsatz.

Ergebnis

Neben der Sicherstellung der revisionssicheren Verwaltung der relevanten Dokumente ist das Hauptergebnis ein System, das in der Lage ist, große Menge elektronischer Dokumente in bestimmten Formaten flexibel abzuspeichern und so zu analysieren, dass die wesentlichen Informationsinhalte in strukturierter Form vorliegen und so beispielsweise zu Wartungszwecken ausgewertet werden können. Die Dokumente werden so miteinander verlinkt, dass beispielsweise das Auftreten gleicher Begriffe oder Objekte an unterschiedlichen Stellen nachverfolgt werden kann.

Kunde

großer deutscher Energieversorger

Projekttyp und Randbedingungen

Konzeption einer Pilotanwendung

_______________________________

1 Hier arbeiten wir mit dem Spoken Language Systems Lab zusammen, das im Bereich der Informations-extraktion aus Texten zu den weltweit führenden Instituten gehört.