Partnerportal
“Schnelle und effiziente Registrierung, Automatisierung und Verarbeitung eingehender Informationen”
MEHR ERFAHREN

Intelligent Document Technology: IDT

Intelligente Verarbeitung eingehender Informationen

Trotz zunehmender Digitalisierung steigt die Menge an Informationen, die Organisationen jährlich verarbeiten müssen, stetig an. Obwohl es sich hierbei zum größten Teil immer noch um papiergebundene Dokumente handelt, sind seit einigen Jahren auch digitale Pendants dazugekommen. Nicht nur der reine Umfang eingehender Informationen steigt demnach, sondern auch ihre Heterogenität. E-Mails, Formulardaten und Anfragen über eine Internetseite sind nur einige Beispiele, zudem werden soziale Medien und Messengerdienste wie Whatsapp von Organisationen immer häufiger auch geschäftlich eingesetzt. Das bringt ganz neue Herausforderungen für die Verarbeitung mit sich.

Um dieser eingehenden Dokumenten- und Datenflut Herr zu werden, bedarf es einer Intelligent Document Technology, die alle Informationseingänge eines Unternehmens – egal ob papiergebunden, digitalisiert oder komplett digital – ganzheitlich bündelt, automatisiert und optimiert. Unsere Technologie sorgt somit für die kanalunabhängige Erfassung, Extraktion und Verarbeitung relevanter Informationen mittels leistungsstarkem und zukunftsorientiertem Input Management.

Was ist Input Management?

Input Management bezeichnet im Wesentlichen die digitale Erfassung geschäftsrelevanter Daten mittels Capture-Technologien. Sie umfasst die Digitalisierung, Automatisierung und Verarbeitung eingehender Dokumente und Informationen. Enthaltene Daten werden mittels OCR erkannt, interpretiert und extrahiert, sodass die wesentlichen Informationen schnellstmöglich an die jeweils richtige Stelle im Unternehmen gelangen. Es kann sich dabei um digitale Dokumente und Informationen handeln oder um Dokumente aus Papier. Um die papiergebundene Post verarbeiten zu können, muss diese natürlich erst gescannt und damit digitalisiert werden.

Das Input Management ist ein wesentlicher Bestandteil unserer Intelligent Document Technology und kommt bei verschiedensten Praxisszenarien zum Einsatz, etwa bei der digitalen Eingangsrechnungsverarbeitung.

Automatisierte Dokumentverarbeitung

Beim Input Management werden eingehende oder eingelesene Dokumente zunächst als bestimmte Dokumentart (z. B. eine Rechnung) identifiziert. Dies geschieht aufgrund spezifischer Merkmale der jeweiligen Dokumente. Beispielsweise wird eine Eingangsrechnung anhand einer Zahlungsreferenz, einer Besonderheit dieser Belegart, identifiziert. Auf Basis der Identifikation findet eine bestimmte Art der Verarbeitung statt. Dies kann zum Beispiel die Weiterleitung des Dokuments an eine bestimmte Person oder Abteilung sein (zum Beispiel zum Signieren) oder das automatische Extrahieren und Weiterleiten der Dokumentendaten an ein anderes System wie DMS, CRM, ERP oder eine FiBu-Lösung.

Dots

Registrierung, Automatisierung und Verarbeitung eingehender Informationen: die Phasen

Der Verarbeitungsprozess mit Intelligent Document Technology kann in mehrere Schritte unterteilt werden. Dies sind: Intake & Import, Preprocessing, Classification, Recognition & Extraction, Validation, Verification, Export sowie Anonymize. Diese Phasen bauen sich teilweise aufeinander auf. Aufgrund des modularen Aufbaus sind jedoch nicht alle Komponenten voneinander abhängig.

Registrierung, Automatisierung und Verarbeitung eingehender Informationen: die Phasen
Dots

Möglichkeiten der Intelligent Document Technology

1. Intake & Import

Papierdokumente, die noch nicht digital vorliegen, werden digitalisiert und mittels OCR (Optical Character Recognition) im Volltext durchsuchbar gemacht. Bereits digital vorhandene (und damit elektronisch erzeugte) Dokumente werden importiert. Rechnungen beispielweise liegen immer öfter auch als digitale Variante vor (XML, XRechnung oder ZUGFeRD). Der Eingangskanal (per E-Mail, auf Papier etc.) spielt hierbei im Wesentlichen keine Rolle.

2. Preprocessing

Für eine fehlerfreie Erkennung lassen sich eingescannte Papierdokumente optimieren. Dabei richtet die Software z. B. schräg gescannte Dokumente aus oder entfernt Knicke und Flecken. Mehrseitige Dokumente oder verschiedene Dokumenttypen können in diesem Schritt geordnet werden, wenn sie – etwa mit Barcodes oder mittels Trennseiten – entsprechend gekennzeichnet sind.

3. Classification

Erfasste Dokumente werden nach Art und Inhalt charakterisiert. Diese sogenannte Klassifikation lässt sich über frei bestimmbare Attribute frei definieren. Die Klassifizierung eines Dokuments z. B. als Rechnung oder als Bestellung erfolgt anhand von Worterkennung. Rechnungen etwa enthalten enthalten oft typische Wörter wie „Rechnungsnummer“ oder ähnliche Elemente, die diesen Dokumenttyp charakterisieren. Die Zuordnung kann aber auch durch Vergleichen mit bekannten Dokumenten erzielt werden. Anhand dieser Beispieldokumente wird die Software trainiert. Sie „lernt“ dementsprechend mit jeder Erkennung, um welchen Dokumenttyp es sich handelt. Auf diese Weise lassen sich Rechnungen, Bestellungen, Formulare und andere Dokumente automatisch klassifizieren.

4. Recognition & Extraction

Im Anschluss findet und entnimmt die Software diejenigen Daten in Dokumenten, die für die jeweilige Weiterverarbeitung benötigt werden. Einzelbestandteile und ihre Position im Dokument werden dementsprechend erkannt (man spricht hier auch von Dokumenterkennung bzw. nur von Erkennung) und aus dem Dokument herausgezogen (der Fachbegriff hierfür lautet Extraktion), um sie dann an ein bestimmtes System und / oder einen bestimmten Prozess weiterzuleiten. Bei Rechnungen beispielsweise werden typische Inhalte wie Rechnungsnummern, Lieferantendaten oder Beträge erkannt und extrahiert.

5. Validation

Vordefinierte Regeln überprüfen einzelne Felder auf ihre Vollständigkeit und Korrektheit, beispielsweise ob eine IBAN richtig geschrieben wurde und die vorgesehene Länge hat. Durch die Validierung werden menschliche Fehler erheblich reduziert und Verarbeitungs- und Übertragungsfehler vermieden.

Falls gewünscht, umfasst diese Phase außerdem eine Funktionalität zum Dokumentenvergleich – ein leistungsfähiges Werkzeug, um verschiedene Versionen von Dokumenten schnell zu vergleichen und Unterschiede darin auf einen Blick sichtbar zu machen.

6. Verification

Gibt es eine Abweichung, wird diese dem Benutzer sofort dargestellt und kann überprüft und korrigiert werden. Diese Verifizierung ist aber kein Muss.

7. Export

Im letzten Schritt werden die erfassten Dokumente automatisch als durchsuchbare PDF-, PDF/A-, oder TIF-Datei und die extrahierten Inhalte als XML- oder CSV-Datei am festgelegten Speicherort abgelegt oder an relevante Folgesysteme zur Weiterverarbeitung exportiert. Letzteres kann etwa ein Dokumentenmanagementsystem (DMS) sein, ein ERP- oder CRM-System oder eine FiBu-Lösung. Die Technologie ist damit eine sinnvolle Ergänzung komplementärer Systeme, um digitale Dokumente elektronisch auszulesen und die enthaltenen Metadaten auf direktem Wege weiterzuleiten.

Anonymize

Seit dem Inkrafttreten der Datenschutzgrundverordnung (DSGVO) gelten neue Regeln zum Schutz vertraulicher Daten. Unsere Intelligent Document Technology umfasst daher außerdem einen möglichen Alternativschritt, der sich nach dem Preprocessing (Vorverarbeitung in Schritt 2) und vor der Verification (Schritt 6) einordnen lässt. Diese DSGVO-Erweiterung erkennt alle persönlichen Daten in Dokumenten und anonymisiert (= schwärzt) sie für nicht autorisierte Mitarbeiter. Die Funktionalität bietet damit am Ende zwei Versionen von Dokumenten mit Personenbezug an: Eine vollständige Version, die nur von autorisierten Mitarbeitern eingesehen werden kann, sowie eine Version, bei der die persönlichen Daten verschlüsselt werden.

Dots
Weitere Informationen

Weitere Informationen

Sie würden gerne mehr über unsere intelligente Dokumententechnologie erfahren und interessieren sich für die Einsatzbereiche? Kontaktieren Sie uns, wir helfen Ihnen gerne weiter!
MEHR ERFAHREN