Der Formularparser extrahiert Schlüssel/Wert-Paare, Tabellen, Auswahlmarkierungen (z. B. Kontrollkästchen), generische Felder und Text, um die Dokumentverarbeitung zu erweitern und zu automatisieren.
Der Formularparser kann gegenüber anderen Parsern in folgenden Anwendungsfällen in Betracht gezogen werden:
- Verarbeitung strukturierter Formulare: Er eignet sich hervorragend zum Extrahieren von Schlüssel/Wert-Paaren aus klar definierten Formularen, die wie herkömmliche Formulare mit beschrifteten Leerstellen zum Ausfüllen aussehen, z. B.
name: __. Das vortrainierte Modell des Formularparsers bietet eine hohe Genauigkeit für gängige Felder wie Namen, Datumsangaben und Adressen. - Flexible Tabellenextraktion erforderlich: Der Formularparser extrahiert Daten aus einfachen Tabellen (ohne Zellen, die sich über Zeilen oder Spalten erstrecken), die wie Tabellen aussehen. Es ist kein Training erforderlich (und auch nicht möglich). Für die trainierte Tabellenextraktion kann der benutzerdefinierte Extraktor mit einem übergeordneten Feld verwendet werden, das untergeordnete Spalten- (Zellen-)Felder enthält.
- Effizienz erforderlich: Sie müssen keine Extraktionsparser erstellen und verwalten, insbesondere nicht für umfangreiche und vielfältige Extraktionsaufgaben.
Funktionen zur Datenextraktion
Die Funktionen des Formularparsers umfassen:
Schlüssel/Wert-Paare : Dies sind Sätze aus zwei Elementen in einem Dokument: ein Label oder Schlüssel und die entsprechenden Daten (ein Wert). Sie können Schlüssel/Wert-Paare direkt verwenden (wenn die Schlüssel einheitlich sind) oder benutzerdefinierte Logik erstellen, um unterschiedliche Schlüssel in einheitliche strukturierte Informationen aufzulösen.
Generische Entitäten:Sie können 11 verschiedene Felder aus Dokumenten sofort parsen. Dazu gehören:
emailphoneurldate_timeaddresspersonorganizationquantitypriceidpage_number
Text und Layout:Mit unserer neuesten OCR-Engine können Sie Text- und Layoutinformationen extrahieren. Dazu gehören eingebetteter Text aus digitalen PDFs (nur Version 2.1) oder Text aus Bildern.
Tabellen:Sie können Tabellen aus Bildern und PDFs erkennen und extrahieren.
Kontrollkästchen:Ein hochwertiger Detektor für Auswahlmarkierungen, der Kontrollkästchen aus Bildern und PDF-Ausgaben als Schlüssel/Wert-Paare extrahiert. Dabei wird der Text verwendet, der sich am nächsten am Kontrollkästchen befindet. Mit
valueTypewird angegeben, ob das Kontrollkästchen aktiviert oder deaktiviert ist.
Sprachen und Regionen
- Der Formularparser 2.0 unterstützt über 200 Sprachen. Weitere Informationen.
- Wir bieten Funktionsunterstützung in acht Regionen. Weitere Informationen.
Modellversionen
Die folgenden Prozessorversionen sind mit dieser Funktion kompatibel. Weitere Informationen finden Sie unter Prozessorversionen verwalten.
Beschränkungen
Frühere JPEG-Komprimierungen für TIFF werden nicht unterstützt. Die Art der JPEG-Kapselung wird durch die TIFF Version 6.0-Spezifikation definiert.
Das Kontrollkästchenmodell unterstützt das Parsen von Optionsfeldern nicht. Einige erkannte Kontrollkästchen haben möglicherweise keine entsprechenden Schlüssel.
Das Modell parst ein Schlüssel/Wert-Paar mit einem leeren Wert, z. B. ein leeres Formular, nicht zuverlässig.
Die Qualität des Parsens von Schlüssel/Wert-Paaren in Dokumenten in bestimmten Sprachen ist möglicherweise geringer als bei lateinischen Sprachen.
Dokumente mit Formularparser verarbeiten
In dieser Kurzanleitung wird das Feature „Form Parser“ in Document AI vorgestellt. In dieser Kurzanleitung richten Sie mit der Google Cloud Console Google Cloud Ihr Projekt und Ihre Autorisierung ein, erstellen einen Formularparser und senden dann eine Anfrage zur Verarbeitung eines PDF-Formulars an Document AI.
Sie erfahren, wie Sie:
Aktivieren Sie Document AI in einem Google Cloud -Projekt.
einen Formularparser-Prozessor erstellen, der Text, Schlüssel/Wert-Paare, Tabellen und generische Entitäten aus vielen Dokumenttypen identifizieren und extrahieren kann
den Prozessor verwenden, um ein Beispieldokument zu annotieren
Eine detaillierte Anleitung dazu finden Sie direkt in der Google Cloud Console. Klicken Sie dazu einfach auf Anleitung:
- Melden Sie sich in Ihrem Google Cloud Konto an. Wenn Sie noch kein Konto haben Google Cloud, erstellen Sie ein Konto, um die Leistung unserer Produkte in der Praxis sehen und bewerten zu können. Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
Enable the Document AI API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
Enable the Document AI API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.
Formularparser-Prozessor erstellen
Verwenden Sie die Google Cloud Console, um einen Formularparser-Prozessor zu erstellen. Weitere Informationen finden Sie unter Prozessoren erstellen und verwalten.
Klicken Sie im Google Cloud Navigationsmenü der Console auf Document AI und wählen Sie Prozessorgalerie aus.
Suchen Sie in der Prozessorgalerie
nach Formularparser und wählen Sie Erstellen aus.
Geben Sie im Seitenfenster einen Prozessornamen ein, z. B.
quickstart-form-processor.Wählen Sie die Region aus, die Ihnen am nächsten ist.
Klicken Sie auf Erstellen.
Sie werden zur Seite Prozessordetails für Ihren neuen Formularparser weitergeleitet.
Testprozessor
Nachdem Sie den Prozessor erstellt haben, können Sie Annotationsanfragen an ihn senden.
Laden Sie das Beispieldokument herunter.
Es ist eine PDF-Datei mit einem Beispiel einer handgeschriebenen medizinischen Datenaufnahme. Dieses Dokument wird in einem öffentlich zugänglichen Cloud Storage-Bucket gespeichert.
Klicken Sie auf den Button
Testdokument hochladen und wählen Sie das Dokument aus, das Sie gerade heruntergeladen haben.Sie sollten sich jetzt auf der Seite Analyse des Formularparsers befinden. Sie können sich den aus dem Dokument erkannten Text sowie die Schlüssel/Wert-Paare, Tabellen und allgemeinen Entitäten ansehen.
Bereinigen
Um unnötige Google Cloud Gebühren zu vermeiden, verwenden Sie Google Cloud console , um den Prozessor und das Projekt zu löschen, wenn Sie diese nicht mehr benötigen.
Nächste Schritte
- Sehen Sie sich die Liste der Prozessoren an.