次のプロダクトは、Document AI と同じ機能を備えています。ただし、これらのプロダクトは特定のテキストと分析の機能を実行します。ユースケースによっては、これらのプロダクトが必要な特定の機能を提供している場合があります。
画像をテキストに変換する
画像内のコンテンツをテキストに変換するには、次のいずれかを使用します。
- Enterprise Document OCR
Cloud Vision API(
TEXT_DETECTIONまたはDOCUMENT_TEXT_DETECTION列挙型を使用)。次のように表示されます。
視覚的なアーティファクトを検出する
AutoML Vision オブジェクト検出を使用して、 画像の一部をテキスト ドキュメントに変換できます。詳細については、画像データをご覧ください。
ドキュメントを分類する
ドキュメントのプレーン テキストと OCR を事前に実行しておくと、次のプロダクトを使用してドキュメントを分類してラベル付けできます。
- 事前トレーニング済みの Natural Language API を使用すると、一般的なカテゴリのリストを使用してコンテンツを分類できます。
- AutoML Natural Language Classification を使用してカスタム機械学習モデルを作成し、独自のカテゴリラベルでコンテンツを分類します。
例外もありますが、AutoML Vision Classification は一般的にドキュメントの分類には推奨されません。テキストベースの方法よりも精度が低くなる傾向があるためです。ただし、画像コンテンツの分類には使用できます。
- 一般的に、ドキュメントの分類には推奨されません。テキストベースの方法よりも精度が低くなる傾向がありますが、例外もあります。
| Natural Language API | |
| AutoML Natural Language Classification | |
| AutoML Vision Classification |
エンティティの分析と抽出
Form Parser またはユースケースの事前トレーニング済みプロセッサを使用して、ドキュメント内の既知のエンティティ(著名人、企業のブランディングなどの固有名詞)と、電話番号や住所などの一般的なパターンに従うエンティティを識別できます。
- Natural Language API を使用して、一般的な公開エンティティを識別することもできます。
- AutoML Natural Language プロダクトは、エンティティ抽出用です。これらを使用して、企業やユースケースに固有のエンティティを識別するカスタム機械学習モデルを作成します。
| Natural Language API | |
| AutoML Natural Language Entity Extraction |
その他のサービス
これらの補完的なプロダクトを Document AI と統合して、完全なドキュメント処理と分析ソリューションを作成します。
- Vertex AI: AutoML と AI Platform を一つにまとめたもので、統一された API、クライアント ライブラリ、プラットフォームを提供します。
- Cloud Translation API: 事前トレーニング済みのモデルを使用して、数千もの言語ペアでテキストを動的に翻訳します。PDF や DOCX などの書式のドキュメントを直接翻訳する Document Translation API を提供します。ドキュメントを翻訳するをご覧ください。
- Workflows: サービスと API を組み合わせて、信頼性の高いアプリケーション、プロセス自動化、データ パイプラインと機械学習パイプラインを構築します。 Google Cloud
- AppSheet Automation: オープンクラウドでカスタムの自動化とアプリケーションを作成します。
- Google ドライブのドライブ スキャナ: Google ドライブ Android アプリを使用すると、ドキュメントをスキャンして Google ドライブにアップロードできます。また、Document AI を活用したインテリジェントなタイトル候補が表示されます。
- Google 翻訳: このサービスでは、単語、フレーズ、ウェブページを英語から 100 以上の他言語にすぐに翻訳できます。
パートナーを探す
拡大を続ける Google のパートナー エコシステムを活用して、ドキュメント分析ソリューションの作成と管理に役立てましょう。パートナーと 提供サービスの一覧については、 Document AI パートナーをご覧ください。