相关的 Google Cloud 产品

以下产品与 Document AI 共享功能。不过,这些产品执行特定的文本和分析功能。根据您的使用场景,这些产品可能会提供您需要的特定功能。

将图片转换为文本

您可以使用以下任一产品将图片中的内容转换为文本:

检测视觉制品

您可以使用 AutoML Vision 对象检测 将图片中的各个部分转换为文本文档。如需了解详情,请参阅图片数据

对文档进行分类

在获得文档纯文本并预先运行 OCR 后,您可以使用以下产品对文档进行分类和添加标签:

  • 预训练的 Natural Language API 可帮助您使用通用类别列表对内容进行分类。
  • 使用 AutoML Natural Language 分类创建自定义机器学习模型,并使用您自己的类别标签对内容进行分类。
  • 虽然可能存在例外情况,但通常不建议使用 AutoML Vision 分类进行文档分类,因为它的准确性往往不如基于文本的方法。不过,您可以使用它对图片内容进行分类。

    • 通常不建议使用此方法对文档进行分类,因为它的准确率往往不如基于文本的方法,但可能存在例外情况
Natural Language API
AutoML Natural Language 分类
AutoML Vision 分类

分析和提取实体

您可以使用表单解析器或适用于您的使用场景的任何预训练处理器,识别文档中的已知实体(专有名词,例如公众 人物、公司品牌等)以及遵循常见模式 的实体(例如手机号码和地址)。

  • 您还可以使用 Natural Language API 识别常见的公共实体。
  • AutoML Natural Language 产品用于实体提取。使用这些产品创建自定义机器学习模型,以识别特定于您的公司或使用场景的实体。
Natural Language API
AutoML Natural Language 实体提取

其他产品

将这些补充产品与 Document AI 集成,以创建完整的文档处理和分析解决方案。

  • Vertex AI:将 AutoML 和 AI Platform 整合到统一的 API、客户端库和平台中。
  • Cloud Translation API:通过预训练的模型在数以千计的语言对之间动态翻译文本。提供文档翻译 API,用于直接翻译 PDF 和 DOCX 等格式的文档。请参阅翻译文档
  • 工作流:结合使用 Google Cloud 服务和 API 来构建可靠的应用、流程自动化以及数据和机器学习流水线。
  • AppSheet Automation:通过开放的云创建自定义自动化和应用。
  • Google 云端硬盘的云端硬盘扫描器:借助 Google 云端硬盘 Android 应用,您可以扫描文档并将其上传到 Google 云端硬盘,并获得由 Document AI 提供支持的智能标题建议。
  • Google 翻译:这项服务可在英文和另外 100 多种语言之间即时翻译字词、短语和网页。

寻找合作伙伴

借力于我们不断发展壮大的合作伙伴生态系统,帮助您创建和管理文档分析解决方案。如需查看合作伙伴列表及其 提供的服务,请参阅 Document AI 合作伙伴

接下来怎么做?

  • 了解如何设置 Document AI。
  • HowTo中查找具体指南。