以下产品与 Document AI 共享功能。不过,这些产品执行特定的文本和分析功能。根据您的使用场景,这些产品可能会提供您需要的特定功能。
将图片转换为文本
您可以使用以下任一产品将图片中的内容转换为文本:
- Enterprise Document OCR。
Cloud Vision API(使用
TEXT_DETECTION或DOCUMENT_TEXT_DETECTION枚举)。请参阅:
检测视觉制品
您可以使用 AutoML Vision 对象检测 将图片中的各个部分转换为文本文档。如需了解详情,请参阅图片数据。
对文档进行分类
在获得文档纯文本并预先运行 OCR 后,您可以使用以下产品对文档进行分类和添加标签:
- 预训练的 Natural Language API 可帮助您使用通用类别列表对内容进行分类。
- 使用 AutoML Natural Language 分类创建自定义机器学习模型,并使用您自己的类别标签对内容进行分类。
虽然可能存在例外情况,但通常不建议使用 AutoML Vision 分类进行文档分类,因为它的准确性往往不如基于文本的方法。不过,您可以使用它对图片内容进行分类。
- 通常不建议使用此方法对文档进行分类,因为它的准确率往往不如基于文本的方法,但可能存在例外情况
| Natural Language API | |
| AutoML Natural Language 分类 | |
| AutoML Vision 分类 |
分析和提取实体
您可以使用表单解析器或适用于您的使用场景的任何预训练处理器,识别文档中的已知实体(专有名词,例如公众 人物、公司品牌等)以及遵循常见模式 的实体(例如手机号码和地址)。
- 您还可以使用 Natural Language API 识别常见的公共实体。
- AutoML Natural Language 产品用于实体提取。使用这些产品创建自定义机器学习模型,以识别特定于您的公司或使用场景的实体。
| Natural Language API | |
| AutoML Natural Language 实体提取 |
其他产品
将这些补充产品与 Document AI 集成,以创建完整的文档处理和分析解决方案。
- Vertex AI:将 AutoML 和 AI Platform 整合到统一的 API、客户端库和平台中。
- Cloud Translation API:通过预训练的模型在数以千计的语言对之间动态翻译文本。提供文档翻译 API,用于直接翻译 PDF 和 DOCX 等格式的文档。请参阅翻译文档。
- 工作流:结合使用 Google Cloud 服务和 API 来构建可靠的应用、流程自动化以及数据和机器学习流水线。
- AppSheet Automation:通过开放的云创建自定义自动化和应用。
- Google 云端硬盘的云端硬盘扫描器:借助 Google 云端硬盘 Android 应用,您可以扫描文档并将其上传到 Google 云端硬盘,并获得由 Document AI 提供支持的智能标题建议。
- Google 翻译:这项服务可在英文和另外 100 多种语言之间即时翻译字词、短语和网页。
寻找合作伙伴
借力于我们不断发展壮大的合作伙伴生态系统,帮助您创建和管理文档分析解决方案。如需查看合作伙伴列表及其 提供的服务,请参阅 Document AI 合作伙伴。