Azure AI 文档智能是一种易于使用的工具,但要创建可靠的解决方案,必须深入了解其对象,包括模型、API和工具。在民意调查公司中,评估Azure AI文档智能可以简化数据输入工作流。你需要了解该工具能从不同调查表单中提取哪些数据,以及开发团队如何构建AI数据输入系统,并将其与移动和桌面应用及数据库集成。
本单元将带你了解Azure AI文档智能的功能,以及开发人员如何配置它以支持各种表单和文档。
直到最近,将数据从已完成的表单输入到数据库或任何其他数据存储中,都需要人工手动输入。手动数据输入是一项缓慢且密集的任务,成本可能较高,尤其是当有大量表单需要输入时。人工输入还容易导致错误,降低数据准确性。
尽管手动数据输入曾是唯一选择,因为计算机难以识别打印或手写文本,但AI的普及使得计算机能够高度准确地识别模式(如文本中的字母形状)。我们可以利用AI作为手动数据输入的替代方案,成本更低且错误更少。
Azure AI文档智能是Azure的一项服务,用于分析客户、合作伙伴、雇主等人员完成的表单,并提取其中的数据。
为了确保AI技术积极影响人们的生活,Microsoft在设计和实现AI解决方案时遵循以下原则:
公平性:所有AI系统都应公平对待所有人,无论种族、信仰、性别、性取向或其他因素。
可靠和安全:所有AI系统都应提供具有可量化可信度的可靠答案。
隐私和安全:所有AI系统都应保护敏感数据,并在适用的数据保护法律范围内运行。
包容性:所有AI系统都应对所有用户可用,无论其能力如何。
透明:所有AI系统都应以易于理解且公开的方式运行。
责任:所有AI系统都应由负责这些系统操作的人员运行。
为了遵循这些原则,首先要花时间了解你正在使用的AI系统,并理解它可以执行的操作。例如,在使用文档智能时,请确保使用希望其读取的表单完整测试解决方案,以确保它可以提取所需的数据。确保仅收集表单中所需的数据,并让用户同意存储和分析其信息。获取解决方案的法律建议,尤其是当处理的数据是个人或敏感数据时。继续使用人工代理检查部署的系统,并确保管理员可以干预解决方案以防止危害。持续检查系统安全性及其针对恶意攻击和意外数据丢失的复原能力。
使用模型通知Azure AI文档智能你希望出现在正在分析的文档中的数据类型。如果表单具有通用结构或布局,则可以使用最合适的模型提高结果的准确性并控制输出数据的结构。Azure AI文档智能会以JSON格式输出数据,该格式与许多数据库、其他存储位置和编程语言广泛兼容。
Azure AI文档智能包括多个适用于常见表单和文档类型的预生成模型。如果表单属于其中一种类型,则可以从中提取信息而无需训练自己的自定义模型。使用预生成模型时,可以快速地创建和部署Azure AI文档智能解决方案。
在Azure AI文档智能中,有3个预生成的模型用于常规文档分析:读取、常规文档和Layout。其他预生成模型需要一种常见的表单或文档类型:发票、回执、W-2美国税务申报、ID文档、名片和医疗保险卡。如果有不寻常或唯一的表单类型,则可以使用上述常规文档分析预生成模型从中提取信息。但是,如果要提取比预生成模型支持的内容更具体的信息,则可以创建自定义模型并使用已完成的表单示例进行训练。还可以将基于不同类型的文档训练的多个自定义模型关联到单个模型即组合模型。使用组合模型用户可以将不同类型的表单提交到单个服务识别它们并选择要在其分析中使用的最合适的自定义模型。
作为Azure AI服务Azure AI文档智能是一项高级AI服务支持开发人员快速访问表单中的数据。它基于较低级别的Azure AIS服务(包括Azure AI视觉)构建而成。如果将Azure AI视觉与其光学字符识别(OCR)功能结合使用则可以提交拍摄或扫描的文档并以JSON格式提取其字词和文本。此功能类似于Azure AI文档智能因此很难从这些服务中进行选择。如果想要在没有上下文信息的情况下从表单或文档图片中提取简单的字词和文本Azure AI视觉OCR是一种合适的服务。例如如果有自己的分析代码则可能需要使用此服务但Azure AI文档智能包括对文档进行更复杂的分析例如它可以标识键/值对、表和上下文特定的字段。如果要部署一个完整的文档分析解决方案以支持用户提取和理解文本请考虑使用Azure AI文档智能。如果要在不编写任何代码的情况下试用Azure AI文档智能的许多功能可以使用Azure AI文档智能工作室它提供一种视觉工具可用于探索和了解Azure AI文档智能的功能及其对表单的支持。例如可以使用Azure AI文档智能工作室来分析销售发票并浏览发票预生成模型生成的数据然后决定预生成模型是否提取所需的值还是为更罕见的发票类型创建自己的自定义模型。要将Azure AI文档智能集成到自己的应用程序中需要编写代码例如可以支持销售移动应用的用户使用其设备摄像头扫描收据并调用Azure AI文档智能来获取价格、成本和自定义详细信息应用会将此信息存储在客户关系管理数据库中。Azure AI文档智能包括每个模型类型的应用程序编程接口(API)支持以下语言:C#/.NET、Java、Python和JavaScript。如果希望使用其他语言可以使用其RESTful Web服务来调用Azure AI文档智能。