Azure AI 搜索中的新增功能

AI百科4个月前发布 快创云
43 0

Azure AI 搜索功能更新及文档示例概览

最新功能更新

  • 更名通知:Azure 认知搜索现已更名为 Azure AI 搜索,以更好地体现其在 AI 领域的强化功能。
  • 网络安全强化:新增网络安全外围功能,通过 Azure 门户和管理 REST API(2024-06-01-preview)可查看和配置,以控制对搜索服务的网络访问。
  • 共享专用链接支持:Azure AI 服务连接的内置技能处理现在支持通过共享专用链接进行专用连接。
  • 矢量重新评分选项:提供了使用原始矢量而非压缩矢量进行重新评分的选项,适用于 HNSW 和详尽 KNN 矢量算法。该功能在创建或更新索引(2024-11-01-preview)、Azure 门户及 Azure SDK beta 包中提供。
  • 存储优化:在矢量压缩方案中,如果不需要全精度矢量进行重新评分,则可省略其存储,该功能同样在预览版本中提供。
  • 语义重排器查询重写:允许在语义查询上设置选项,将查询输入重写为修订或扩展的查询,以生成更相关的结果。该功能也在预览版本中提供。
  • 新语义排序器模型:语义排序器在所有支持区域中运行改进模型,API 和门户体验保持不变。
  • 文档布局技能:用于分析文档结构的新技能,提供结构感知(段落)分块。此技能调用文档智能并使用其布局模型。
  • 无密钥计费:使用托管标识和角色进行 Azure AI 服务的无密钥连接,消除在同一区域中同时提供搜索和 AI 服务的限制。
  • Markdown 分析模式:索引器可从 Azure 存储和 OneLake 中的 Markdown 文件生成搜索文档。

API 更新

  • 2024-11-01-preview 提供了查询重写、文档布局技能、无密钥技能处理计费、Markdown 分析模式及矢量重新评分选项的 REST API 预览版本。
  • 2024-09-01-preview 包括 text-embedding-3 模型中的截断维度、混合查询的目标矢量筛选、RRF 子分数详细信息及文本拆分技能的标记分块等功能的预览 API。

门户及工具更新

  • 门户对结构化数据的支持增强,现支持从 Azure SQL、Azure Cosmos DB 和 Azure 表存储导入数据。
  • 调试会话得到改进,现在可以调试集成矢量化及数据分块工作负载,且新的设计使技能和映射的呈现更直观。
  • 稳定发布 2024-07-01 REST API,支持矢量数据类型、矢量压缩及索引和查询期间的集成矢量化。

新功能发布

  • 集成矢量化矢量化器AzureOpenAIEmbedding 技能索引投影均宣布正式发布。
  • 二进制和标量量化窄数据类型也正式发布,以优化矢量索引的内存和磁盘占用。
  • 导入和矢量化数据向导在 Azure 门户中宣布正式发布,支持包括数据分块和矢量化在内的完整索引管道创建。

基础设施与容量提升

  • 标准层(S2、S3 及 S3 HD)的分区大小增加,适用于大多数区域的新建服务。存储优化层(L1 和 L2)也增加了容量,但须创建新服务以享受更高容量。额外容量已在多个区域提供。
  • OneLake 集成(预览版)支持将外部数据从 AWS 和 Google 数据源导入搜索索引。

安全与访问控制

  • API 响应不再返回连接字符串或密钥,以保护 Azure 资产免受未授权访问。
  • 基本层和标准层上的存储量显著增加,每个分区的计费费率相同。

示例与演示

  • 提供新的端到端示例,展示与 Cohere Embed v3、OneLake 及 Azure AI Vision 多模式 API 的集成。
  • 发布了多个视频和示例代码,演示矢量搜索和语义排名如何改善 AI 响应的生成及概念与关键字的搜索体验。
© 版权声明

相关文章