业内首个大模型安全“测评智能体”“蚁天鉴”2.0,商业化怎么样了?

AI百科4个月前发布 快创云
90 0

  蚂蚁数科正加速AI产品的商业化步伐,赋能各行各业解决智能化难题。随着AI大模型和Agent智能体的兴起,它们不仅为人类带来前所未有的智能体验,也带来了新的挑战,如模型内部幻觉、安全漏洞和深度生成内容滥用等。为了应对这些挑战,蚂蚁集团与清华大学携手发布了“蚁天鉴”2.0版大模型安全一体化解决方案。

  相比1.0版本,“蚁天鉴”2.0新增了AI鉴真功能,支持图像、视频等多模态内容的真实性及深度伪造检测。同时,测评功能也得到了全面升级,研发了业内首个“测评智能体”,并新增了大模型X光和大模型基础设施测评两大测评功能。自2023年7月首次发布以来,“蚁天鉴”已经历了1年的迭代升级,如今通过蚂蚁数科开始服务外部客户,标志着其商业化进程的重要一步。

  “蚁天鉴”2.0的“测评智能体”是其一大亮点。该智能体提供全流程自动化的安全测评工具,支持各种形式模型和深度学习框架,能够动态调整攻击策略并出具测试用例,保障测评效果和效率。目前,“蚁天鉴”2.0拥有超过300万的高质量测评题库,支持最高50万/日的饱和式攻击和逐级诱导深度攻击,并能在1个工作日内完成测评,全流程自动化率超过99%。此外,“大模型X-ray”和“大模型基础设施测评”两项新功能的加入,使得“蚁天鉴”2.0能够更深入地扫描模型算法组件及软件系统,及时发现大模型供应链及运行环境安全问题。

  在商业化方面,蚂蚁数科作为蚂蚁集团科技商业化的重要板块,自今年3月份独立化运营以来,一直在推进AItoB战略。SOFAStack、蚁盾等多个代表性产品均发布了与大模型相关的服务,积极助力产业智能化升级。目前,“蚁天鉴”的检测与防御产品已经开放给20家外部机构和企业使用,为通用大模型及医疗、金融、政务等垂直领域行业大模型应用提供安全保障。例如,上海市第一人民医院引入了“蚁天鉴”,有效应对了医疗领域大模型应用中的信息安全与隐私保护、双向内容风险防控等挑战。同时,蚂蚁AI金融助理“支小宝”也结合“蚁天鉴”,通过大模型训练与推理风险管控等措施确保了大模型应用的安全。

  作为国内较早布局大模型安全的厂商之一,“蚁天鉴”自去年7月首次发布以来便备受关注。其1.0版本在2023年世界人工智能大会上被评为“镇馆之宝”。经过一年的升级迭代,“蚁天鉴”2.0构建了双重防御体系,内置防护关注训练阶段的数据清洗和风险抑制;外置护栏则融合智能风控技术,精准拦截输入和输出的风险内容,保障其应用安全。

© 版权声明

相关文章