阿里云助力金数据打造新时代的AI考试系统——大模型加持让出题效率千倍提升

AI百科2个月前发布 快创云
37 0

  随着企业服务行业的发展进入平缓期,个性化、定制化的解决方案成为越来越多企业的追求。对于坚持PLG(Product-Led Growth)模式的企服公司来说,产品面临着更严苛的评判标准。一方面,产品需要更加易用,用户能够自行上手并快速体会到产品价值;另一方面,产品需要在“降本增效”的金标准中表现更加突出,以撬动用户付费来支撑业务的正向循环。

  金数据作为全网TOP级别的问卷表单企服公司,自2012年成立之初就开始使用阿里云打造线上数据收集管理的企服产品。目前,金数据拥有1200万存量用户,与5000余家企业单位达成深度合作,成功实现了用户增长和付费闭环的验证。

  在AI浪潮下,金数据借助通义大模型,推出了“金数据AI考试”PLG产品。自4月上线以来,线上用户数已经破万,日调用token万级别,成为企服赛道AI落地应用的一匹黑马。在第五季阿里云Create@AI创客松大赛中,“金数据AI考试”脱颖而出,荣获“阿里云通义最佳伙伴奖”。

  本期「看见新力量」栏目与金数据CTO冯智超进行对话,由他带我们走进AI企服应用落地的实践之旅。

云服务:中小企业的创新基座

  金数据的创立源于团队的亲身经历。金数据团队中超过一半是产品研发技术人员,核心团队成员大多曾在ThoughtWorks软件咨询公司工作。他们发现,尽管当时的软件和互联网已经相当发达,但许多小团队和个人的业务需求仍未被IT技术充分满足。例如,一位行政同事需要使用邮件和Excel表格来收集并统计一百多个同事所需的颜色和尺码。这次经历让冯智超和团队想到,为什么不创建一个可以轻松收集和管理信息的在线工具呢?于是,“金数据”应运而生,成为国内最早做在线表单的一批人。

  2012年,“上云”并未像现在一样普及,但金数据从一开始就选择了云服务。技术出身的冯智超和团队清晰地意识到,国内市场环境变化非常快,公司业务可能过一段时间就会发生很大的变化。对中小团队来说,一次性做一个大项目或者买断一个软件将产生非常高的沉没成本。而云服务的方式可以为业务提供灵活的支撑。冯智超坦言:“虽然云服务单价成本可能会高一些,但是拉长来看的话,周期的成本,云服务肯定是低于一次性投资项目的。”

  基于在线表单工具的产品特性,金数据选择了阿里云CDN、短信邮件等服务。阿里云CDN通过全球3200+节点及智能调度系统,让用户可以就近访问海量静态资源,实现毫秒级响应。阿里云国内短信支持三网合一专属通道,电信级运维保障。在阿里云产品支持下,金数据服务稳定性显著提升,可靠性SLA达到99.95%以上。

  冯智超认为,除了产品服务能力外,更重要的是在云市场还未成熟的阶段,阿里云的品牌背书为业务开展提供了很大的便利:“当时的一些用户对云服务形式的隐私安全有很大疑问和顾虑。我们需要和SaaS所有的云服务商一起去完成用户的教育。阿里云作为行业的领头羊能够提升用户对产品安全隐私方面的信心。”

  稳定的云服务支持让金数据实现了产品功能的完善和用户的突破增长。用户可以通过金数据实现调研、预约、登记、获客、抽奖、投票、考试、订单等场景功能使用。金数据表单高度自定义的功能模块还可以帮助用户轻松搭建业务流程线上系统无需开发。至今金数据为来自各行各业的中小及头部企业、高校及研究所、政府单位等组织提供线上数字化平台搭建服务。

  在此基础上金数据推出的“浩客HowXM”产品针对企业用户提供应用调研、评价、通知工具用户只需要嵌入一段简单的代码就可以在自己的APP内智能生成问卷。随着云服务的进一步成熟“浩客HowXM”基础设施都布置在了阿里云上据冯智超估算通过使用阿里云ECS、数据库、消息队列、对象存储、CDN等服务“浩客HowXM”整体成本降低了50%左右。

大模型:让AI产品设想成为现实

  在服务企业用户的过程中冯智超和团队察觉到AI考试系统是一个充满机会的赛道。如今很多企业或组织都面临着高频率的知识和技能更新他们需要一个工具来确保团队成员可以不断提升专业和知识技能。在过去企业需要专门的人员来负责培训根据新的知识文档来准备试卷。

  冯智超分享了一个客户案例:一个负责企业安全生产的用户每个月都需要组织全公司的安全生产培训考核。在之前企业需要手工地把培训考试的题目一道题一道地添加到金数据中虽然提供了通过excel导入的功能但是按照规定的格式创建excel并录入好几百道题可能需要花一周的工作时间。“事实上在我们之前的金数据产品中在线考试已经是一个非常重要的应用场景。”团队选择了“智能出题”这个最小最有效的点来做创新希望利用大模型能力实现出题效率的提升。但在2023年大模型技术受到关注的初期这个尝试失败了。

  “AI在To B领域的落地更复杂要求也更高。”冯智超分享道客户可能需要一次性导入500道题的题库大模型需要高准确度地完成文本切分同时面对千差万别的数据格式需要准确地将非结构化数据转化为结构化数据“这对大模型指令遵循能力、上下文理解能力、逻辑能力都提出了很高要求。”当时的大模型技术并没有交出让团队满意的效果。

  “今年随着AI技术特别是大模型的进一步成熟通过大模型提升AI考试的效率变得非常有价值。”借助阿里云通义大模型冯智超和团队希望打造的AI Native产品“金数据AI考试”得以实现智能功能的落地。

  具体来说“金数据AI考试”通过大模型Prompt Engineering创建了Data Extraction能力并建立自动化评估机制用来迭代提升LLM的输出质量并建立回归体系将用户任意的文档(非结构化数据)转换为在线题库(结构化数据);通过使用Long Context和文本的split/chunk来提升出题的数量解决大模型输出max_token的限制;对于新的知识点(基础模型训练后更新的数据)通过使用Function Calling和RAG技术来增强题目的实时性和准确性消除大模型的幻觉;通过Agent技术包括用户输入内容判断、网络搜索、不同场景出题的Agent、题目质量检查等workflow增强整体出题的质量。

  最终“金数据AI考试”可以实现一键导入文本、智能解析生成题库、30秒内自动完成出题组卷的智能化出题。“我们最快可以做到1分钟出400题准确率100%。这在过去可能需要人工数天才能完成并且准确率在98%左右题目录入还需要花费成本。”冯智超表示“通过AI大模型我们真正实现了百倍甚至千倍的效率提升。”

  据悉贵州某银行内部学习平台使用“金数据AI考试”上传《洗钱和恐怖融资风险管理办法》生成考试题目万字文档AI出题只需两分钟。陕西某职业技术学院导入党纪学习相关文本资料AI自动生成题库组织“党纪学习每日答题测试”使用系统半个月1900+位考生共参与考试3400余次。

AI拉开序幕:变革刚刚开始

  “金数据AI考试”显著提升了企业培训考试的效率但冯智超认为它的意义远不止于此。

  “对于AI来讲还有一个挑战就是如何落地这可能也是行业内共同的一个痛点。”冯智超提到今年阿里云钉钉AI的发布会提到了一个词是“AI Ready”企业用户都是一个嗷嗷待哺的状态知道AI很强但是不知道怎么能够用起来。“所以这次我们的AI考试也是一个可以直接提供落地的AI ready产品。”冯智超和团队希望“金数据AI考试”迈出AI落地应用的第一步拉近用户和AI的距离。

  为此“金数据AI考试”特别强调用户可以快速上手作为一个SaaS产品直接做到了在线产品用户注册后就可以理解体验智能出题等能力并且推出了一个小程序移动端的用户也可直接使用快速体验到AI带来的能力。

  对于To B领域来说AI带来了两个全新的优势:内容创造和新的交互方式。对于现有用户来说这将大幅提升效率更重要的是它可以帮助企业接触到之前无法触及的用户群体。

  冯智超表示“金数据AI考试”的未来规划也将围绕这两个关键点展开。“对于我们来说在能提升效率和真正解决用户痛点的地方我们会加入AI的创造力和交互能力。对于AI考试来讲它不仅仅是智能出题未来可以提供更多的是个性化学习、自适应的学习系统。”一切的实现依然离不开大模型技术的进步。冯智超并不避讳现在的大模型功能还未尽完善开发者需要结合通义大模型和自身的工程解决方案这使得最终产品要达到优秀的体验和交互仍有一定难度。展望未来大模型承载了更多的期待:“现在像千问这样的通义大模型已经在很多方面改变了我们的开发和业务模式但展望未来我们希望在更多场景中看到更深入的应用。”

© 版权声明

相关文章