近年来,高考、中考作文题目频繁成为网友热议的焦点,大家纷纷好奇,如果让ChatGPT、文心一言等AI工具“上考场”,它们能写出怎样的作文,又能拿多少分呢?而事实上,AI的应用场景远不止于此。在另一场合,进入封闭式管理的阅卷老师们或许正在利用AI进行试卷批改。
据某AI公司透露,一个省份的高考数学试卷通常需要上百位老师耗费一周左右时间批改,而AI则只需20小时。针对数理化生等评分标准相对清晰的科目,基于深度强化学习框架的AI阅卷正逐渐普及,人机一致率已符合预期。网易有道、科大讯飞等头部企业也进入了作文批改领域,但由于“一千个读者眼中有一千个哈姆雷特”,在中高考这类高利害性考试中,AI阅卷仍无法完全取代人工。
教育部办公厅近日印发的《基础教育课程教学改革深化行动方案》指出,针对讲得多做得少、学生对科学技术缺乏内在兴趣等问题,国家将加强实验教学,强化学生动手操作实验,并将实验操作纳入中考。然而,当实验操作直接与升学挂钩时,仅依赖人工评分将面临人力成本高、效率低等问题,难以大规模推广。而AI的介入,则有望解决这些痛点。
以2023年全国各省份高考为例,广东省在6月25日出分,距13日评卷工作正式开始已过去近两周。目前,高考客观题可由光标阅读机扫描处理,但主观题虽实现了无纸化阅卷,判分仍高度依赖人工。数据显示,2023年全国高考报名人数达1291万人,比去年增加98万人,创历史新高。其中广东省报名人数达73.9万人,实际参加考试70万人,需评阅的试卷答题卡约420万份,全省共选聘了近6000名评卷教师。这也让不少教育科技公司看到了AI阅卷市场的广阔前景。
可之科技自2021年起参与到多个省份的高考网上评卷监测工作中,今年更是在20个小时内完成了一个省份全部考生数学学科的辅助阅卷工作。该公司基于自主研发的深度强化学习框架,不断提高复杂手写识别精确度、主观题型批改准确度。目前,AI已可以自动穷举题目的全部正确解法,判断考生作答逻辑以及最终结果的正确性并给出评分,辅助人工评卷结果的验证。
除了数学科目外,网易有道和科大讯飞等企业也在AI阅卷赛道上积极布局。网易有道上线了中文作文批改服务,科大讯飞的智能评卷系统则基于手写识别、自然语言理解等AI核心技术研发。目前,科大讯飞已在大学英语四六级、部分省份中高考等场景开展试点,辅助人工阅卷。
对于语文、英语等科目而言,虽然也有落地案例但困难不在于技术水平达不到而是每个人有不同的审美品位AI评分结果不容易被完全认可。深圳市政协常委、码隆科技CEO黄鼎隆表示:“越能有一个清晰、细致、可量化的评分标准AI阅卷就越可信因此数理化生的AI阅卷相对更容易实现。”
在实验操作场景下AI也发挥着重要作用。深圳现行的初中物化生实验操作考试单科实验考核时间为5分钟大致有即考即评、先考后评两种形式。后者以视频记录考试全程老师回看视频评分效率有所提升但所需的人力成本仍居高不下。而码隆科技的“教考评”一体化智慧实验解决方案则利用全局摄像头、细节摄像头等硬件以及相关算力算法精准检测并在视频中标注出操作失误予以扣分后教师可在AI评分基础上复核成绩极大减轻阅卷负担。
虽然对算力算法的要求更高但好在物化生实验操作的评判标准相对清晰且近年来相关AI技术屡有突破性进展AI实验测评的落地也在快步推进。据预测在AI阅卷这一新兴赛道上实验操作测评或将催生一片新蓝海。同时学校也在积极配置实验教学和测评的器材、设备、试剂以及大数据管理平台确保基础性实验开足开齐拓展性实验比例不少于50%。