首批通过!最高评级!学而思九章大模型通过中国信通院教育大模型评估
2024-06-27
随着教育行业数字化转型、智能化升级呈现加速发展态势,教育大模型持续探索与教育各环节进行全面深度融合,全面赋能智能学习、智能教学、智能阅卷等各个核心场景。为推动产业健康持续发展,中国信息通信研究院(以下简称“中国信通院”)人工智能研究所联合业界单位共同编制了教育大模型标准。
近期,在中国信通院组织的首轮教育大模型评估中,学而思“九章大模型”顺利完成了教育大模型评估,获得4+级证书,成为国内首批通过该项评估并获得当前最高评级的企业。教育大模型评估依据《面向行业的大规模预训练模型技术和应用评估方法 第3部分:教育大模型》标准,共计3个能力域,6个能力子域,30余个能力项。标准聚焦教育行业核心需求,形成教育大模型应用成熟度评价方法,便于各方衡量教育大模型的应用能效,助推教育大模型产品升级优化。
【学而思九章大模型介绍】
学而思九章大模型(MathGPT)是好未来自主研发的,以解题和讲题算法为核心的大模型。九章大模型具有四大核心功能,即数学学科的自动解题、复杂应用题的批改,语文英语的作文批改,个性化的AI分步骤讲题。大模型强大的生成、理解能力,既能针对性解决学生的个性化问题,从其不懂的题目映射出相应知识点,并加以补充讲解,使得学生融会贯通,又能在内置大量优质教学资源的同时,向更广泛的学生普及。
图1 学而思“九章大模型”界面
【评估介绍】
教育大模型评估指标覆盖场景丰富度、能力支持度、应用成熟度三大维度,在促进产业发展、提升技术影响力和服务规范等方面具有重要作用。
(1)场景丰富度:关注教育大模型产品覆盖广度,包括学科支持度(数学、语文、物理、化学等)、场景支持度(知识检索、知识问答、自主学习、测评考试等);
(2)能力支持度:关注教育大模型任务支持度和性能优越度,包括计算、问答、分析、创作、总结等能力;
(3)应用成熟度:关注教育大模型安全性、学习性、启发性、记忆性等,包括服务多样性、服务成熟度两个维度。
图2 评估范围
本内容转载自“可信AI评测”,https://mp.weixin.qq.com/s/WpT_IqDih-5pztuaGcq4MQ?scene=25#wechat_redirect