好未来获得2024年“钱伟长中文信息处理科学技术奖”技术发明类一等奖
2024-12-06
日前,清华大学联合好未来完成的《面向开放场景的自然语言生成关键技术及应用》项目,获得2024年“钱伟长中文信息处理科学技术奖”技术发明类一等奖。
开放场景的自然语言生成是指针对同一输入的生成结果具有较强多样性的任务,比如对话生成、故事生成等,是当前最重要也是最具挑战性的应用场景之一。在开放场景的生成任务上,即便是现有最好的大模型在鲁棒性、高效性、长文本生成、质量评价等方面也还存在不少核心挑战。
针对这些挑战,本项目从生成理论、生成方法、评价体系三个方面系统性地突破关键技术,取得了一系列成果,并应用于智慧教育、智能助手和实时翻译,服务了上亿用户并取得了显著的经济效益。
在生成理论上,项目分析了生成文本和人类文本的分布偏差,提出基于全变分距离的生成模型优化目标,使其对噪声更鲁棒,并探索非自回归模型的学习理论,得出训练损失的重要性质,同时引入代理分布以构建非自回归模型的统一训练框架;在生成方法方面,聚焦于知识驱动的长文本自然语言生成方法,围绕知识表示和知识规划开展了系统性研究;在评价体系方面,从数据资源、评价方法、评价模型到应用平台,全面地构建了通用语言生成模型的生成质量评价体系。
“钱伟长中文信息处理科学技术奖”是中文信息处理领域最高科学技术奖,该奖项授予在技术上有重大创新或突破,技术难度很大,总体技术水平和主要技术经济指标达到国内领先水平和国际先进水平,对推动全国中文信息处理行业技术的进步起到重要作用,创造出较大的经济效益或社会效益的项目或个人,由中国中文信息学会钱伟长中文信息处理科学技术奖评奖办公室评定、颁发奖项。
作为国家新一代人工智能开放创新平台承建单位,好未来一直重视在科技创新领域的投入,重视产学研合作。截止目前,好未来已与多所高校开展深入合作,获得了一系列技术成果,并成功应用到好未来多款产品中,顺利完成产、学、研、用一体化。
未来,好未来将继续加强与高校、科研机构的合作,构建“共生”“互生”“创生”的智慧教育生态,助力我国高质量教育体系建设,促进我国教育信息化、智能化进程。