
南京市教研室
弹弓瞄准口诀-全国教师管理信息系统四川
2023年2月17日发(作者:法治文化建设)人工智能环境下英语口语训练研究
摘要:本课题研究的不是用于鉴别学生语音优劣的系统,而是通过该系统帮
助学生、教师或家长寻找学生在训练英语口语发音过程中存在的问题。通过数据
报表和数据分析,教师可以分析出产生问题的原因,找到有针对性的训练方式、
提供个性化的口语训练资源。同时该系统收集了不同年级学生语音训练过程性学
习数据,以及对学生口语训练数据的智能分析,来帮助教学研究部门研究本地区
学生英语口语能力发展状况和口语能力动态演进情况。
关键词:人工智能,语音训练,语音识别,语音合成。
【中图分类号】G434【文献标准码】B
一、课题研究背景
长期以来,因为缺乏母语环境,小学生英语表达能力相对较弱,哑巴英语的
现象在一定范围内仍然存在。为此,2018年9月至12月,南京市电化教育馆
(南京市教育信息化中心)、南京市教学研究室,借助凤凰智能英语语音训练平
台,举办了南京市首届小学生“讲故事展风采”英语素养展示活动。本次活动使
用微信小程序,搭载人工智能语音评分引擎,并遴选优秀教师研发语音训练内容,
在几方共同努力下,本次活动收到较好的效果。全市23万多名学生参与其中,
130135名学生完成全部语音训练课程,成功收集语音数据8177175条,不仅提升
了我市小学生的英语听说能力,而且为南京市英语听说学习的数据分析打下了基
础。
为了进一步巩固此次活动的成效,促进我市小学生英语表达能力的提升,南
京市电化教育馆与教研室计划从2019年起,逐年开发涵盖英语听说读写4个方
面的数字化资源,与教育教学部门长期合作,开展常态化的英语语音训练活动。
二、课题研究要解决的问题和意义
1.研究问题
问题1:如何基于人工智能自动采集学生口语学习过程性数据?
问题2:如何基于机器学习算法帮助学生、教师或家长发现和诊断学生在英
语口语发音中存在的问题与原因?
问题3:平台如何基于对学生学习过程数据的分析,智能推荐针对性的训练
方式与个性化口语训练的资源?
2.研究价值
1)为中学生口语训练提供智能化学习与训练平台,形成适合南京市小学生
口语训练的语料库,可以为以后开发类似的产品提供更为精准的语音引擎。
2)汇聚大量学生训练单词发音数据、易错音标、练习时长、语速、每天训
练的时段等数据,通过平台数据交叉比对和分析,形成有价值的数学分析模型,
以为教研部门提供实时的学生训练情况数据,了解各个区域和学段学生的口语水
平情况。
3)通过平台的推进,组织了南京市的骨干教师开发系列的口语训练的课程
资源,生成一套完整的适合南京市英语口语训练的资源和体系。
三、课题采用的技术方案及技术路径
课题研究是基于以前开展活动的经验,前面成功的经验告诉我们采用的技术
要与现在流行的技术结合,同时要让用户轻松上手,家长和学生容易操作。基于
上述原因,我们放弃了基于WEB页面和PC客户端的技术路线,决定使用移动端
来作为日常训练的平台,在移动端选择时也考虑到孩子可能会用到家里长辈的手
机,最终确定使用微信小程序作为客户端。
语音引擎是整个平台的关键,在实验研究最初阶段,我们前期使用了微软亚
洲研究院的语音引擎技术,也测试了科大讯飞的语音引擎,但是经过多次实验和
考虑到数据量比较大,从经济的角度出发,最终使用了云知声的语音引擎,同时
对语音合成技术和语意识别做了尝试。
四、课题研究的方法与实施过程
本课题研究过程中,采集了很多具体的数据和使用了很多先进技术,进行了
大量的调研,数据采集,分析和对比。采用的方法主要有文献研究法、调查法、
实验研究法等方法。
课题研究分五个主要阶段:
1、英语口语训练小程序的需求整理和开发。在2020年3月以前,与南京市
教研室合作,完成了需求的整理。2020年6月份招标,并在9月份完成了开发和
测试工作,由于疫情原因,比预计的时间延迟了6个月时间。
2、英语口语训练平台各年级训练题型的确认的和训练题目的准备。在2020
年9月以前,南京市教研室组织了部分名优教师讨论了各个年级的训练题型,主
要有:听力选文本、听力选听力、跟读、复述、情景问答五种题型,并根据译林
出版社教材为三年级至六年级的每个章节出了几套训练题目,请专业人员录制了
语音和制作了插图,完成了题目录入。
3、选择试点学校进行初步试点。在南京市6个区选取了100所学校的三到
五年级的学生进行试点,并对使用情况进行问卷调查。
4、数据采集阶段。前期对试点学校中3万名学生使用数据进行分析和统计。
在2021年6月开始对所有学生开放,并且在9月份开展了两次大型活动,来促
进学生使用这个平台进行训练。并进行了初步分析,得出了一些结论,形成数据
分析结果和统计数据供市、区、校三级的教师参考。
5、为英语教师提供合适的分析结果。目前还在数据整理阶段,在这个阶段,
我们要采集更多不同年龄段学生的数据,调研教师和教研员的需求,来为他们提
供感兴趣的分析数据,帮助老师了解学生的真实情况,有针对性的进行因材施教,
同时能够为学生提供的训练情况报表,分为五个维度,以雷达图的形式显示,为
学生提供练习参考。同时与南京师范大学柏宏权教授,南京邮电大学刘永贵教授,
南京工程大学丁宋涛教授联合研讨,使用大数据挖掘技术对数据进行分析和统计,
研究出适合南京市师生的数据分析的数学模型。
五、课题研究主要结论和观点
通过一年多平台的开发和课题研究,我们总结了如下研究结论:
1、当学生的训练时长超过100分钟后,参与实验学生的口语得分有了明显
的提高,效率也有提高。
2、学生的口语评分标准得到了统一,使南京市级和区级教研部门能够更准
确了解本区域学生的英语口语情况,并能进行横向比较,同时学生本班的任课教
师对本班学生的训练情况有了更准确的了解,能够实现因材施教。
3、“英语蓝鲸灵”在优质教育资源均衡分配上发挥了作用。学生训练的资
源都是南京市名特优教师集体制作,对英语教学薄弱的区域实现了优质资源有益
的补充。
4、人工智能技术助力英语口语训练,明显提升学生英语口语学习效果。
传统的学生口语训练过程中,通常都是通过让学生课堂朗读背诵和课后抽查
课文背诵来进行反馈和检验,而教师的教学通常是凭借经验对学生的发音形成判
断,标准不统一,其科学性不足,同时也无法准确的了解每个学生的语音发音情
况。使用“英语蓝鲸灵”语音训练平台后,可以使用先进的语音引擎的人工智能
技术对学生的每次练习进行记录,通过语音引擎的人工智能算法对学生发音来进
行打分,分析判断训练过程中可能存在的问题,其科学性和准确性得到提高,为
教师教学和学生学习的改进提供“数据化”证据。我们的研究借助于数据来帮助
教师进行分析和归因,其目的是减少盲目性,增强科学性与校正的针对性,提高
口语训练的效率。以前教师因为时间原因,不可能在课堂上检查每个同学的语音
训练情况,通常是采取让学习小组的组长检查每个同学的背诵情况,这样只能知
道学生是否背诵下来,不能够掌握每个学生的发音情况,教师可以回听高分同学
的录音,对每次训练高分的同学只需要抽查就可以,对低分的同学进行当面检查
和纠正发音,这样也能减轻教师和学生的学业负担。
学生跟读训练过程中,所听到的语音都是专业外教的录音,是使用译林出版
社的配套教材的语音资源,具有权威性和专业性,也弥补了部分教师发音不是很
准确的问题。通过采集的学生数据,进行分析后发现,训练超过100分钟以上的
学生,95%的学生口语发音的正确率得到提高。
教师能够实时掌握班级所有学生英语口语的水平,与全区和全市情况的简单
比较。训练平台中的语音引擎自动判分功能,不但对全市所有学生语音评判的标
准实现了统一,也很大程度上减少了教师课间检查学生背诵课文和朗读课文的工
作量,能够通过后台很快发现得分相对较低的学生,可以进行及时当面检查和单
独训练,指导学生训练方法和纠正发音,实现个性化辅导和教学。
我们对南京市小学英语教师发放了问卷调查,共收集了1395份有效问卷,
认为能够正确区分学生口语水平的教师42.65%,不清楚的占46.59%,认为适合
作为学生口语训练平台的占88.89%,对“学生发音错误的单词是哪些”,有
81.72%的老师感兴趣。从这些统计数据我们可以看出,使用过的教师,对学生数
据还是很感兴趣的,并且愿意用这些数据作为教学参考,但是也有部分教师推荐
给学生使用后,自己并没有亲自尝试,说明我们的宣传还有待加强,在培训和推
广活动中让教师了解这个平台并且使用它。
随着平台使用人数的增加,我们对平台使用情况做了统计,通过数据分析,
市教研室对全市学生的学习规律和习惯有了初步的了解,具体的分析数据和结论
我们专门撰写了分析报告《南京市小学生英语口语训练数据分析报告——大数据
分析技术探索线上自主学习的规律》。
研究过程我们还发现,教育资源较丰富并且经济发达的地区,比如鼓楼区、
玄武区、秦淮区使用的学生相对较少,练习时长也相对较少。而经济不发达的区
和教育资源相对较少的区域,比如:六合区、江宁区、栖霞区等,学生使用频率
较高,使用总时长达到300万分钟以上,高于其他区的150万分钟,这些地区由
于家长较少给学生提供校外培训机构补习的机会,学生学习渠道或工具的选择性
小,更加欢迎我们提供的公益性质的“英语蓝鲸灵”小程序,这也证明“英语蓝
鲸灵”在优质教育资源均衡分配上发挥了作用,体现了“政府提供基本服务,市
场提供个性化服务”。
六、本研究中存在的问题和后续研究方向
本课题在推进过程中由于疫情影响,系统的开发和数据的采集受到影响,对
本课题后续的研究影响较大,后面必须对学生数据采集的时间跨度达到一个学期
以上,才能够有明显的分析数据和结果产生,我们计划和南京市教研室合作继续
开展讲故事展风采的活动,这将极大调动学生使用平台的积极性和增加使用人数,
更有利于我们对产生的数据进行更深入的挖掘和分析。
后续与英语学科教师合作,将作为我们的工作重点,找合适的学校作为深度
试点学校,对整年级的学生进行跟踪实验,找到更有效的推进策略,开发出更受
学生和老师喜欢的功能和统计报表。
目前学生训练资源只能满足教材要求的训练内容,数量相对较少,后面的平
台开发工作中主要还是要增加拓展训练内容,增加初中的语音训练资源,为学生
提供更完善的训练平台。
从调查问卷中也有很多老师认为平台很好,也很想使用,但是在“双减”的
环境下,不敢布置手机训练作业和背诵课文的要求,虽然英语学习朗读和背诵是
刚需,但是老师也是左右为难,即使是教育部门推广的公益性质的平台,也只能
推荐自愿使用,没有本班任课教师的督促,学生的使用时长明显低于2018年的
使用情况,这也是后续要考虑的问题,如何让学生自愿使用,采用其他的终端,
避免使用手机小程序无人监管的问题,也是我们要研究的方向。
在人工智能技术使用上,还没有找到合适的算法来根据学生训练中的问题进
行训练资源的精准推送,这也是与高校科研团队和公司技术人员要深入研发的方
向。
【参考文献】
[1]沈训梅.小学英语语音训练策略与实施[J].小学教学参考,2012.33:69
[2]杨洁.英语语音训练新探[J].延安教育学院学报,2003.03:70-71
[3]白娟.语音识别技术在教育教学领域中的应用与思考[J].计算机时代,
2020.07:105-107
[4]王梦景.运用信息技术优化小学英语听说读写训练.试题与研究,
2019.8.14:53
【作者简介】刘晓羽,南京市电化教育馆(南京210029)一级教师。南京市
教育装备招标评委,南京市首席信息官培训组织者。