教育

智能语音技术领跑,驰声如何驱动在线语培?

驰声科技深耕教育行业,实现智能语音技术赋能在线语培

2020年08月13日
调研 | 王璐 撰写 | 王璐
  • 教育
  • 驰声
  • 林远东

驰声是教育领域智能语音测评的行业开拓者,也是中高考英语听说考试测评唯二的供应商之一。基于大数据积累、领先的智能语音技术,驰声以“评分-诊断-反馈指导”的独特研发路径提升英语口语教学练习效率,实现技术赋能在线语培。

对于英语教学者和学习者而言,评判、知晓分数不是终点,提升练习效率和教学质量才是关键。然而,当下超过85%的学习者在英文发音练习时往往错而不自知;同时,在传统大班课堂中,老师无法对每位学生都进行针对性纠音指导,导致学习者容易在同样的地方重复犯错。

实现语培从人力驱动向技术驱动转型,通过技术提升教学效率势在必行。如驰声创始人兼CEO林远东所言,疫情成为撬动行业教学产品服务提供方式变化的重要转折点;技术赋能提效、打通英语教学测评练习场景的价值愈加彰显。

领创“评分-诊断-反馈指导”路径,解决英语教学痛点

驰声在研发路径上走在行业前列,创新性地提出了“评分-诊断-反馈指导”的路径,打造人机交互的口语练习环境。

AI技术在口语测评领域的演进分为3个阶段:第一阶段是建立评测标准,即判断、告知用户发音是否正确;第二阶段是在打分基础上进行个性化诊断,告知学习者发音中哪个音节有问题;第三阶段是给予纠错和反馈指导,让用户有针对性地提升,比如告知用户有问题的原因在于发音不够饱满。目前市面上大多数语音评测公司仍处在“建立标准”的阶段,驰声创新性研发英文诊断纠音内核,率先完成三阶段闭环,不仅能够以丰富的评测维度准确、客观评价学习者的发音、语言能力,也通过智能语音技术解决英语口语评价可视化、需要个性化诊断和反馈指导的问题。

这一独特的研发路径有效提升了教培机构教学互动和作业练习环节效率。在直播课或传统课堂教学场景中,驰声诊断评分内核能够扮演“AI助教”的角色,进行一对一口语陪练,同时将学生的练习音频和得分被实时推送给老师。老师基于成绩报表和纠音报告,可快速了解全班和个体的发音薄弱点,有针对性地当堂讲练,大幅提升教学效率。在作业练习场景中,驰声英文诊断纠音内核接入语言学习产品,助力产品实现智能评测反馈,减少无效练习,提升用户体验。数据显示,某产品接入该内核后,学习者得到满分的总练习次数比先前平均减少3.4次,学习效率和用户满意度大幅提升。

深耕教育场景,全方位赋能教培机构

之所以能率先实现这一研发路径和技术领先,源于驰声扎根教育场景的数据积累与专业性。

数据方面,一方面驰声建设了业界首个可用大规模教育语音云,积累了大量语料数据及应用信息报告;另一方面,驰声近十年间覆盖60%智能语音学习产品,同时是中高考英语听说考试解决方案唯二供应商,并向学校端提供英语听说考辅解决方案,构建多环节、多场景、多维度数据闭环。

技术方面,目前智能语音技术本身已趋于成熟,驰声在技术与教育场景结合的专业性和深度上构建了自身壁垒。例如,在每个音素评测维度或属性的研究与选择、算法的工程化、语料采集与标注、声学模型和评分模型建立上打磨;驰声的评分引擎经过13年上万亿次录音评分,已在各种运行环境中试验。近两年,驰声创新性提出英文单词和句子诊断纠错内核,通过升级误发音检测与诊断(MDD)算法框架提升评分准确性,并通过直接呈现学习者实际发音的音素序列,标记多读、错读、漏读、重复朗读之处,为学习者提供正确发音指导。此外,驰声首创开放题型多维度评估技术,结合词嵌入模型、句法解析、GOP算法、句子边界检测等多种底层技术,突破了行业对于开放题型仅能评总分的瓶颈,可为产品设计提供总分、内容评分、发音评分、语法评分、流利度评分等5大评分维度,给予学习者更丰富、全面、直观的评价反馈。

在场景的落地上,驰声的口语测评技术不仅可用于口语教学和作业练习场景,同时可用于拓客拉新、增值拓展等环节,全方位赋能教培机构。例如,在拓客拉新环节,驰声诊断纠音内核制作游戏化的发音评分小程序和生成纠音诊断报告,吸引客户关注分享,通过优质体验助力缩短消费者购买教育产品的决策时间,实现传播裂变、提升获客转化率。

未来,驰声将双管齐下,借力政策风口扩大考试考辅业务,同时沿着“评分-诊断-反馈指导”的研发思路,致力于研发高自由度的口语对话评测技术,打造可自由对话“AI老师”,助力智能语言学习产品升级,减轻语培人力成本压力;通过将各环节数据打通,在对学生充分理解的基础上规划最优学习路径,实现技术驱动学习者提升口语水平。

近期,爱分析对驰声科技创始人兼CEO林远东进行了访谈,针对驰声科技语音测评技术授权及考试考辅解决方案业务现状及发展策略进行了深度交流,现将专访精选内容分享如下。

智能技术消灭哑巴英语,建设标准和数据闭环

爱分析:疫情带来语培行业哪些明显的变化?

林远东:疫情带来在线教育渗透率提升,也成为技术提供方进入语培市场有利的跳板。疫情成为行业变化的导火索,或者说是撬动行业教学产品服务提供方式变化的重要转折点,因为从教育政策的制定实施者,到老师学生家长、民营培训机构的老师等服务人员,都深深地被迫近距离体会技术、互联网加教育诞生出各种各样新的场景。

过去语培市场在收入规模和学习时长上都是线下占主导,线上语培也是人力主导;但是线上的以人力为核心的语培规模经济问题、商业模式问题一直存在,整个业界一直都在探索和推广技术主导的语培,在不同的赛道上开始出现一些比较成功的探索案例。疫情加速了行业变革,线下的教育培训秩序都受到巨大的挑战和变化,线下传统行业的从业者思想被迫发生改变,扭转寻求线上解决方案,给行业搅动起了不小的水花。

另外,疫情下公立校也发生了一系列化学反应,例如北京提出了停课不停练,从考试反推教学秩序,开学后最先考的就是英语口语,所以驰声成为北京市朝阳区教委疫情期间官方认可的教学工具,帮助公立校为中高考口语考试做练习和准备。

爱分析:您在2007年创业切入智能语音评测领域是如何考虑的?

林远东:创业主要是希望人工智能技术促进学习更高效。我在国内读完大学去英国,虽然在国内学了超过十年英语,在国外用英语做日常交流却非常痛苦;很多我们这个年龄出国留学的人都有这样体会,语法可能学得比美国20%的人更好,但是对于日常会话却表现尴尬。我从自己和身边的华人朋友身上看到消灭哑巴英语的需求,促使我思考在剑桥学到的智能语音技术能否与之一需求结合,通过智能技术让学习更高效。

同时,担任剑桥大学工程系语言中心中文教师期间,我看到英国对于中文交流学习的重视,意识到世界语言交流链接将更加紧密,口语语言的需求会更加旺盛;我希望用自己所学所知,满足市场需求,也为企业增添一些比较独特的竞争优势。

爱分析:目前您对于驰声的定位是什么?

林远东:驰声的口号或者愿景切分成两个半句,第一是智能技术消灭哑巴英语,第二是让学习更高效,所以驰声的愿景短期是消灭哑巴英语,长期是让学习更高效,在教育领域能够通过智能技术让学习更高效的都属于驰声的业务范畴。

驰声的定位首先是技术性的公司,其次是教育公司。短期我们会围绕着英语的听说切入布局,实际上不局限于听说,不局限于英语,甚至不局限于语言。自适应学习教育和技术的结合会由量变过渡到质变,质变的基础是数据,驰声的战略布局要围绕数据,从听说切入技术赋能。

驰声未来的定位是一家建设标准和数据闭环的教育人工智能公司,一家用智能技术和海量数据去推动、践行英语听说能力标准的公司,对外输出的是“标准”。客户选择驰声技术,就意味着承认驰声的评分准确性,评分就是一种标准,考试评分的过程就是将用户的数据往标准上做贴合比较。

驰声的布局是围绕数据来做的,数据驱动自适应学习。中高考政策的出现带来很大的市场风口,驰声通过英语听说这条线切入,通过为中高考英语听说考试提供技术服务,积累终结性评价数据,为学校提供教考练平台,积累单元考、月考、期末考等过程性评价数据,再到为企业客户提供技术赋能服务积累海量日常练习数据,从而覆盖英语听说全环节,再把各个环节的数据打通,基于对学习者深度理解和了解的基础上,给出最优的学习路径,这也是自适应学习的本质。

爱分析:您认为智能语音测评领域目前的格局如何?

林远东:这个行业还很年轻,方兴未艾、群雄逐鹿。智能语音评测行业从2011年开始兴起,基本上是驰声从无到有地推动建立起来的。2016年以后,各种玩家入局,科大讯飞开始做口语评测技术授权,先声也在同年成立,随后,腾讯、百度、网易也纷纷加入战场,这让我心血澎湃,表明这个行业有巨大价值。

推动行业快速成长的驱动力是:2014年教育部高考改革纲要明确外语科目提供两次考试机会,2017年,上海、浙江开始试点外语考试一年两考,考试内容包括笔试和听说测试。2019年全国有15个省已经颁布中考英语听说考试政策,每个省份将有1-3个地级市作为中考口语考试改革的试点,高考可能在中考普及以后的2-3年推进。

政策推动以及众多公司进入会迅速搅动行业升温,原来只有驰声一家在到处鼓吹智能语音测评,现在有很多大的公司在一起推动行业发展,所以可以想象未来很长一段时间会掀起波澜壮阔的故事,行业的格局远未到稳定的阶段。

驰声有13年技术的积累,当前在品牌影响力、客户占有率、收入规模方面依旧是这个领域内最前线的公司,在业内处于相对有利的头部区域,随着行业水涨船高,我们面临的挑战也很大,但机遇远远大于挑战。

研发路径领先,技术赋能教培机构

爱分析:驰声的语音技术授权在教培机构的应用场景如何?

林远东:市场的商业环境很有意思,孕育出很多不同的公司和场景,市场的活跃度远超我们的想象。客户会提出形形色色的要求,促进驰声技术往深度、广度去发展,最后留下一些主流的应用场景,比如作业练习、直播课程、考试服务、绘本朗读、电影配音、营销拓客等等。

我们甚至遇到一些非常有意思的应用场景,比如社交。有一个平台希望通过口语评测技术,让学习者找到和他水平相当的学习者,方便以后交流和学习。

驰声不仅会在研发咨询、场景应用上做建议,还会利用10多年积攒的经验,帮助客户对产品设计、用户体验提一些有价值的建议。比如有的少儿英语产品得知驰声引擎有强大的功能,希望把引擎里所有维度都展示在界面上,我们会劝客户不需要。因为小朋友的感知维度简单,并不喜欢复杂、结构化的东西,用笑脸和哭脸表示练习结果就可以了。孩子只要得到笑脸,得到鼓励,就会持续不断地练习下去。而成人是结构化思维,更愿意去深究哪个音素错了、句末升降调是否准确,并且会重复练习。

爱分析:驰声为何施行独特的“评分-诊断-反馈指导“研发路径?

林远东:驰声的研发路径是指导驰声研发团队一步步向前的指导思想。很长一段时间内,我们在反思口语评测技术提供的价值是什么,最终聚拢到“评分-诊断-反馈指导”三部曲。这几年驰声新研发的英文单词和句子诊断纠音技术、开放题型多维度评估技术都是在践行这个研发思路。

2012年之前,驰声主要做朗读等封闭题型的发音评测,一个星期只有2000次录音;2014年,驰声一周录音次数突破千万人次,增长10000倍。作为技术人员,我们很兴奋,很骄傲。

那时,我做了一件挺有意义的事:我一共拉取了六七次、每次500组用户在短时间内反复练习一个句子或者单词的录音。当我听完这几千个录音后,对结果很失望,因为发现85%的学习者第一次发音怎么错,最后一次还是怎么错。驰声的技术虽然有很多人在用,但是我不希望只帮助了15%的人提升口语水平,还有85%的人在重复错误。

这促使我们去思考如何解决这个问题。其实,口语评测和健康检查有点像,从建立标准开始,什么样的身体是健康、亚健康,通过对每个人体检做个性化诊断,告诉你身体有哪些问题,最后还会给你一个有效建议和改善方向:比如太胖了,就建议加强锻炼,每周做2-3次30分钟的有氧练习等等。我们的评分也一样,首先是建立标准,进行好坏中差评分;其次需要做个性诊断,因为每个学员存在的发音问题不一样,技术可以帮助他们纠正发音、找出错误;最后,反馈给学习者,告诉他们如何有效练习,提高发音正确率。

爱分析:这一独特的研发路径有何价值?

林远东:这是口语评测技术授权行业一个质的飞跃。“评分-诊断-反馈指导”本质上是在做“建立标准- 个性化 - 有效练习”这三件事,这样才能逐步把85%的无效练习降低,最终让有效练习达到85%,甚至90%,从而大量节省学习者的时间,高效地到达他们理想中的口语水平。

在现在这个社会,学会一个东西并不是最高的要求和标准,因为终究总能学会,但是习得效率的高低其实才是衡量学习者能力的标准,因为人的生命是有限的,社会发展越来越快,尽快掌握足够多的专业知识和专业技能,把更多时间投入创作、研发等等,才是教育的意义,也是驱动驰声人不断前进的动力。

爱分析:驰声对于教培机构技术赋能在服务上是如何做的?

林远东:驰声建立了这个行业的标准。驰声有一个比较大的售后服务部门,每个客户都会指定售后工程师全权负责,这些工程师大多拥有PMP认证,对项目管理非常有经验和能力,可以组织好驰声内部资源服务客户,并在这个过程中不断整理、积累知识库,逐步建设成语音授权服务领域的专家体系,这是驰声在行业的核心竞争力之一。

驰声的售后服务在流程上有两大块,服务客户的阶段性比较明显。

第一是签约到上线阶段,签约以后要把我们的技术接入客户产品,中间需要大量技术、开发问题的沟通,比如语言、框架支持等问题。

第二是上线后的售后服务阶段,客户在使用驰声技术的过程中遇到任何问题,都会有相应的售后工程师及时处理。

爱分析:驰声教培机构客户续费情况如何?

林远东:老客户持续扩大合作范围。疫情期间,技术赋能的业务增速非常快,录音高峰数值是去年同期的5.6倍,去年投入几百万扩容,没想到很快就用上,甚至一度临时扩容。驰声采用混合云的模式,可以随时获取更高的计算能力,增加存储和可扩展性,保障用户使用体验。

中高考口语考试唯二供应商,验证技术与服务能力

爱分析:驰声与教育局、学校的合作与教培机构在形式上有何不同?

林远东:我们和在线教育机构合作是技术赋能,比方说提供技术封装能力标准的SDK API,提供给像VIPKID、ABC360、新东方、英语趣配音等数百家客户,把这些技术模块集成到他们自己的产品之中,表现形式有IOS,网页、Linux、Mac,甚至有通过电话录音评分等等。我们提供的是一种能力,这种能力并不能直接展现为产品,需要客户进行二次加工,客户利用自身的开发能力提升融入到产品之中。

但是跟教育局、学校合作是另外的形式,教育局要的是完整解决方案,更关注供应商是否能提供完整的能力和服务。例如2021年某市将施行口语考试,需要驰声直接给出能够实现中考口语考试顺利举办、公平公正测评的整套解决方案。

爱分析:驰声如何触达教育局客户,其需求和教培机构有何差异?

林远东:随着中高考口语考试普及,各地教育局在主动寻找相关口语考试供应商;驰声在口语考试领域已布局多年,形成一定的口碑积累。在高考这一关系国计民生的政策发布时,教育部也经历了详细论证,2012年驰声服务了广东湛江中考口语考试;2013年我们服务了肇庆、中山、深圳、珠海以及青岛;2016年我们服务了沈阳、银川,2017年,驰声参与到北京中考口语考试的技术方案设计和技术验证,2018年我们提供了上海市高考口语考试官方模拟考试系统,2019年我们中标湖北试点城市宜昌中考口语考试,2020年施行了上海市中考口语考试模拟考和考题难度锚定等项目。

中高考口语考试评分技术要求比普通评分场景的要求高很多,和教育局合作如果考试结果出错,就会影响成百上千个孩子的前程,所以在我们这个领域,对每一个百分点小数点的准确率都非常在意。

另外,中国大部分中高考口语考试都有开放题,包括口头作文、故事、看图说话等,正确答案可能无穷无尽,这个领域的技术难度极高。在很长一段时间内,技术上只有驰声和讯飞真正具备在中高考这种高利害关系的口语考试里提供包括封闭题型和开放题型的实施能力,并且有10万人以上大规模考试评分的实施经验。因此,很多教育局会主动找到驰声协助落地教育部和省内推动的中高考政策。

爱分析:考试考辅系统解决方案产品形态如何?

林远东:驰声英语听说正式考试系统主要包含命题制卷、考务管理、考试系统、智能评分四个部分。考前驰声服务主要是考务系统部署对接、考生报名、考场编排、考题录入,考中驰声技术团队会提供现场支持,包括数据收集、异常处理等,考后提供定标评分、分数发布等服务。

从没有口语考试到有口语考试,对学校秩序而言,是一种挑战,因此诞生了模拟考试的需求。以北京朝阳区为例,朝阳区从2017年起在驰声的服务下,实施了几年初中区校联考,后来高中也加入了期中期末区校联考,如今,有的学校每周还会进行周考。今年由于疫情的原因,2020年2月,北京朝阳区教委针对中小学学生短期无法返校复课的情况,紧急部署上线了“朝阳中小学英语听说训练平台”,该平台由驰声提供技术和内容支持,为学生提供网上学习资源及线上辅导,满足了孩子们居家学习的需求。

如今,驰声的产品形态已经慢慢延伸至教学的各个环节,并在这个过程中不断收集教研员、老师的需求,完善解决方案。

未来,驰声也会进行创新,形成新的解决方案。比如现在提到英语听说教学,就需要到机房练习。未来我们会探索让听说从机房走进普通课堂,把老师从机房中解放出来。

技术赋能与中高考产品化并重,拓展自适应教学

爱分析:驰声是否从技术授权向完整的产品和技术解决方案转变?

林远东:政策风口正在逐步落地, 2007到2014、2015年是教育部的中高考政策试点期,2015-2017是政策形成期,现在已进入政策落地期。政策落地本身是基于市场有需求,推动驰声为越来越多的地方提供中高考解决方案,在此过程中,技术也会随着中高考政策普及水涨船高,我们慢慢就会形成技术赋能和中高考产品化两条腿都并重的局面。

爱分析:从测评到整个 AI+教学,技术上是否有共性,能否实现无缝过渡?

林远东:人工智能在业界比较主流的技术流派是机器学习,或者说有监督的机器学习。所谓的人工智能是指通过大量的数据去学习和抓取、逼近人类训练有素的专家水平;比如说我们的口语评测是通过大量的数据把我们逼近人类口语水平的最棒的一批专家。技术的部署相比于人力具有便捷性和性价比,比如全中国能达到这样一个水准的专家可能不超过50个,如果要请这50个人纠正辅助练习大部分人付不起代价,技术的价值在此体现。

驰声的口语评测技术是人工智能技术的分支,只是其应用场景在口语评测方面,我们的核心竞争力或者技术要素第一是机器学习的算法,第二是有足够多的数据。自适应学习本质上是机器学习的应用,通过对学习者在数据基础上充分了解规划出合理的学习路径。

人工智能的口语评测技术和自适应学习本身就是同根同源,只是他们的数据对象、研究的问题对象不一样。通过人工智能口语的技术切入点,能够切入刚需痛点,敦促学习者不断的使用产品,源源不断的诞生数据。只有不断诞生这些数据,并且覆盖不同环节,才可能把学习的环节了解清楚,然后再去进行学习路径规划,所以本质上是能够自然过渡的。

爱分析:驰声未来的市场布局规划如何?

林远东:驰声未来的布局定位是一家建设标准的公司,评分、考试都是在树立标准,所以驰声会坚持以技术赋能为核心,围绕标准构建强大核心能力;另外,我们不排斥通过灵活的资本的手段,无论是控股、参股、合资还是孵化等,以驰声的技术的和标准为基础,衍生出更多的形态,探索一切有可能结合起来消灭哑巴英语、让学习高效的学习方式,更好地满足市场需求。

另外,驰声由于和网龙关系密切,我们也积极探索海外业务,包括在阿拉伯、东南亚,美国等地区,我们一直都在探讨阿拉伯语、日语等多个语种的测评业务;未来我们也不排斥通过合资公司等形式发展其他语种的口语评测。

爱分析即将发布《2020·爱分析中国在线教育行业趋势报告》,欢迎扫码预约领取报告。