科技赋能教育,AI+教育如何结合?

 

随着AI技术应用的深入,传统的学习方式会被革新,未来将是“人工+智能”的学习模式。...



港粤资本,引领家庭新生活
港粤资本

专注教育及消费领域的早期投资

旗下直投基金、跟投基金、产投基金

关注“改变消费者家庭生活“的创新性项目

致力于培育和孵化行业创新性企业

成为行业领军者

极速BP通道:bp@ifsc-gd.com




前有互联网+,现有AI+。“AI+教育”的出现让传统教育模式正发生积极的变化,学校“围墙”的概念正在被打破,新的科技革命正推动授课方式、教育场景的变革,未来教育将变得更加个性化和智能化。

那么,AI怎么和教育进行结合?我们从图像识别、声音识别、文字处理、自适应学习等不同的角度来探究人工智能技术与教育产业的结合点有哪些。

图像识别技术

目前使用图像识别最主流的应用就是拍照搜题,这也是2014年到2015年投资最为火爆的,典型代表是大家所熟知的作业帮、学霸君、小猿搜题、阿凡题等企业。

这类软件都是借助了智能图像识别技术,学生遇到难题时只需要用手机拍成照片上传至云端,系统在一到两秒内就可以反馈出答案和解题思路。

拍照搜题的技术点主要由图像识别和内容搜索组成,将拍照图像中的文字或者图形识别出来,再交给检索系统,对已有的题目进行快速的搜索,和已有题库匹配,找出最相似的题目。

人们对拍照搜题的应用是存在争议性的。学生一般是带着问题和困惑来拍照搜题,但是学生拍拍照就能直接知道答案了,这很容易让学生依赖该工具,特别是自主性较差的学生。

他们只想迅速知道答案,而缺乏主动性的思考,长此以往,孩子必然会对答案产生惯性依赖的心理,不利于培养孩子解题的独立思考能力,因此并不受到家长们的认可。

除了拍题识别以外,手写识别准确率也逐渐在提高。未来,当底层的技术能以更高的准确率和更好的交互体验识别画面里的物体时,可以预见图像识别与教育的结合将改变学习场景和提高学习效率。
自然语言处理(简称NLP)

文字处理,也就是所谓自然语言处理,在传统教育的最大应用就是自动批改作业和解题。

语音识别和语义分析技术的进步,使得自动批改作业成为可能。

机器可以自动识别纠错,甚至是提出修改意见,自动批改的结果生成错题集,并根据学生的错题自动推荐题目,满足学生的个性化需求,也把老师从低效的重复性劳动中解放出来,大大提高老师的教学效率。

借助自动批改口算作业的产品“爱作业”,用户只需拍照或相册选择口算照片上传检查,爱作业将在1秒内给出检查结果,对有错误的题目进行高亮标注。
不同的题型,不同的文体,其处理难度也是不同的。

比如大部分的数学问题的选择题,我们常用的是对数学对象的识别,包括专有名词、公式符合、习惯表达等,转化成一个“条件、问题、选项”的符号化表述。

有了这样的符号化表述,就可以使用训练好的推理引擎,来进行解题判断过程。
这一题的条件是“全集R,集合A”,问题是“求A的绝对补集”,四个选项都是集合


类似于这样的、大量的基础性题目,其文本处理和符号化过程,就是基本的专有领域的自然语言处理任务,难度是一般的。

相较于批改选择判断题,应用题对机器的深度学习能力和智能能力就要求更高了。
例如上图的这个例子,只识别出学生手写笔迹,还无法完成自动批改,因为标准答案是有很多种变形的,同一个标准答案,不同的表达方式可能都是正确的。

一个答案往往是有十几种变形的,这背后需要有大量的教研基础知识,系统识别出标准答案后,通过数学符号语言处理等算法,自动生成所有的同义表达式。

将学生笔迹的最终答案,与标准答案的所有同义表达式进行匹配比较,找到结果一致的表达式。匹配的过程还需要考虑到,学生笔迹的最终答案有可能有一些冗余文字。

语音识别技术

语音识别技术在教育上最主流的应用是智能语音测评。

用户可以跟读内容,软件对发音做出测评,基于完整度、流利度、准确度在内的维度来打分,指出发音不准的地方,典型代表是科大讯飞、先声教育、英语流利说、盒子鱼……

对于学生而言,测评不是目的,软件提供准确的打分的同时,还能提供非常详尽的,小到音素发音分、单词发音分、单词重音检错,大到句子语调、语速信息的问题反馈,让学生可以第一时间发现自己的问题,从而以最高的学习效率,提高知识水平才是最终目的。

目前绝大多数市面上的口语学习App的口语评测的水平就是评判规定的一句话的发音准确度,或者是半开放式的交流。

而真正的难点是评估开放性的对话的好坏,比如和SIRI像朋友一样聊天的场景。

据悉,讯飞是已经在这个方向上与国家多个省签约合作,尝试做高考开放式口语题目的自动批改。

落地上,语音识别另一个难点是对于噪音信号处理的问题。

比如说语音识别技术在噪音嘈杂或者是麦克风离得比较远的时候,效果要差很多,深度学习技术的应用对于这一问题有一定的改善,但仍然存在很大的发展空间。
自适应学习

自适应学习系统有着“大数据”+“机器学习”的炫酷外衣,又暗合儒家文化中“因材施教”的核心理念,让投资人听着就不明觉厉。

广义上讲,任何能够通过学生做题对错、学习行为的反馈,评估其知识点的掌握程度,来推荐不同题目或知识点的系统,都有着‘自适应学习’的功能。

但基于NLP、深度学习等技术深度的不同,自适应学习系统可以分为三个层次:

第一种是基于规则的自适应学习

基于规则的自适应学习,是最简单的自适应学习系统,系统预先设定学习路径,通过简单的路径设定来指导学习过程。

系统遵循“因为A所以B”的逻辑,其本质是决策树,适用场景是那些不去判断学生是否掌握某种知识,而是直接去判断学生的某种行为是否是不对的。

比如,计算机模拟汽车驾驶,学生闯红灯了,扣分,然后告诉学生,你要注意红绿灯。学生左转忘打转向灯了,扣分,然后告诉学生,你要记得打转向灯。
基于规则的自适应学习


第二种是基于难度等级的自适应学习

第一种自适应学习里,通过学生的行为直接指出学生的问题。

如果我们不去规定,学生什么具体行为错了就推送什么相应课程,并不预设学习路径,而是在后台具有一定的算法,根据每一个学生的做题记录,来推断学生的问题所在和能力水平,为学生匹配学习内容。
基于难度等级的自适应学习


以英文的分级阅读为例,一个学生是否能看懂一篇文章,背后的原因是非常多的。年龄,语言基础,本身句子长短、搭配、上下文、语法都影响阅读情况。

国外首先提出分级阅读的概念,将书籍按照大概的年龄段划分,教学的时候,虽然每一个孩子有他的真实年龄,但是可以通过阅读测试找到最合适他读的年龄段。

一开始当书比较少的时候,可以由教育专家和老师来评定书籍的可读性,但随着要标注的书籍的增加,这件事情就必须由算法来完成。

以常见的Flesch-Kincaid等级为例,单词的平均音节数越多,段落里句子的长度越长,就认为文章越难读懂。

例如高考听力的难度最难也就在10年级,高考阅读在12年级左右,托福雅思的阅读题可能会有18-19年级的压轴题。

基于难度的自适应学习算法的最大缺点是认为学生的学科掌握度是一个值,有点像把学生分为重点班,普通版的感觉。

而实际上,更多时候,大家关注的是学科中细粒度的知识点的掌握情况。

第三种基于知识图谱和概率模型的自适应学习

第三种是最为复杂的,在构建知识图谱时,需要先把知识点颗粒度拆到足够细分。

比如乂学教育就将定冠词的用法拆分成13个纳米级的知识点,不定冠词的拆成6个,可以说是已经细到不能再细的程度。

然后每个知识点还要打上标签,标签包括知识点内容、学习时间、倾向性、内容质量、难易度、区分度等。颗粒度越细化、标签越多样化就可以使学生实现匹配的更精细化。

基于深度学习和IRT模型的自适应学习系统,可以根据大量学生的做题数据,分析出每一道题目的难度以及学生的能力,结合知识图谱体系,进一步分析出学生在每个知识点的能力情况,也就是学生的知识点能力模型。

有了这个模型,对于任何一道新题目,可以预测出学生做对这道题的概率,这样就可以根据每个学生的最新能力水平,匹配出最为合适的学习内容,让学生哪里不会补哪里,打造适应每个学生的“精准教育”。
基于知识图谱和概率模型的自适应学习


结语

随着语音/语义识别、深度学习等人工智能技术的发展和深入,传统的学习方式会被革新,未来将是“人工+智能”的教学/学习模式。

人,负责个性化、心智等问题的培养;智能,负责海量数据处理,根据算法做出精准的学习方案,同时也给老师更好的帮助。

教育科技将改变传统教育“大市场、小公司”的业态,最终的赢家既不是那些做教学最好的企业,也不是那些AI研发能力最好的企业,而是那些能够从垂直领域出发,让教学省时省力、让学习更有效果效率,教学、技术、市场可以很好融合的企业,这也是我们最期待投资的企业。


港粤资本专注于教育及消费领域的投资,关注改变消费者家庭生活的创新型项目。已投资的项目包括已获大疆投资的创客类项目麦高创想家;被宜华资本收购的致力于儿童家居的创想家;国内第一批从事编程教育、起草国内编程教育教材大纲的盛思教育;将美国FRC赛事引入中国并本土化运营的搭搭乐乐;上海规模最大的托班早教机构凯瑞宝贝等。如果您是教育和消费领域的优秀创业团队,欢迎与我们港粤投资经理们联系,共同合作成长。
投资经理
林桂宏
微信号:lgh_31
投资经理
施伟侠
微信号:smr888shi
投资经理
许越
微信号:xy834030282


港粤资本

引领家庭新生活


    关注 港粤资本


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册