在线测评:噱头大于实效还是技术惠及大众?

AI?

在线测评的概念无疑是随着整个自适应学习的兴起而来。

自适应学习是一种较为先进的教育科技手段,通过自主提供适合每位学生的独立帮助,引导学生下一步学习内容和活动,当学生在学习过程中遇到课程难度过高或过低时,课程的难易程度都可以自动调整,从而实现可规模化的个性化教育。一般而言,测评是自适应学习产品最常应用的在线教育场景。

自适应学习中的测评主要依赖学习过程数据、考试结果等来测评,测评比较全面、精准,并能够支持学习过程的动态优化,有助于教学效率的提升。

其实,在线测评的需求是真实的,很多的公司将技术的力量投入于此,对外都宣称自己的技术更为领先,但是我们需要先问一个问题,测评的核心真的是AI技术吗?

或许未必。因为保证任何算法的有效性最关键因素是正确的模型,对于教育而言,有效的模型,能够最大程度地保证信度和准度的测评题目设置,才是最根本的。

以语言测评为例,朗播网此前上线的「雅思托福测评小程序」,依托全球首款托福自适应学习系统,深度挖掘了学员数据,全面覆盖了19个核心能力点,设置了10-15分钟时长的测试内容,能够更精准的测试出用户的真实水平。

据朗播网创始人&CEO杜昶旭介绍:从语言测评模型上来看:基础其实是能力图谱/量表,定性描述不能解决本质问题,最关键的是标准化的定量描述。要想量化一个人的语言能力,追根溯源还是要用测量学的方法,来评测一个学生的语言能力。因此针对语言类的考试完全区别于数学等以知识点为导向的学科,是不会有太多所谓“规律性”的东西,反而是对考生能力的描绘。

从语言测评内容上来看:语言测评我是完全不主张用真题去测试的(虽然市面上很多测评都是拿了真题就包装成测评给用户),应该是基于能力模型自主定义测试题,测试题之间交叉对应能力点,反映用户的趋势和现状。

从语言测评技术层面来看:一般来说,为了测量一个能力点,通常需要3-5道测试题。为了简化测验过程,我们依据知识之间的关联程度构造了一个特殊的神经网络,找到题与题之间的关联,朗播网现在研究的,就是如何基于基于贝叶斯和IRT模型的神经网络算法,来优化这个测评的过程并提高准确性。

除了优化自适应测评技术,朗播网还不断发力语音、图像识别和NLP,即机器学习和深度学习技术的应用,以及用机器来解决用户学习过程数据收集分析,基于分析生成形成性的评价和结果的预测。

完成自适应学习闭环,测评只是第一步

测评与体检类似,体检发现身体的问题,但是不会给出治疗方案。真实有效的测评通过技术和模型的力量发现了问题,接下来应该考虑的就是谁来解决问题,以及怎么解决问题。

人工智能自适应教育最早发展出的功能是反映学生的能力水平(测试功能),后来逐渐加入找出知识点盲区(评价功能)、推送内容弥补盲区(学习功能)的功能,但目前所推送的学习内容表现形式仍然是视频、题目等旧形式,背后的学习方式是传统的“听课”和“刷题”,这是由教学思路的固化导致的。按照传统的在线教育以及线下培训机构的做法,从自测环节就已落后,更不用说形成有效的闭环了。

从自适应学习的角度来看,测评只是形成整个闭环的第一步。以朗播网为例,用户在朗播网通过自行测试,完成对自身英语能力的检测。测验完成后,朗播网会依据模型,用可视化的方法描述用户的英语能力,并依据用户的不同情况,给予其不同的解决方案。

除了初次的测评以外,用户在朗播网学习还需要每完成10套任务包后再进行测评,通常是10-15天,测试也会使用户的能力更贴合应该达到的要求,并且结合个性化学习计划,继续推荐更为适合的学习方案。

涉及到机器学习的,数据都是非常重要的,尤其是对个性化要求极高的自适应学习。教学不应该是单方面给予的过程,学习不是把线下培训方法照搬到线上,而是成体系化、模块化的,随着用户能力提高,系统也可以实现升级,结合教研与数据就是在线教育实现个性化教学的完备路径。

在线教育竞争逐渐升温,传统营销手段无法突出平台优势,如何让数据大量沉淀下来,发挥人工智能和机器学习的技术优势,真正利用技术解决自适应学习的问题,形成有效的闭环,才是未来在线教育抓住当前机遇,获得竞争优势的着力点。

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2018-07-18
在线测评:噱头大于实效还是技术惠及大众?
任谁再独善其身也很难不被朋友圈中的“测一测”吸引目光。娱乐性质的测试小程序,以测试为噱头做着各种产品、服务...

长按扫码 阅读全文