请说说您在剑桥领思考试研发中的工作内容。
我主要参加了新的剑桥领思口语测试研发工作,负责设计并开展实证研究,以探索测试有效性的潜在威胁,并收集支持(或否定)剑桥领思测试分数在不同环境中的解读和使用情况的有效性证据(或反证)。
剑桥领思与其他考试不同的地方是什么?
剑桥领思考试在运用尖端语言测评技术方面是独一无二的。剑桥领思阅读和听力二合一测试是计算机自适应的,这意味着测试内容是根据应试者表现量身定制的,从而能实现对其语言能力的精确评估。自动评分技术几乎可以即时对自由写作部分打分,使剑桥领思写作测试的质量得到进一步提升。
您在开发剑桥领思时有什么心得体会?
我认识到提升利益相关者对语言测评技术的认识是非常重要的。例如,教师、学习者和其他测试用户会无法立刻理解剑桥领思中的计算机自适应测试和自动评分概念。这意味着我们需要对此作出解释,打开幕后的“黑匣子”,以确保剑桥领思考试运用得当,并对语言教学产生积极影响。
如今剑桥领思已经问世,就产品和市场接受度而言,您最满意的是什么?
我很高兴听到许多试用过剑桥领思考试的英语学习者说,剑桥领思评估了日常交流所需的基本英语技能,而且上机测试并没有影响他们的发挥。
您觉得剑桥领思在未来两到三年内会如何发展?
剑桥领思将不断探索将尖端技术与英语测评相结合的新方法。
您目前在研究什么?
我目前在做自动评分质量保证方面的研究项目。我还在写一篇关于自动口语测试原型的研究论文。
考虑到人工智能的应用情况,您觉得以后的机考会如何变化?
随着人工智能用的越来越多,机考会变得更加个性化,更加以学习者为中心。除了能指示语言能力的各个等级外,人工智能还能够准确诊断语言学习者的优缺点,为打造量身定制的教学材料和学习活动提供条件。
同时,它将有助于减少基于机考带来的干扰。例如,在学习者进行机上语言学习时,人工智能可以同时进行风险较低的阅卷。总之,可以预见,语言学习和测评在不久的将来会无缝融合在一起。
在今后五年内,是否还有影响语言学习和测试的其他主要趋势?
技术的快速发展可能会对语言学习和测评产品的设计产生巨大影响。在今后五年内,可能会出现的一个突出趋势是人工智能教师。它们能帮助人类教师给家庭作业打分,设计课内外活动,对学生学习情况进行形成性和总结性评估,并跟踪学生的学习进展,从而能大大减少人类教师的工作。