Évaluation des compétences à l’oral et acquisition des tons par des apprenants européens

Zhong Mei

Le 10 septembre 2022, l’Institut Confucius de l’Université de Genève a organisé sa 13ème formation de didactique du chinois langue étrangère. Celle-ci a porté sur les thèmes de l’évaluation des compétences orales et de l’acquisition des tons par les apprenants européens. L’intervenante, la professeure TSENG Chin-Chin (曾金金), provient de l’Université Normale Nationale de Taiwan (台湾师范大学).

La journée était structurée en quatre phases distinctes : pendant la matinée, la professeure Tseng a d’abord discuté des différents niveaux d’épreuves, des types de questions et des critères d’évaluation en matière de compétence orale en chinois, basés sur le TOCFL (Test of Chinese as a Foreign Language) de Taiwan. Ceci a été suivi d’un premier atelier pratique sur l’application de ces critères à partir d’exemples d’enregistrements d’épreuves orales du TOCFL, grâce à l’emploi d’une grille d’évaluation. L’après-midi, la professeure Tseng a exposé les résultats de son étude sur la maîtrise des tons par les apprenants d’origine européenne en chinois L2, qui s’appuie sur la base de données interlinguistique de ces mêmes apprenants. Cela a ouvert une nouvelle perspective et offert un nouvel éclairage sur l’enseignement des tons aux étudiants d’origine européenne. Un deuxième atelier a mis en exergue un modèle d’évaluation destiné spécifiquement aux problèmatiques tonales, qui a par la suite été mis en pratique.

Une vingtaine d’enseignantes venant d’horizons divers ont participé à cet événement, notamment des représentants de l’École chinoise de Genève, l’École internationale de Genève, l’École chinoise de Taiwan à Genève, l’École-club Migros, l’École chinoise de Lausanne, l’École chinoise de Berne, ainsi que quelques doctorants et assistantes du Département d’études est-asiatiques de l’Université de Genève.

Selon l’usage pour nos publications de didactique du chinois langue étrangère, un compte rendu détaillé est disponible en mandarin ci-dessous.

第十三届中文教师培训

汉语口说能力评测和欧洲地区学习者声调习得

钟梅

2022年9月10日,瑞士日内瓦大学孔子学院成功举办了第十三届中文教师培训。台湾师范大学华语教学系曾金金教授做了主题为“汉语口说能力评测和欧洲地区学习者声调习得”的培训。来自日内瓦、洛桑、纳沙泰尔、法国周边地区的一线骨干中文教师、日内瓦大学汉学系硕博士生以及助教等,在中秋节和教师节重合的特殊节日参加了本次培训。

这次讲座希望讨论汉语口说测验评分规准的具体指标,为中文教师口说评分的任务训练提供参考。曾金金教授分析了汉语口说评测等级、评测题型和评分规准,以及欧洲地区汉语学习者之中介语声调表现分析,并就汉语口说能力评测方法、形式、标准和问题导向式汉语声调教学进行了深入的交流和探讨。本次培训持续6个小时,上午和下午分别以讲座和工作坊相结合的形式进行。

一、汉语口说评测等级、测验题型和评分规准

(一)评测理念和等级

    曾教授认为,汉语口说能力评测的设计理念主要体现在命题和评量两个方面,应该基于华语学习者的实际口语需求,以沟通任务为导向。在命题方面,力求贴近于真实情境中需要达成的各种沟通任务;在评量方面,注重于考察应试者能否在特定语境下,借由口语表达,有效地传递讯息。口语表达能力中的“口语”是指“谈话所用的语言”,“表达”则是将心中的思想或讯息借语文或行为的方式传递给别人。在这个过程中,力争做到内容丰富、掌握重点、条理分明,加上语音清晰、语速流畅、音量适中、自然大方,还会运用丰富的肢体动作和脸部表情等帮助表达。

华语口语能力测验[1]之测验架构将语言能力分成四等八级,四等分别为准备级、入门基础级、进阶高阶级别高阶及流利精通级。而每一等级又可以再依据测验成绩细分为两级,分别为准备级一级、标准级二级、入门级、基础级、进阶级、高阶级、流利级、精通级,共八级。

下表是准备级的问题。

表1:准备级口语测验

看图回答问题   问答问题
这是什么?你是哪国人?
现在几点?你有没有手机?
他在做什么?                             你喜欢运动吗?
他做什么工作?                         你的生日是几月?
这里有什么?你家离市场近吗?

(二)测验题型

测验的题型取决于测验的目的及可行性。王佶旻指出,在选择测验题型时应该考量测验的理论构想、组织方式和应试者的能力水平三个因素[2]。杨冀认为汉语口试的题型要参照教学大纲和口语课程目标所规定的学习成果范围和技能点[3],并介绍了8种题型[4]

(1)朗读:包括拼音字母、汉字的音韵调、单词或词组、句子或语篇等,考察语音、语调、重音、连读、节奏、停顿、语流音变等。

(2)复述:要求应试者复述听到的或读到的材料内容。分为辅助性复述(允许应试者做记录,甚至考官为其提供自助性材料)和非辅助性复述两种方法。

(3)问答:包括应试者回答考官提出的问题和朗读一段语料后回答问题。

(4)角色扮演:规定一个事件的大致情节及交际场景,为考生设定角色,进行师生之间、

生生之间的对话。考查汉语表达的准确性、流利度、得体性以及是否切题等。

(5)看图说话:提供图画或者照片,要求学生回答问题(或描述景、物、人,或叙述事件);或者用图片引出话题。能引发学习者的口语表现,又能较好的避免阅读或听力技能对口语表现的影响。

(6)口头演讲:发表意见、论证观点、解释原因、讲解办法。考官先提供题目或一段材料,应试者准备后再口试。话题应该是学习者感兴趣的事件或者问题。

(7)小组讨论:3、4个学生根据给定的话题进行口头交流,以观察学生的口语常规技能(声韵调、流利度和正确度)和应变能力。话题应该新颖有趣,应考察学生如何引入话题、阐述思想、如何结束、表达的清晰度、语言组织的逻辑性、说话时长等。

(8)口译:汉语翻译成外语,外语翻译成汉语。这种方法主要用于双语或者翻译专业的汉语学习者。

总之,测验的题型应该着眼于学习者的口语能力发展。初期,应当以分辨语音声、韵、调为测试的命题重点;然后,以实际发音的各项微技能为基础,再向问答、对话的交际性测试过渡;进而向成段表达和语篇表达推进。

(三)评分标准

汉语学习者口语水平测试的评分标准一直是学界研究的重点课题之一[5],尤其是大型口语测试,不同国家都对其语言测试出台了一套相适应的评分标准。比如,英国的雅思考试(IELTS)注重流利性和连贯性、词汇、语法及语音四个维度;美国教育考试服务处的英语口语考试(TSE)注重语法、语音、流利性和可理解性四个方面;美国外交学院的口试注重语音、语法、流利性、词汇和可理解性五个方面,其口语水平面试(OPI)评分时考虑了功能/情景(即交际场合)、话题(谈话的广度、准确性)、篇章类型(输出的是段落、句子还是单词、短语)四个方面;而中国大学英语口试(SET) 注重准确性、语言范围、话语长短、连贯性、灵活性和适切性六个方面。汉语口语水平考试(HSKK)注重内容、语音语调、流利程度、词汇、语法等方面的考察。[6]

    评分标准是影响学习者口语测试成绩的因素之一。许希阳认为“期中、期末口语测试时,分数评定基本上有两类:一种是教师按学生每个题目的回答情况打分,最后计算总分;另一种是教师根据学生的表现给一个总的印象分。”[7] 学校的期中、期末、模拟考等口语考试一般都是小规模测试,由任课教师担任评分员,评分方法参考不同等级的相关评分标准和打分表进行打分。评分标准的不确定性以及评分员对标准理解的模糊性都会使得口语测试成绩具有比较强的主观性。评分员是否接受过专门的评分标准培训也会对影响评分的准确性,甚至有时候,任课教师还会根据学习者的平时表现进行综合评分,难免会有先入为主的“印象分”。许希阳还认为“不应只注重学生话语的准确性,即是否有语音、词汇、语法错误,而且应该注重实际表达的内容所体现的意思,以及话语的流利性、得体性、连贯性、逻辑性、完整性、思辩性等各种要素。”[8] 翟艳建议任务型口语成绩测试的评分方法采用分项评分与总体评分相结合的方式,以分项评分为主,总体评分为辅,总体评分的分值设为总分的5%-10%。[9] 张军调查了国际中文教师心中的口语评价标准并得出结论:“语音(语音语调的准确性、可理解性)、词汇(词汇的广度、选词的恰切性)、语法(语法的准确性、复杂性)、流利度(语速、节奏和韵律、非正常停顿——如长时间搜索词汇、思考、自我修正、重复)和内容(完整性、连贯性、逻辑性、关联词的使用)”这五项标准不是同等重要的,在各个教学阶段中其所占的比重有较大不同。口语的语音、词汇和语法三项是教师更为关心的,尤其是对于零起点的初学者,语音项权重占到三分之二。随着学习者水平的提高,各项标准有均衡发展的趋势,但始终是语音、词汇和语法三项为主,流利度和内容为辅。[10] 杨桦则认为“高级口语课的成绩测试应当评判学习者:是否具有充分的准备;发音和语法比较规范;时间长度合适;观点清晰;内容充实;结构完整;表达流畅;逻辑合理;语句通顺连贯;使用适当的表达用法和词语。”[11]    

    综上所述,口试评分标准虽然具有一定的复杂性,但学者们普遍认为语言形式(语音、词汇、语法的正确性,丰富性)、流利度、意义表达(正确、连贯、逻辑清晰)等至关重要。不过,每一项评分标准的等级如何制定,在总成绩中应占多少比例,在不同教学阶段如何侧重不同评分标准等,还有待进一步研究和探索。另外,有的国家存在多种测试类型,这也导致衡量学生水平能力的标准无法统一,研究者所采用的定量就难以统一。因此,口语成绩测试需要确立更加科学、完善、系统和可操作的统一的评分标准。

(四)评测案例分析

    曾教授呈现了四个等级的评分测验案例,通过分析和听辨应试者对问题的回答进行评分,强调了汉语声调和起调的重要性。

案例一

    A等入门基础级共有三种题型,包括回答问题、经验描述及影片描述。考试的时候,每个题目都会播放两次。

  1. 你想做什么工作?为什么?
  2. 你去过最有意思的地方是哪里?为什么有意思?
  3. 影片描述        

   播放应试者的音频后,在座全体老师参与评测,评分分为3、2、1三级,最好的给3分,最差的给1分。每位教师心中的评分标准有些许不同,打分不一。可见,口语测试的评分成绩具有比较强的主观性。

    她介绍了TBCL[12]口语测验评分原则:以整体式为主,分析式为辅,从内容组成、表达能力、语言运用等三大指标来评定考生口语能力的整体表现。

    1.内容组织

    这一指标是对描述内容的整体评估:部分到整体,简单到丰富,完整度、丰富程度、评估语篇结构分析,关注焦点(意义),以及语篇结构(形式)是否为中文母语者所接受。具体来说,就是①开启、承接及结尾是否符合口说测验任务情境的惯用模式,②是否采用话题进行句序安排,③以及句序的衔接与连贯的使用形式。

    2.口语表达

    这一指标分别是发音及音律能力,包括色、音高、音强、音长的掌控力,这些都反映在应试者的发音、声调、语调、重音、停顿等方面。

    3.语言运用

    这一指标指①语用合宜度,即句式选择与语境匹配是否为中文母语者所接受;②句法掌握度,即句法与语意表达匹配是否为中文母语者所接受;③语义运用、词汇量与选字精准度。

案例二

    1.请你说一说,在过去的时间里,哪一段时间是你最快乐、最开心的时间?为什么?

    2.等一下,你会看到一张图片,看完这张图片以后,请你告诉我这张图片的内容。

    这位先生在做什么?发生了什么事儿?

    你做过或看过这样的事情吗?请你说一说那时候的情形。 

    如果还有时间,请你多说一说。

    3.旅行的时候,有的人想要住在大一点儿、好一点儿的饭店,这样才能好好休息。有的人觉得住什么饭店不重要,有地方可以睡觉就好。如果是你,你喜欢哪一种方式?为什么?

  B等范例评分级距讨论如下:

• 5级分经验描述,仍有人称代词过度使用的问题;

• 5级分陈述意见,评分员是否熟悉“景美”这个地名,声调不够精准,5>4;

• 4级分经验描述*当设计师的工作>当设计师或做设计师的工作”,但不影响理解,4>5;

• 4级分陈述意见,基本>*几本,上下文补足声调缺陷,4.5;

• 3级分经验描述,口语表达、语序、很多重复,没说完;

• 3级分陈述意见,有用/游泳,声调,3>4;

• 2级分经验描述,内容完整度和丰富度不足;

• 2级分陈述意见,内容完整度和丰富度尚可,流畅度佳,跟朋友见面(文化差具),2>3;

• 1级分经验描述,重复过多,理解困难,1.5;

• 1级分陈述意见,此经验描述差,理解更吃力。

经过研究,曾教授建议评分规准级分必须更加细化,0-5级距,评分至小数点后一位。整体评分以可懂度、流畅度、完整度、丰富度和精确度为主。评分规准的具体指标可以为汉语师资培训及评分人员提供训练内容。

二、欧洲地区汉语学习者之中介语声调表现分析

前文中,曾教授介绍了欧洲地区的汉学研究及中文教学背景、汉语标准化测验的等级说明、口语测验系统界面示范、测验题型范例以及汉语口语测验评分规准的具体指标。她以台湾华测会口语测验进阶级描述题的评分原则为例,详细分析了内容组成、表达能力以及语言运用三大评分项目。接下来,她将探讨一下欧洲地区汉语学习者之中介语声调表现情况。

声调在汉语中具有区别意义的作用,在国际中文语音教学中至关重要,也是母语为非声调语言的汉语学习者的难点之一。张朋朋、徐鲁民将英、法学生的声调问题分为两类:一是每个音节的声调都发成中平调,二是有的音节读错了声调;并对这两类偏误的原因进行了分析,指出声调错误主要是出现在语流当中。[13] 谢红华指出:(1)初级阶段的学生在声调听辨上四声混淆严重且无规律;(2)同一个声调,读得准不代表听得也准;(3)单个字或词的声调读得准不代表它们在句子中也会被读得准;(4)同一个声调,同一个学生也常会发出不同的调值。[14]

欧洲汉语学习者的声调偏误具有多样性、复杂性和不稳定性。通过分析欧洲地区汉语学习者口说能力声调偏误分析,以及探讨欧洲语言韵律特征对于汉语二语学习者中介语声调的影响,曾教授利用问题导向诊断式教学模式,有效帮助欧洲学习者习得汉语语流声调,为欧洲学生华语声调教学提供了新的角度与视野。所谓诊断式教学,就是以学习者为导向,像医生一样诊断每个学生的问题。让学生聆听自己的发音,学会如何发现自己的声调问题,以及自我改善中文声调的方法,透过人工智能口说自动检测平台,尝试新方法,去除洋腔洋调。她还特别强调,一开始教学时,不要特别强调单字的声调,注重句子整体的语流语调可能对学生来说更容易。

三、结语

    汉语口说能力测评不仅测试的是学习者的口语表达技能,更是测试跨文化口头交际的能力,由此可见其测试的难度高及复杂性。汉语口说能力的测评不能生搬硬套标准化的口语水平测试标准,应当参照教学大纲和教学目标的要求来设计,遵循明确测试目的、确定测试的能力范畴、综合考虑测试方式、使用学习者熟悉的测试内容等规则,采用分析法、综合法和融合法,综合评估学习者口语能力的整体表现,尽量使测试能够较好地测出学习者的真实汉语口语水平,以及发挥其对口语教学的积极反拨作用。

附录:

等级对照

     华语文能力测验(TOCFL)与汉语水平考试(HSK)[15]、国际中文教育中文水平等级标准(新等级标准)[16]、欧洲共同语文参考架构(CEFR)、美国外语教学协会能力指标(ACTFL大纲)、台湾华语文能力基准(TBCL)大致上之对应关系,如下表所示

CEFR
等级
ACTFL大纲
等级
HSK 2010版
等级
新等级标准
等级
TOCFL
等级
TBCL
等级
累计词汇量
(HSK2010/新等级标准)
累计词汇量
(TOCFL/TBCL)
累计识字量
(HSK2010/新等级标准)
累计识字量
(TBCL)
 初级初等
初级中等
1级
2级
 准备级一级
准备级二级
1级150
300
 160
393
396174
347
 246
A1 A2初级高等
中级初等
中级中等
3
4级
1级
2级
3级
入门级(1级)
基础级(2级)
2级 [17]
3级
600
1200
500
1272
2245
740
1225
798
1254
617
1064
300
600
900
504
801
B1 B2中级高等
高级初等
高级中等
5级
6级
4级
5级
6级
进阶级(3级)
高阶级(4级)
4级
5级
2500
5000
3245
4316
5456
2399
4741
2669
5288
1685
2663
1200
1500
1800
1300
1900
C1 C2高级高等
优秀
优异
 7级
8级
9级
流利级(5级)
精通级(6级)
6级
7级
 1109275179432
14425
 30002500
3100

Cette contribution a été relue par Grâce Poizat.

Zhong Mei. «Évaluation des compétences à l’oral et acquisition des tons par des apprenants européens». In Blog Scientifique de l’Institut Confucius, Université de Genève. Lien permanent: https://ic.unige.ch/?p=1461 consulté le 04/28/2024.

[1] 华语文能力测验(Test of Chinese as a Foreign Language, 简称TOCFL)是台湾师范大学国家华语测验推动工作委员会(简称“华测会”)开发的、针对母语非华语者而举行的华语语言能力测验,其对象是在使用华语的国家求学、工作或贸易等人士,每年于台湾与海外考点定期举办。

[2] 王佶旻.汉语口语测试理论与实践[M].北京师范大学出版社,2012,90-93.

[3] 杨翼,对外汉语教学的成绩测试[M],北京大学出版社,2014,680.

[4] 同上,680-698.

[5] 梁冬梅.汉语口语成绩测试研究综述[J].名古屋外国语大学外国语学部纪要第50号(2016.2),201.

[6] 翟艳.汉语口语成绩测试评估标准[J].华文教学与研究,2012 年第1 期,总第45期,43.

[7] 许希阳.汉语口语测试研究[J].云南师范大学学报,( 对外汉语教学与研究版),2005年9月,第3卷第5期,40.

[8] 同7。

[9] 同7。

[10] 张军,高校初级汉语口语评价标准的调查研究[J],考试研究,2014年第4期,总第45期,48.

[11] 杨桦,高级口语成绩测试评判标准研究[J],首都师范大学学报- 社会科学版,2013年增刊,140.

[12]台湾华语文能力基准(Taiwan Benchmarks for the Chinese Language,简称TBCL)于2020年推出,就听、说、读、写、译五个面向建立三等七级的能力指标,分别为基础(1-3级)、进阶(4-5级)、精熟(6-7级),并在各等级中列出其所应认识的汉字、词语以及具特定语法作用的词语、短语、固定结构及话语标记等语法项目(Grammar Points,或译为语法点)。华语文能力测验自2021年8月起,在成绩单上增加TBCL能力等级字段,并将TBCL作为测验设计的参考依据之一。

[13] 张朋朋,徐鲁民. 试析“洋腔洋调”问题[J]. 1981, 65-70.

[14] 谢红华主编. 法语背景学生汉语偏误分析[M]. 巴黎:You-Feng, 2018 :48.

[15] HSK2010版分为三等六级,制作者的原意是与CEFR对应。但据德语区汉语教学协会的研究,此六级HSK不管是在词汇量、学习时数,甚或对语言能力的要求,与CEFR有不小的落差。此研究认为这一版本的HSK比CEFR要来得简单许多,一级及二级皆未达CEFR-A1程度,而六级仅相当于CEFR-B2程度。

[16] 新等级标准于2021年发布,分为三等九级。HSK将依据新发布的等级标准,在保持现有六等级的基础上,增加HSK7-9级,而未来的HSK1-6级将依据此标准和各国中文学习者实际情况,逐步进行调整。

[17] TBCL的2级难度大约在TOCFL的准备级二级至入门级(1级)之间。