大家好,今天给各位分享北京市中考英语阅读理解命题材料文本难度研究的一些知识,其中也会对进行解释,文章篇幅可能偏长,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在就马上开始吧!
北京市中考英语阅读理解命题素材文本难度研究
葛兴杰赵连杰
摘要:阅读材料是命题阅读的重要基础,其文本难度是影响命题质量的关键因素。本研究利用自然语言处理工具Coh-Metrix对2012年至2021年北京中考英语阅读理解50份命题材料的文本难度进行了定量分析。研究发现,英语阅读理解的整体文本难度北京中考命题材料随时间推移基本一致,但在阅读量、句法、衔接等方面存在显着差异;有些年份的课文难度存在明显差异,难度分布不规律。本研究为中考英语阅读理解命题材料的选择和规范提供实证支持和参考。
关键词:课文难度;提案材料;中考英语;阅读测试
一、简介
2019年11月的《教育部关于加强初中学业水平考试命题工作的意见》号文件指出,要提高试题科学化水平,规范试题难度,拓宽试题材料选择范围,丰富材料类型。陶百强(2019)指出“命题材料或文本是命题的出发点,命题材料或文本的选择和科学搭配影响甚至决定着试题的质量和考试的难度”。纸。”显然,控制命题材料和课文的难度对于试题的科学制定的重要性是不言而喻的。然而,通过文献查阅,笔者发现对于命题材料的文本难度的研究较少,语言测试领域的实证研究支持也很少。鉴于此,本研究拟利用自然语言处理工具Coh-Metrix对2012年至2021年北京中考英语阅读理解命题材料的文本难度进行多维度分析,对其进行梳理和提炼。文本难度特点,旨在为中考提供指导。部分命题材料的选择以及难度一致性的保持,为英语阅读理解提供了参考和启发。
2.文献综述
在阅读理解测试中,命题材料的文字难度直接影响测试的难度。文本难度是指文本能够被读者理解和接受的程度。确定文本难度可以帮助不同语言水平的读者选择合适的阅读文本(Fulcher,1997)。测量文本难度的研究起源于20 世纪90 年代。有研究者提出可以利用词汇复杂度和句子长度来预测文本阅读难度(Chen,2016)。此后,研究人员开始使用单一的可读性指标,例如Flash可读性、阅读能力度(DRP)和LexileScores(蒋锦林,韩宝成,2018)来评估文本难度。量化是做了,但这些量化指标通常只与词汇和语法有关。事实上,文本难度的精确测量比仅仅通过词汇和句子指标的计算要复杂得多(Liao,2020)。
进入21世纪后,人工智能教育的发展为文本分析提供了“Coh-Metrix”、“英语阅读评分指南针”等更加精密、全面的工具,方便研究者对文本进行深入的定量研究。 Coh-Metrix是美国孟菲斯大学麦克纳马拉等人开发的基于网络的定量文本分析工具。目前它可以在线分析书面文本的描述性统计、文本易读性主成分分数、指称衔接和潜在语义。词汇信息、词汇多样性、连词、情景模式、句法复杂性、句法形式密度和可读性,共11个模块和106个变量进行了自动分析(蒋锦林,2016)。该工具广泛应用于文本难度的定量研究。在外语教育领域,主要用于教材文本和命题文本的分析。在教材文本分析方面,相关研究主要集中于探究大学外语教材和外语考试的文本难度特征(Green等,2010;Plakans,Bilkis,2016;蒋锦林,韩宝成,2018;陈安妮,郭爱萍,2019)。在命题文本分析方面,黄丽艳、王佳莹利用Coh-Metrix和Python对浙江高考“一年两考”的阅读理解文本进行复杂性分析,总结了英语阅读文本的复杂性特征在浙江高考中,对高考题进行了分析。系统、课堂教学、简化题库提供启发;黄丽艳、施必冰(2020)利用Coh-Metrix从考试目标、试题结构、题目写作等方面对我国7个城市的中考英语进行了分析,并结合实际情况2018年中考情况对当前中考英语命题工作等提出了改进建议,但这些研究并没有对中考英语阅读理解的课文难度进行充分的定量分析命题文本。
基于上述研究结果,本研究利用Coh-Metrix对2012年至2021年北京中考英语阅读理解命题材料从可读性、阅读量、词汇、句法和衔接五个层面进行定量分析,旨在揭示近十年来北京中考英语阅读理解命题材料的文本难度特征。
3. 研究设计
(一)研究问题
通过定量分析,本研究旨在回答以下两个研究问题:
1. 2012年至2021年北京中考英语阅读理解命题材料文本难度的历时特征是什么?
2、2012年至2021年北京中考英语阅读理解各命题材料文本难度是否存在显着差异?
(二)研究对象
本研究选取2012年至2021年北京中考英语阅读理解命题材料作为研究对象。由于近四年来北京中考取消了五选五题型的设置,本研究并未统计2012年至2017年五选五题型的命题文本,仅分析对2012年至2021年北京中考英语阅读理解A、B部分、C、D部分以及阅读与回答问题,共50篇命题文本进行了定量分析。
(3)文本难度分析框架
本研究借鉴黄立言、施必冰(2020)的分析框架,利用Coh-Metrix从可读性、阅读量、词汇、句法、衔接五个层面共27个指标进行分析。分析框架如表3.3.1所示:
可读性可以作为一个数值来反映文本的整体难度。其中,Flash可读性范围从0到100。值越高,文本难度越低; Coh-Metrix第二语言可读性越高,文本难度越低(Graesser, et al. 2004)。 Flesch(1948)明确定义了Flesch可读性值和相应的文本难度(见表3.3.2),为文本难度的定义提供了参考。
在阅读量方面,本研究采用字数和句子数两个指标来分析命题文本的阅读量。单词和句子的数量越多,阅读量越大,课文的难度也越大。
在词汇层面,命题材料的词汇特征直接影响其文本的难度。命题材料中使用的词汇越复杂,文本难度就越高。即命题材料的平均词汇长度、词汇习得年龄、准符号比越高,文本难度越高;内容词频、全部词频和词汇熟悉度,词汇具体性、词汇象似性和词汇意义越高,命题材料的文本难度越低(Graesser, et al. 2004; Graesser, et al. 2007) )。
在句法层面,句法特征可以直接影响学生对课文的理解,进而影响命题材料的课文难度。从指标来看,命题材料的平均句子长度、名词短语密度文本、主要动词之前的词数越高,文本难度越高;相邻句子的句法相似度和所有句子的句法相似度越高,文本越难。减少(Graesser 等人,2004 年;Graesser 等人,2007 年)。
衔接对于促进理解起着重要作用,并直接影响文本难度。从指示词的角度来看,连词(因果连接词、附加连接词、时间连接词)可以促进句子之间的联系,帮助读者理解文本。指数越高,文本难度越低(Ryu,Jeon,2020);就语义衔接(相邻句子的语义重叠和所有句子的语义重叠)而言,语义重叠值越高,文本衔接越好,文本难度越低(Graesser等,2004);指称衔接体现在相关的相邻句子的逻辑重叠指数和所有句子的逻辑重叠指数方面,如果一篇文章的衔接值越高,文本难度也会越低,这意味着该文章更容易理解(Graesser 等,2007);从情境模式(因果衔接指数、目的衔接指数)来看,文本的目的和因果关系越强,文本的难度就越大,读者在阅读时需要的认知处理也就越多(Graesser等,2016)。2004)。
(4)数据分析
基于文本难度分析框架,本研究首先使用Coh-Metrix对50份阅读理解命题材料进行定量分析,并使用SPSS26对所有收集的数据进行单因素组间方差分析,探索2012年-2021年北京中考英语阅读理解课文的历时课文难度特点是什么。其次,为了了解2012年至2021年北京中考英语阅读理解命题材料之间的文字难度是否存在显着差异,本研究整理了各命题材料的Flash可读性值并利用Excel计算了各年份各语言的文本难度。将标准差大于10的历年文章间文本难度的标准差以折线图的形式呈现和分析,以直观地呈现历年命题材料之间文本难度的差异和变化。
4 研究结果与分析
(一)北京中考英语阅读理解命题材料文本难度的历时特征
1. 可读性
在可读性方面,通过对命题材料可读性的单因素组间方差分析发现,2012年至2021年北京中考英语阅读命题材料在Flash可读性方面存在较高差异(p=0.990) 和Coh-Metrix II 在语言可读性上没有显着差异(p=0.967)。可以看出,2012年至2021年北京中考英语阅读理解命题材料的文本难度整体上没有明显变化。
另外,根据弗莱施(1948)对弗莱施可读性指数的解读,2012-2021年北京中考英语阅读理解命题材料的弗莱施可读性基本在69.73-75.78之间,文本难度基本在中级。 “相对”范围。简单”范围(70-79)。
2、阅读量
在命题材料阅读量方面,单因素组间方差分析结果显示,2012-2021年北京地区阅读理解课文难度字数差异不显着(p=0.946)。中考,但句子数量存在显着差异(p=0.000)。
如图4.1.2.1所示,2012年至2017年命题材料句子数量基本持平。 2018年之后,句子数呈现增长趋势,2019年该指标达到峰值,之后句子数指标开始呈下降趋势。从数据来看,2019年的句数指标明显高于2012-2017年的指标,而2018-2021年的句数指标没有显着差异。总之,2012年至2021年北京中考英语阅读命题材料阅读量自2018年以来大幅增长,2019年达到峰值。近两年阅读量开始减少,且命题材料的文字难度也发生了相应的变化。
3. 词汇
在词汇层面,单因素组间方差分析结果显示,命题材料的平均词汇长度(p=0.645)、内容词频(p=0.850)、全部词频(p=0.262)和词汇量习得年龄(p=0.958)、词汇熟悉度(p=0.742)、词汇具体性(p=0.770)、词汇象似性(p=0.819)、词汇意义(p=0.531)、相似符号与符号比率(p=0.616) 没有显着差异。可见,词汇量对2012-2021年北京中考阅读理解材料的文本难度没有显着影响。
4.语法
句法复杂性可以直接影响命题材料的文本难度。单因素组间方差分析结果显示,北京中考英语阅读理解命题材料的名词短语密度(p=0.881)无显着性差异,但平均句子长度( p=0.011),相邻句子的句法相似度(p=0.002时有显着性差异)。
从图4.1.4.1可以看出,2012-2021年北京中考英语阅读理解命题材料中平均句子长度和相邻句子句法相似度两项指标存在显着差异。其中,从平均句长来看,命题材料的平均句长自2015年以来呈现出明显的下降趋势,2020年后该指标略有上升,但与2018年基本持平。从数据来看,2019年的平均句子长度也明显低于2015-2016年;从相邻句子的句法相似度来看,2017年以后,命题材料的句法相似度呈现出明显的增长趋势,而2020年后,相邻句子之间的句法相似度开始下降。从指标来看,2019年句法相似度显着高于2015-2017年,2018年句法相似度显着高于2015-2016年。
由于主要动词前的词数和所有句子的句法相似度这两个指标在方差齐性检验中并不齐次,因此采用Kruskal-Wallis检验进行进一步检验。结果发现,命题材料中主要动词前的单词数量较高(p=0.079,df=9,H=15.474),没有显着差异,但所有句子的句法相似度存在显着差异(p=0.002,df=9,H=25.589),结果见表4.1.4.1:
从数值上看,命题材料中所有句子的句法相似度方面,2018年的句法相似度显着高于2012年、2014年、2015年、2016年、2017年,2019年的句法相似度显着更高较2012年至2017年。 2020年句法相似度显着高于2015年,2021年句法相似度显着高于2015年,2012年与2017年句法相似度无显着差异,2018年句法相似度无显着差异和2021 年。
综合这三个指标,2012年至2021年北京中考英语命题材料的文本难度受句法影响,在句法复杂度上呈现下降趋势。其中,2019年的句法复杂度最低,近两年句法复杂度略有上升。
5.连接
在衔接层面,单因素组间方差分析显示,2012-2021年北京中考英语阅读理解命题材料在因果连接指数(p=0.756)、附加连接指数(p=0.997)和时间连接指数(p=0.574),并且相邻句子的逻辑重叠指数没有显着差异(p=0.080)。由于方差齐性检验中所有句子逻辑重叠指标均不齐,无法进行单因素组间方差分析,因此采用Kruskal-Wallis检验进行进一步的数据分析,结果发现不存在显着差异。
2012年至2021年北京中考英语命题材料中,相邻句子语义重叠(p=0.002)和所有句子语义重叠(p=0.019)均存在显着差异。 -因子组间方差分析如图4.1.5.1所示:
如图4.1.5.1所示,就相邻句子的语义重叠指数而言,从图形上看,2012年至2020年没有明显的起伏,总体趋势呈现先小幅上升后下降的趋势,但2021年有一个呈明显上升趋势;从数据来看,2021年相邻句子的语义重叠度明显高于2012年、2017年、2018年、2019年、2020年。就所有句子的语义重叠度而言,从图形上看,没有明显的重叠。 2012年至2020年起伏不定,整体趋势下降,但2021年有明显上升趋势;从数据来看,2021年所有句子的语义重叠度明显高于2020年和2019年。
2012年至2021年北京中考英语命题材料的因果衔接指数(p=0.037)和目的衔接指数(p=0.002)也存在显着差异。单因素间的结果-组间方差分析见图4.1.5.2。从因果联系指标来看,2012年至2021年得到的数值呈现出先上升、后下降、再显着上升、最后回落的过程;从数值上看,2019年指标明显高于2012年和2021年。2016年指标;从目的连接指标来看,2012年至2021年所得到的数值呈现出先上升、后下降、再显着上升、再回落、最后小幅上升的变化过程;从数据上看,2019年各项指标明显高于2012年、2015年、2016年。
综合以上四项指标,2012年至2021年北京中考英语阅读命题材料的衔接并没有造成文本难度的明显变化。仅2019 年和2021 年文本难度出现显着差异。
(二)北京中考英语阅读理解各命题材料文本难度差异
Flash可读性可以反映每个文本的整体难度,而标准差可以反映一组数据的分散程度。本研究中,各年份命题材料的标准差越高,表明当年五份命题材料的文本难度差异越大。表4.2.1列出了历年各命题材料的Flash可读性指数以及各命题材料之间的标准差。
从表4.2.1可以看出,2012年、2014年、2016年、2017年、2020年五份命题材料的Flash可读性标准差均小于10,即各命题材料之间的文字难度差异为相对较小。小,其中2014年的课文难度差异最小,基本在“标准”到“较容易”的范围内。 2013年、2015年、2018年、2019年、2021年5份命题材料的Flash可读性标准差均高于10,即各命题材料的文字难度相差较大,其中2018年的文字难度差异为最大(见图4.2.1)。
从图4.2.1可以看出,在命题材料存在明显差异的五年中,每年各命题材料的文本难度特征也有所不同。 2013年和2015年,Part A、B、C以及阅读和答题都比较简单,基本处于“较易”的难度水平,而D部分的文字难度明显高于其他文章,达到了“较难”的水平难度级别,2015年甚至达到了“困难”难度级别。 2018年Part B的课文难度明显低于其他命题材料,达到“非常容易”的难度级别,而Part C的课文难度也明显高于其他命题材料,处于“非常容易”的难度水平。 “更困难”的难度级别。例如,A、D部分以及阅读和回答问题的文本难度相对较低,处于“较容易”的难度级别,而这五种命题材料的难度波动较大。到2019年和2021年,A部分的文字难度以及阅读和答题的命题材料都比较低,基本处于“较容易”的难度水平。 Part B的课文难度明显低于其他课文,处于“非常简单”的水平。其中,C部分和D部分的难度并没有明显增加,两部分基本相同,在“标准”难度范围内。
总之,历年命题材料的文本难度排列并不规律。某些年份命题材料的文本难度没有大的差距或区别,也没有呈现规律性的增减趋势。一般来说,C、D部分的课文难度较高,大部分年份都会明显高于其他课文。但近两年来,C、D部分的文本难度基本持平,与其他命题材料的文本难度有所不同。 Part A、Part B以及阅读和回答问题的文本难度相对较低。一般来说,B部分的难度是最低的,基本处于“Easy”和“Very Easy”的难度级别。另外,在某些年份,如2013年、2015年、2018年,某一命题材料的文本难度会明显高于或低于其他命题材料,即命题材料的难度波动较大;而在某些年份,五篇课文的难度并无特别明显的差异。
5 结果与讨论
本研究从整体难度变化和各年份文本难度差异方面对2012年至2021年北京中考英语命题材料文本难度进行定量分析。基于以上分析,得出以下两个结论。
首先,整体来看,2012年至2021年北京中考英语阅读理解命题材料的文本难度基本持平。通过进一步分析可以发现,从可读性来看,近十年来的50篇命题材料总体文本难度基本处于“较易”水平;词汇层面没有明显变化,衔接层面有一些波动。表明2019年的文本衔接水平显着高于其他9年的命题材料,而2021年的命题材料由于语义重叠程度较高,衔接水平显着低于其他年份。此外,2012年至2021年命题材料的阅读理解在阅读量和语法水平上都发生了明显变化。这主要体现在这十年间命题材料的阅读量显着增加,句法复杂度下降,句法相似度提高。这些变化整体上是“互补”的,保持了命题材料文本难度的一致性。
其次,2012年至2021年北京中考英语阅读理解命题材料在难度上没有显着差异,并且这五份命题材料的排列呈现出文本难度的不规则变化。具体来看,大部分年份的五种命题材料的文字难度没有显着差异,基本处于“标准”或“较简单”的难度水平。文本难度较高的命题材料基本集中在C章和D章,以及A章B、B章,阅读和答题的命题材料都比较简单。在命题材料的排列上,每年的五篇阅读命题材料并不是按照文字难度从易到难的顺序排列,而是不规则地排列。
基于以上两个结论,本研究对中考英语阅读命题材料的选择提出两点建议:一是为了保证中考英语阅读命题材料文本难度的稳定性。中考考生在选课时要运用科学技术手段。对命题材料的各项指标进行综合分析,并根据分析结果对文本进行调整,在阅读量增加的趋势下适当降低其他级别的难度;其次,部分年份北京中考英语阅读理解部分存在个别命题材料文本难度过高或过低的问题。因此,命题作者在选择和编排命题材料时,应首先评估每个命题材料的文本难度,避免出现极难或极易的现象,然后定期根据难易程度对命题材料进行评价,以易为原则。先难后难。合理安排,保证考生有良好的阅读体验。
六、结论
参考
1Chen, A. ELT 系列教材中文本难度发展的批判性评价: 基于语料库的变异邻域聚类方法J.系统,2016,58: 64-81。
2Flesch, R. 一种新的可读性标准J应用心理学杂志,1948,3: 221-233。
3 Fulcher, G. 文本难度和可访问性:阅读公式和专家判断J.佩加蒙,1997 年,25 (4): 497-513。
4Graesser, A. C. Jeon, M. Yan, Y. Cai, Z. 文本和辅导对话中的话语衔接J.信息设计杂志,2007,15 (3): 199-213。
5Graesser,A. C.McNamara,D. S.Louwerse,M. M. Cai,Z. Coh-Metrix: 文本衔接和语言分析J行为研究方法,仪器计算机,2004 年,36 (2): 193-202。
6Green, A. Unaldi, A. Weir, C. 经验主义与鉴赏力: 在学术阅读测试中确定文本的恰当性J.语言测试,2010,2: 191-211。
7廖丽.平行学术类雅思考试阅读试卷难度与任务特征的比较研究J英语教学,2020,13(1): 31-42。
8Plakans,L. Bilki,Z. ESL 阅读中的衔接特征: 初级、中级和高级教材的比较J外语阅读,2016,28(1),79-100。
9Ryu, J. Jeon, M. 基于Coh-Metrix 的韩国中学英语教材跨年级文本难度分析J亚洲TEFL 杂志,2020 年,17 (3): 921-936。
[10]陈安妮,郭爱萍.基于Coh-Metrix ——的大学英语教材难度等级研究——以《新视野大学英语》第三版为例[J].教育理论与实践,2019,39(6)。
[11] 黄丽艳,王家英。基于Python和Coh-Metrix的高考“一年两考”阅读文本复杂度分析J.外语测试与教学,2020(3)。
[12] 黄丽艳,史碧冰加强我国英语中考命题工作的思路与方法[J].中小学外语教学,2020,43(7)。
[13]蒋锦林. Coh-Metrix工具在外语教学与研究中的应用[J].中国外语,2016(5)。
[14]蒋锦林,韩宝成。基于Coh-Metrix的大学英语六级与托福、雅思阅读文本难度研究J.中国外语,2018,15(3)。
[15] 陶百强.高考英语命题试卷——的研究与思考——以2018年高考英语国卷为例[J].中国考试,2019(2)。
A Study on the Text Difficulty of the Reading Materials in the Reading Comprehension Section of Beijing High School Entrance Examination
葛兴杰Z
hao Lianjie Abstract: The reading materials in proposition are the foundation of the reading tests and the text difficulty of the materials is a key factor that affects the quality of proposition. This study uses the natural language processing tool Coh-Metrix to quantitatively analyze the text difficulty of 50 reading materials in reading comprehension section of the 2012-2021 Beijing Senior High School Entrance Examination. The study finds out that the overall text difficulty of the English reading comprehension proposition materials in the Beijing Senior High School Entrance Examination is basically the same over the reading materials in 2012-2021, but there are significant differences in reading volume, syntax, and cohesion; There exists obvious differences on text difficulty in some years, and distribution of the reading materials is irregular on the text difficulty. This study provides empirical support and reference for the selection and regulation of English reading comprehension materials in the High School Entrance Examination. Key words: text difficulty; reading material; High School Entrance Examination; reading test
用户评论
这个研究很有意义,希望能帮助我们更好地理解北京市中考英语阅读理解的命题趋势。
有10位网友表示赞同!
文本难度研究,太重要了!直接关系到考试的公平性和学生的学习效率。
有10位网友表示赞同!
期待看到研究结果,希望能够为中考英语阅读理解教学提供一些指导。
有12位网友表示赞同!
北京市中考英语阅读理解,一直都是备考的重点,这个研究值得关注。
有9位网友表示赞同!
文本难度分析,可以帮助老师更精准地选择教学材料。
有12位网友表示赞同!
研究结果会影响学生的备考方向吗?
有20位网友表示赞同!
希望研究能够帮助学生更好地理解和应对考试。
有5位网友表示赞同!
研究结果会公开吗?
有6位网友表示赞同!
文本难度研究,很专业,期待更深入的分析。
有7位网友表示赞同!
研究内容很实用,可以帮助学生提高阅读理解能力。
有10位网友表示赞同!
中考英语阅读理解,一直是学生学习的难点,希望能找到解决方法。
有10位网友表示赞同!
这个研究很有参考价值,希望能得到更多相关信息。
有11位网友表示赞同!
文本难度研究,是提高英语教学质量的关键。
有8位网友表示赞同!
研究结果会对教材编写有什么影响吗?
有18位网友表示赞同!
希望研究能够帮助学生减轻学习压力。
有15位网友表示赞同!
文本难度分析,可以帮助我们更好地理解学生的认知水平。
有17位网友表示赞同!
这个研究非常及时,可以为中考英语教学提供新的思路。
有8位网友表示赞同!
期待研究能够带来更多创新性的成果。
有8位网友表示赞同!
文本难度研究,对于英语教育的改革具有重要意义。
有7位网友表示赞同!
希望研究能够促进英语教学的良性发展。
有16位网友表示赞同!