基于学习者语料库的日语复合动词偏误分析

2022-12-08 01:55:19   第一文档网     [ 字体: ] [ 阅读: ] [ 文档下载 ]
说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。下载word有问题请添加QQ:admin处理,感谢您的支持与谅解。点击这里给我发消息

#第一文档网# 导语】以下是®第一文档网的小编为您整理的《基于学习者语料库的日语复合动词偏误分析》,欢迎阅读!
偏误,语料库,日语,学习者,动词

要:本文通过学习者语料库中收集的大量例句,分析了学习者的复合动词偏误的类型及原因。在总结偏误的类型及其原因的基础上,对复合动词教学提出相应建议,就日语学习的复合动词偏误进行了探究。

关键词:复合动词;中介语;学习者语料库;偏误分析

一、引言

日语复合动词[1]数量多,使用频率高,日语学习中的一个重要项目。由于其前后项动词的复合规则、语义关系极其复杂,而现行日语教材亦鲜有将其列为教授内容的,因此复合动词成为日语学习中一个棘手的难题(松田2004,陈2008)

复合动词习得的先行研究多采用问卷调查形式,通过让学习者进行例句的正误判断或造句来收集数据。此方法数据规模小、调查范围局限大、调查对象单一。因此,迄今为止复合动词作为一个数量庞大构成复杂的词汇集合,需要“教什么”和“怎么教”的问题尚未有答案。计算机技术和学习者语料库的快速发展,为解决这个问题提供了可能。学习者语料库为广大学者、教师提供了大量真实的学习者的口语或书面语的语料,可以对学习者的词汇用法、语法特征特别是偏误等进行研究。本文以学习者语料库中抽取的复合动词例句为对象进行复合动词偏误分析。 二、理论背景

1967年,corder提出了偏误分析理论。该理论认为,二语学习者所出现的错误是语言学习过程中的一种正常现象,可以反映其语言习得的水平。通过偏误分析可以揭示学习者中介语系统中所存在的问题。偏误分析以中介语为研究材料,以目标语作为基准,对语言形式进行分析。corder将偏误(error)与失误(mistake)进行了区分。他指出“偏误”具有系统性,属于语言能力范畴。而“失误”具有偶然性,属于语言行为范畴。偏误分析重点研究学习者学习过程中出现的“偏误”而不是“失误”。其研究步骤大致包括偏误材料的收集(包括口语和书面语),和对偏误的辨认、描述、解释和评价。corder认为,学习者的偏误对语言教学有着积极的意义。通过分析学生的偏误,教者可得知需要教什么及怎么教,做到有的放矢,事半功倍。基于此,本文拟通过分析学习者的复合动词偏误,整理偏误的类型,探究偏误产生的原因,为复合动词教学提供参考。 三、语料库来源

为了全面把握学习者的复合动词偏误,本文在现今可用的日语学习者语料库中选择了 kyコーパス[2]」作为口语语料库,「日本語学習者による日本語作文と、その母語訳との対訳データベース[3](以下简称「作文对译db 作为书面语语料库进行研究。 (一)口语语料库---kyコーパス

kyコーパス是由镰田修和山内博之负责建成的opi[4]形式的口语语料库。学习者语料的总字数为390,907字。其中有以汉语、英语、韩语为母语的日语学习者各三十人,共计九十人的语料。

(二)书面语语料库---作文对译db

由日本国立国语研究所组织收集的日语学习者的作文语料库。其中有中国、印度、韩国10个国家的日语学习者所写的1,100多篇日语作文。学习者作文的总字数为44,359字。 四、偏误分析的方法

(一)复合动词例句的抽取及量化处理

先利用日语形态素[5]解析系统 chasen[6](茶筅) kyコーパス和作文对译db进行形态素解析。其次利用计算机编程语言perl抽取出所有“动词+动词”的例句。检查抽取到的例句,将不是复合动词的例句剔除,从而整理出所需的复合动词例句。


kyコーパス和作文对译db中,分别收集到194个和685个,共计879个复合动词例句。所有例句由日语母语者15人(其中日语教师8人)进行“正确”“不自然”“误用”判断。判断为“误用”及“不自然”的例句,要求写出判断原因和修改意见。15人中01判断为“误用”的例句统计为“正确”29人判断为“误用”或“不自然”的例句统计为“不自然”9人以上判断为“误用”的例句统计为“误用”。根据统计结果,参照日语母语者给出的修改意见进行复合动词偏误的分类。 (二)复合动词偏误的分类

如上所述,在偏误分析中,学习者的偏误可分为“失误mistake“偏误error两种。根据例句正误统计的结果,将所有复合动词例句的偏误分为“失误”(标记为“形式的偏误”偏误(本文标记为“复合动词的偏误”两大类。在这两大类里分别进行了小分类(见1。为了便于直观比较,对所有的例句按照“误用”计1分,“不自然”计0.5分进行了量化处理。同一个例句中同时出现多个类型的偏误时进行分值累计。 五、复合动词偏误的分布

从表1看出,作文对译db的字数是kyコーパス的近十分之一,然而复合动词偏误累计分值却是kyコーパス的四倍多。由于两个语料库的收集方式、学习者水平不一,不能简单地进行数值比较。但是从这个数值可知,书面语中的复合动词偏误率要远远高于口语。


本文来源:https://www.dywdw.cn/583eb2ce514de518964bcf84b9d528ea80c72f40.html

相关推荐
推荐阅读