英汉语料库汇总

2022-04-13 17:51:16   第一文档网     [ 字体: ] [ 阅读: ] [ 文档下载 ]
说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。下载word有问题请添加QQ:admin处理,感谢您的支持与谅解。点击这里给我发消息

#第一文档网# 导语】以下是®第一文档网的小编为您整理的《英汉语料库汇总》,欢迎阅读!
语料库,英汉,汇总

1.英语学习者语料库(书面语及口语)中国学习者语料库 CLEC100万)广外、上海交大 2.大学英语学习者口语语料库 COLSEC (5) 上海交大

3.香港科技大学学习者语料库 HKUST Learner Corpus 香港科技大学 4.中国英语专业语料库 CEME (148) 南京大学

5.中国英语学习者口语语料库 SECCL (100) 南京大学

6.国际外语学习英语口语语料库中国部分 LINSEI-China (10) 华南师大 7.硕士写作语料库 MWC (12) 华中科技大学 9.平行语料库 汉英平行语料库 PCCE 北外 10.南大-国关平行语料库 南京大学 11.英汉文学作品语料库; 外研社

12.冯友兰《中国哲学史》汉英对照语料库

13.李约瑟(Joself Needham)《中国科学技术史》英汉对照语料库

14.计算机专业的双语语料库;国家语言文字工作委员会语言文字应用研究所 15.柏拉图(Plato)哲学名著《理想国》的双语语料库 16.英汉双语语料库(15万对) 中科院软件所

17.英汉双语语料库:LDC香港新闻英汉双语对齐语料36294段以及香港法律英汉双语对齐语料31万句子对中国科学院自动化研究所 18.英汉双语语料库(100)网上英汉语段电子词典及网上电子英汉搭配词典(1000) 北大学

19.英汉双语语料库(40-50万句子对) 哈尔滨工业大学 20.双语语料库(5万多对) 北京大学计算语言学研究所

21.对比语料库 LIVAC(Linguistic variety in Chinese communities) 香港城市理工大学 22.平衡语料库(Sinica Corpus);树图语料库(Sinica Treebank) 台湾 23.特殊英语语料库 中国英语(China English)语料库河南师范大学 24.军事英语语料库(Corpus of Military Texts) 解放军外语学院 25.新视野大学英语教材语料库 上海交通大学

26.汉语语料库汉语现代文学作品语料库(1979年,527万字) 武汉大学 27.现代汉语语料库(1983,2000万字) 北京航空航天大学 28.中学语文教材语料库(1983,1068000) 北京师范大学 29.现代汉语词频统计语料库(1983,182万字) 北京语言学院

30.国家级大型汉语均衡语料库(2000万字) 国家语言文字工作委员会 31.《人民日报》语料库(2700万字) 北京大学计算机语言学研究所 32.大型中文语料库(5亿字,10分库) 北京语言文化大学 33.现代汉语语料库(1亿字) 清华大学

34.汉语新闻语料库;(1988,250万字) 山西大学 35.标准语料库(2000,70万字)

36.生语料库(3000万字);《作家文摘》的标注语料库(100万字) 上海师范大学 37.现代自然口语语料库 中国社会科学院语言所

38.旅游咨询口语对话语料库和旅馆预定口语对话语料库中国科学院自动化所 39.北京大学汉语语言学研究中心的三个语料库


现代汉语语料库

http://ccl.pku.edu.cn/yuliao.asp?item=1 古代汉语语料库

http://ccl.pku.edu.cn/yuliao.asp?item=2 汉英双语语料库

http://ccl.pku.edu.cn/yuliao.asp?item=3 http://www.corpus4u.org/printthread.php?t=2742

汉语语料库使用权限



国家语委语料库http://219.238.40.213:8080/CpsQrySv.srf虽说是通用型平衡语料库,但不能完全免费使用;

北京语言大学的汉语语料库(http://202.112.195.8)语料产出时间较早,且不能完全免费使用;



http://ccl.pku.edu.cn/YuLiao_Contents.Asp)规模最大,逾亿字,但取样极不均衡,多半为 文学作品;

台湾中央研究院”Sinica Corpus也是可免费使用的平衡汉语语料库。但是它只能代表台湾地区的汉语,无法反映中国大陆的汉语状况。详情可访问Sinica Corpus官方网站http://www.sinica.edu.tw/ftms-bin/kiwi.sh

PH语料库包含的是19901月至19913月新华社出版的新闻。该语料库规模为3,260,416字。通过ftp://ftp.cogsci.ed.ac.uk/pub/chinese/可获得该语料库。


本文来源:https://www.dywdw.cn/a7c936c0dc3383c4bb4cf7ec4afe04a1b171b04b.html

相关推荐
推荐阅读