生命科学

生命科学学术英语语料库的创建

1.引言

多学科交叉是现代生命科学的重要特征。生命科学学术英语语料库建设对了解其语言表述规范、促进中国学术成果的国际发表、英语教学的语境化实证研究都具有重要的理论意义与应用价值。语料库按照所选取语料的特点可分为通用语料库、专用语料库、单语语料库、平行语料库及多语种语料库等不同类型。通用语料库一般较大,用来描写某一语言的全貌(梁茂成等 2010)。专用语料库通常较小,并不旨在全面代表某种语言的整体,而是只反映该语言的特定部分,这其中一个重要的专业研究领域是学术英语(Lee 2010)。

从20世纪80年代开始,随着计算机技术的发展、网络技术的广泛运用,语料库相关研究取得了令人瞩目的成就。“语料库开发正在向两头快速发展和延伸”:“一是通用型的、基于网络的超大型语料库开发”,“二是个性化、专门化、行业化的小型语料库开发”(桂诗春等 2010)。国外大型、超大型的通用语料库有英国国家语料库(BNC)、美国当代英语语料库(COCA)等。专门化语料库中,发展比较迅速而且影响力较大的是学术英语语料库。继美国密歇根大学的学术口语语料库(MICASE)之后,各国家地区同类语料库相继建成,包括英国学术英语口语语料库(BASE)、利默里克-贝尔法斯特学术英语口语语料库(LIBEL CASE)、香港城市大学学术英语口语语料库(CUCASE)、香港理工大学口语语料库(HKCSE)。随后,密歇根高水平学生论文库(MICUSP)、英国学术书面英语语料库(BAWE)、香港理工大学研究论文库2007(CRA 2007)、香港理工大学期刊文章语料库(CRA 2014)等一批书面语学术语料库相继建成。个人自建学术语料库有Coxhead的学术语料库(Coxhead’s Academic Corpus)、Hyland的期刊论文和学术访谈语料库。在中国大陆地区,继上海交通大学科技英语语料库(JDEST)之后,许多机构或个人也相继建设了基于本校或个人教学、科研需求的专用学术英语语料库。例如广州石油大学的“石油英语语料库”、对外经济贸易大学的“商务英语语料库”、黑龙江大学的“商务英语语料库”、大连海事大学的“海事英语语料库”以及东华大学的“东华大学科技英语语料库”等。

语料库的出现对语言研究产生了巨大影响(何中清、彭宣维 2011)。国内学者于1992—2015年24年间在核心期刊上发表的语料库语言学相关研究论文数量达3,128篇,涵盖语言教学、语料库理论研究、语义研究、翻译研究、词汇研究、语法研究等多个领域(张新杰 2017)。然而,国内生命科学领域的语料库相关研究还不够深入。迄今为止,在中国知网检索到相关论文11篇,其中9篇与农业学科相关,6篇讨论语料库建设。如范晶晶、李丽霞(2014)提出了创建农业学术英语语料建设构想;吴蕾等(2014)探讨了如何建立科技语料库,举例说明了生命学科语料库的目录及文档命名方式;王敏、李丽霞(2014)以及李丽霞、白璐(2016)自建涉农新闻小型语料库,做了名词化、被动语态、主题词语义场等方面的语言特点分析。刘佳、韩丽娜(2014)基于自建语料库考察了Coxhead(2000)编制的通用学术词表在环境科学专业英语学习中的适用性;刘萍等(2015)探讨了农科学术英语论文语料库的创建及其在博士生和本科生学术写作教学的应用;陶玲(2017)指出建立小型专业化语料库对农业科技期刊英文摘要编写十分重要。

以上分析表明,生命科学学术英语语料库存在重复建设、复用率低的问题。现有语料库资源,特别是某些院校建设的较大规模的科技语料库子库,由于知识产权等各种原因,不对外开放,难以实现资源共享。因此,建立一定规模、可共享的生命科学专业学术英语语料库十分必要。

BioDEAP生命科学学术英语语料库是北京外国语大学中国外语与教育研究中心语料库共建项目DEAP学术英语语料库(Database of English for Academic Purposes)子库。BioDEAP语料库包含1,023个文本,共计5,131,276词次。

2.建库目标

BioDEAP语料库的宗旨是服务我国语言教学及研究,创建一个覆盖我国生命科学领域12个二级学科领域权威英语期刊常用语类的全文数据库。设计总库容量为500万词。该语料库由研究论文与综述、讨论、书评、通讯四个学术语类子库构成,其中研究论文与综述子库下设12个分库(见表1)。

表1 生命学科学术英语语料库结构1.研究论文与综述 2.讨论 3.书评 4.通讯植物学 遗传学动物学 发育生物学生理学 细胞生物学水生生物学 生物化学与分子生物学微生物学 生物信息学与计算生物学神经生物学 生物物理学

上一篇:推进生命科学专业英语课程教学改革的探索与实
下一篇:没有了