基于《西塞尔内科学》的医学英语词表构建
http://www.100md.com
2011年4月1日
摘 要: 医学词汇是医学英语学习中需要掌握的重要环节,而医学词汇往往由于其术语量大,单词长,发音不规则,难记,而使医学英语学习者望而却步。与此同时,编纂常用医学词汇表就是解决这一困境,提高医学词汇教学效率的有效手段。而文献检索表明,虽然许多语言学家构建了一些相关医学方面的词汇表,但也仅仅局限于生物,微生物,化学方面,关于内科学的词汇表是少之又少。所以,本文正是以帮助学生提高单词记忆的效率和专业英语学习的有效性为出发点,以语料库,医学英语构词特点,词频统计为理论基础,旨在构建内科学英语词汇表,从而进一步将其设计为可供医学英语学习者使用的数据库。
医学术语的构词特点是可拆分性,即可以拆分为词根、前缀、后缀,而掌握这一原理可以提高单词记忆的效率。具体而言,此研究以《西塞尔内科》为语料库,通过一个专门为本研究设计的词频统计软件,截取出在《西塞尔内科学》中出现频率较高的大约8000个单词,参考GWL和AWL词表,最终建立了两个基于内科学的词汇表,旨在帮助医学英语学习者更好地掌握医学专业词汇。
, 百拇医药
关键词: 西塞尔内科学; 医学术语; 词频; 词汇表; 学习者语料库; 数据库
中图分类号: H313 文献标识码: A 文章编号: 1009-8631(2011)04-0197-02
一、引言
词汇学习往往是许多英语学习者碰到的最大问题。而对于医学英语学习者而言,更是如此。因此,如何快速、准确、高效地掌握浩如烟海,生僻冗长的医学词汇,对医学英语学习者尤为重要。
通过大量的文献检索以及理论研究,笔者发现建立一个针对医学英语学习者的词汇表,可以更好地帮助其学习、记忆相关的医学术语。所以,此论文针对医学英语学习者为主要设计对象,以医学内科界的权威书籍―――《西塞尔内科学》为语料库,通过自己设计的词频统计软件,主要以词频为统计依据,并参考了GWL & AWL 词汇表,生成了两个以《西塞尔内科学》为基础的医学英语词汇表。
, 百拇医药
二、理论基础及相关术语
1.语料库―――《西塞尔内科学》
《西塞尔内科学》因为以下几个原因被选为语料库:
第一,悠久的历史;第二,久负盛名的出版商;第三,广泛涵盖内科学;第四,权威的编纂者;第五,方便的资源。第22版的《西塞尔内科学》随书赠送光盘,有电子版本可以利用,方便词频统计软件进行词频统计;第六,医学界一致的好评;第七,遍布全球的读者。
2.词频
词频主要应用于一下几个方面:语料库中的应用;英语教学中的应用。特别要指出词频在语言以及第二外语教学中起到至关重要的作用,因为从学习者的角度而言,根据词频学习单词能节省学习者的时间,给学习者一个学习框架,并指导其找到词汇学习的重点。这也是作者设计此论文的目的以及意义所在。
, http://www.100md.com
3.词频统计软件
随着计算机的迅猛发展,越来越多的词频统计软件被开发和应用。在词频统计方面,最有名的就是1996年由牛津大学开发的Wordsmith Tool Package。考虑到软件的针对性以及可操作性,此次,作者专门根据论文的需要自行设计了一个词频统计软件。
4.前缀 后缀以及词根
大多数的医学词汇都由前缀、后缀、词根以及连接元音组成,因此,了解医学词汇的构造及掌握其拆分为前缀、后缀以及词根的规则能够有效地帮助医学英语学习者学习医学术语。其中,词根是单词的基础,包含词汇的基本信息和语意。比如:Hepat/ico, Hepat/o 的意思是“liver” 即肝脏的意思;Nas/o 的意思是“nose”即鼻子的意思。而前缀一般则是放在词根前面并且起修饰作用的成份,它一般不单独出现。比如:Arthr的意思是“joint”即关节的意思;Cardio/Cardia的意思是“heart”即心脏的意思。后缀一般则是放在词根后面的成份。比如:-hal的意思是“breathing”即呼吸的意思;-therapy的意思是“heal and cure”即治疗的意思。而连接的元音则是为了方便单词朗读。通过对语料库中词汇的分析,笔者发现了以下7种常见的组合方式:
, http://www.100md.com
1)前缀+词根
2)词根+后缀
3)前缀+词根+后缀
4)前缀+前缀+词根
5)词根+后缀+后缀
6)前缀+词根+词根
7)前缀+前缀+词根+后缀+后缀
5.GWL & AWL 词汇表
在论文的第四步,需要根据GWL & AWL词汇表对单词进行分类及排序。
GWL 是General Service List的缩写。包含有对英语学习者而言最基本的2000个词汇,此论文中应用的词表是1995年由John Bauman and Brent Culligan创立的。此词汇表不仅包括1953最初的2000个单词,还包括在Brown Corpus出现频率较高的284个单词。
, http://www.100md.com
Academic Word List(简称AWL,即英语学术词汇表)包含了学术英语中使用频率最高的570个词目。近年来,最具影响力的成果便是Coxhead(2000)的学术词汇表。2000 年,Coxhead 依照语料库构建标准建立了一个学术英语语料库。该库从学术期刊、教科书中收集了400 多位研究者的文章,约350 万字符,包含文、商、法、理工4 个子库,每个子库又分别囊括了7 个专业, 共28 个专业。以此为基础,Coxhead 编制了包括570 个词族的“学术词汇表”。由于AWL以大量真实的学术英语语料为基础,采用了合理的构建方法。不仅科学地指出ESP(English for Specific Purpose)即学术英语教学中哪些词汇应该被包含在学习材料中。同时,AWL 子表的编排也为ESP 教材的编写和词汇教学的顺序提供了一定依据。该子表在指导EAP 教学方面的重要性正逐步受到教学界的重视。
三、设计步骤
本论文试验设计具体如下:根据《西塞尔内科学》设计一个语料库。第二,根据专门设计的软件以《西塞尔内科学》为语料库计算出词频。第三,根据词频将单词排序。第四,根据GWL & AWL将单词分为医学常用词汇表和医学术语词汇表。第五,医学英语的老师以及学生进行检查以及核对。
, 百拇医药
四、进一步应用
本论文为医学英语教学以语料库为研究对象提供了思路和方法,也在计算机辅助语言教学方面做了尝试。更重要的是,形成的医学词汇表,以及在此基础上衍生的数据库,不仅为医学英语的教材编写,词汇大纲的确定提供了有益的参考,更对医学英语教学提供了有效的教学辅助手段。
还可以进一步根据词表,将其编纂成相关的数据库软件。数据库内容可以涉及到:该单词在《西塞尔内科学》中出现的频率,词根、前缀、后缀的拆分,汉语意思,术语解释,词组,同义词,反义词,以及《西塞尔内科学》中的原始例句等等。
参考文献:
[1] Claude,B,J,M.D and Fred P,M.D. (2003).Cecil's Textbook of Medicine(22nd). W.B SAUNDERS
, 百拇医药
[2] William J. Dyche, Ph.D.( August, 2005). Medical Terminology. Des Moines?University.
[3] Health Sciences Center Library .(2000) Building Medical Vocabulary.Stony Brook University
[4] John M. Kirk.(2005). Word Frequency and Keyword Extraction.AHRC ICT Methods Network Expert Seminar on Linguistics: Lancaster
[5] Geoffrey,L.(2001). Word Frequencies in Written and Spoken English: based on the British National Corpus[M]: Longman, London
[6] Bauer L.(1983).English Word Formation. Cambridge: Cambridge University Press,311 pages., http://www.100md.com(姜雨孜)
医学术语的构词特点是可拆分性,即可以拆分为词根、前缀、后缀,而掌握这一原理可以提高单词记忆的效率。具体而言,此研究以《西塞尔内科》为语料库,通过一个专门为本研究设计的词频统计软件,截取出在《西塞尔内科学》中出现频率较高的大约8000个单词,参考GWL和AWL词表,最终建立了两个基于内科学的词汇表,旨在帮助医学英语学习者更好地掌握医学专业词汇。
, 百拇医药
关键词: 西塞尔内科学; 医学术语; 词频; 词汇表; 学习者语料库; 数据库
中图分类号: H313 文献标识码: A 文章编号: 1009-8631(2011)04-0197-02
一、引言
词汇学习往往是许多英语学习者碰到的最大问题。而对于医学英语学习者而言,更是如此。因此,如何快速、准确、高效地掌握浩如烟海,生僻冗长的医学词汇,对医学英语学习者尤为重要。
通过大量的文献检索以及理论研究,笔者发现建立一个针对医学英语学习者的词汇表,可以更好地帮助其学习、记忆相关的医学术语。所以,此论文针对医学英语学习者为主要设计对象,以医学内科界的权威书籍―――《西塞尔内科学》为语料库,通过自己设计的词频统计软件,主要以词频为统计依据,并参考了GWL & AWL 词汇表,生成了两个以《西塞尔内科学》为基础的医学英语词汇表。
, 百拇医药
二、理论基础及相关术语
1.语料库―――《西塞尔内科学》
《西塞尔内科学》因为以下几个原因被选为语料库:
第一,悠久的历史;第二,久负盛名的出版商;第三,广泛涵盖内科学;第四,权威的编纂者;第五,方便的资源。第22版的《西塞尔内科学》随书赠送光盘,有电子版本可以利用,方便词频统计软件进行词频统计;第六,医学界一致的好评;第七,遍布全球的读者。
2.词频
词频主要应用于一下几个方面:语料库中的应用;英语教学中的应用。特别要指出词频在语言以及第二外语教学中起到至关重要的作用,因为从学习者的角度而言,根据词频学习单词能节省学习者的时间,给学习者一个学习框架,并指导其找到词汇学习的重点。这也是作者设计此论文的目的以及意义所在。
, http://www.100md.com
3.词频统计软件
随着计算机的迅猛发展,越来越多的词频统计软件被开发和应用。在词频统计方面,最有名的就是1996年由牛津大学开发的Wordsmith Tool Package。考虑到软件的针对性以及可操作性,此次,作者专门根据论文的需要自行设计了一个词频统计软件。
4.前缀 后缀以及词根
大多数的医学词汇都由前缀、后缀、词根以及连接元音组成,因此,了解医学词汇的构造及掌握其拆分为前缀、后缀以及词根的规则能够有效地帮助医学英语学习者学习医学术语。其中,词根是单词的基础,包含词汇的基本信息和语意。比如:Hepat/ico, Hepat/o 的意思是“liver” 即肝脏的意思;Nas/o 的意思是“nose”即鼻子的意思。而前缀一般则是放在词根前面并且起修饰作用的成份,它一般不单独出现。比如:Arthr的意思是“joint”即关节的意思;Cardio/Cardia的意思是“heart”即心脏的意思。后缀一般则是放在词根后面的成份。比如:-hal的意思是“breathing”即呼吸的意思;-therapy的意思是“heal and cure”即治疗的意思。而连接的元音则是为了方便单词朗读。通过对语料库中词汇的分析,笔者发现了以下7种常见的组合方式:
, http://www.100md.com
1)前缀+词根
2)词根+后缀
3)前缀+词根+后缀
4)前缀+前缀+词根
5)词根+后缀+后缀
6)前缀+词根+词根
7)前缀+前缀+词根+后缀+后缀
5.GWL & AWL 词汇表
在论文的第四步,需要根据GWL & AWL词汇表对单词进行分类及排序。
GWL 是General Service List的缩写。包含有对英语学习者而言最基本的2000个词汇,此论文中应用的词表是1995年由John Bauman and Brent Culligan创立的。此词汇表不仅包括1953最初的2000个单词,还包括在Brown Corpus出现频率较高的284个单词。
, http://www.100md.com
Academic Word List(简称AWL,即英语学术词汇表)包含了学术英语中使用频率最高的570个词目。近年来,最具影响力的成果便是Coxhead(2000)的学术词汇表。2000 年,Coxhead 依照语料库构建标准建立了一个学术英语语料库。该库从学术期刊、教科书中收集了400 多位研究者的文章,约350 万字符,包含文、商、法、理工4 个子库,每个子库又分别囊括了7 个专业, 共28 个专业。以此为基础,Coxhead 编制了包括570 个词族的“学术词汇表”。由于AWL以大量真实的学术英语语料为基础,采用了合理的构建方法。不仅科学地指出ESP(English for Specific Purpose)即学术英语教学中哪些词汇应该被包含在学习材料中。同时,AWL 子表的编排也为ESP 教材的编写和词汇教学的顺序提供了一定依据。该子表在指导EAP 教学方面的重要性正逐步受到教学界的重视。
三、设计步骤
本论文试验设计具体如下:根据《西塞尔内科学》设计一个语料库。第二,根据专门设计的软件以《西塞尔内科学》为语料库计算出词频。第三,根据词频将单词排序。第四,根据GWL & AWL将单词分为医学常用词汇表和医学术语词汇表。第五,医学英语的老师以及学生进行检查以及核对。
, 百拇医药
四、进一步应用
本论文为医学英语教学以语料库为研究对象提供了思路和方法,也在计算机辅助语言教学方面做了尝试。更重要的是,形成的医学词汇表,以及在此基础上衍生的数据库,不仅为医学英语的教材编写,词汇大纲的确定提供了有益的参考,更对医学英语教学提供了有效的教学辅助手段。
还可以进一步根据词表,将其编纂成相关的数据库软件。数据库内容可以涉及到:该单词在《西塞尔内科学》中出现的频率,词根、前缀、后缀的拆分,汉语意思,术语解释,词组,同义词,反义词,以及《西塞尔内科学》中的原始例句等等。
参考文献:
[1] Claude,B,J,M.D and Fred P,M.D. (2003).Cecil's Textbook of Medicine(22nd). W.B SAUNDERS
, 百拇医药
[2] William J. Dyche, Ph.D.( August, 2005). Medical Terminology. Des Moines?University.
[3] Health Sciences Center Library .(2000) Building Medical Vocabulary.Stony Brook University
[4] John M. Kirk.(2005). Word Frequency and Keyword Extraction.AHRC ICT Methods Network Expert Seminar on Linguistics: Lancaster
[5] Geoffrey,L.(2001). Word Frequencies in Written and Spoken English: based on the British National Corpus[M]: Longman, London
[6] Bauer L.(1983).English Word Formation. Cambridge: Cambridge University Press,311 pages., http://www.100md.com(姜雨孜)