“汉语处理相关问题研讨会”会议简报

“汉语处理相关问题研讨会”会议简报

2010年3月25日上午8:30-12:00,“汉语处理相关问题研讨会”在北京大学计算语言学研究所会议室召开。此次会议是围绕汉语语篇处理的相关问题展开的,由北京大学计算语言学教育部重点实验室组织的跨学科研讨会。与会师生分别来自北京大学、中国人民大学、北京语言大学的计算机系、中文系、英语系、心理系等院系。
北京大学计算语言学研究所所长、计算语言学教育部重点实验室主任王厚峰主持了此次研讨会,并首先做了题为《由语篇分析想到的…》的发言。该发言着重阐明本次会议的宗旨。发言首先指出,目前计算机信息处理的应用需求主要集中在语篇语义的理解和形式分析上,如自动摘要、人机问答、检索、翻译等等,而这些信息处理应用需求的研究都涉及到以什么作为语篇研究的基本单位问题。发言简单介绍了国外语言学关于语篇、语篇的衔接与连贯、指代的作用和修辞结构理论。王所长着重指出,以上理论都涉及“如何界定语篇中的句子,句子对于理解语篇所起的作用究竟有多大”的问题,而汉语的句子如何定义一直是难点问题,希望能够借鉴对语言本体、认知心理的研究,来帮助解决计算分析中遇到的一些困难。
第二位发言人为北京大学汉语语言学研究中心主任、中文系教授王洪君,题目《现代汉语语篇的最小单位及其与英语小句的比较》。发言首先从学界公认的英语语篇的两级单位——小句入手,提出语篇应该分为基本单位和次级单位,基本单位可以独立组成次级单位,也可以多个组成次级单位。基本单位的特点有二:1、韵律/文字•语法•语用三层面单位的交汇;2、有封闭性的形式。英语小句的韵律形式为平拖式语调(末尾延长,语调较平、升降小),文字形式为逗号,常态语法形式为具备一个定式动词的主谓结构,语用上具有与说话当时语境相关的时范畴和与交际意图、角色相关的语气范畴。其中,韵律、文字、语法三者均为封闭的形式。而次级单位句子的特点则是韵律上的升降加停顿式语调,文字上的句号,两个或多个具备定式动词的主谓结构,彼此按有限的逻辑关系连接。然后,她简单介绍了对汉语语篇单位的不同命名:短语说、零句说、小句说、标点句说、逗(读)说。最后,她重点探讨了汉语语篇单位与英语小句、句子两级单位的同与不同。她指出,汉语与英语一样具有基本和次级两级语篇单位,这两级单位与英语的小句与句子的相同之处有三点:1、韵律上都有平拖式和剧升降加停顿式两种语调,书面上都有逗号、句号两级标点,可分别作为语篇两级单位封闭性的形式标记;2、语用上都表达说者的一个意图、与听话人的一个交互、一个传信或传疑的范畴;3、最小单位可以独立构成次级单位,也可以组合起来构成次级单位,小单位与上级单位边界重合处用上级单位的形式标记。不同则表现在:1、基本单位在语法上没有封闭的形式:不要求是主谓结构,不要求一个定式动词。(短语说、零句说、小句说、标点句说其实都看到了这一点。)2、基本单位之上的结合关系没有限制,除并列、转折、条件、因果等关系之外,还可以是多种多样的说明关系。也即,汉、英语篇单位的共同点是可以分为两级,不同点是基本单位的内部结构方式和外部结构方式。她指出,为便于语言间的比较,汉语语篇单位的命名也可以叫做小句、句子,但一定要清楚它与其他语言小句和句子的不同;为强调汉语单位自身的结构方式和封闭形式不在语法层面,可取我国传统术语逗与句,逗与句是韵律形式与文字形式交汇的单位。最后她着重强调,命名并不十分重要,重要的是我们实际遇到了什么样特点的单位。明确了单位的实际特点,应该把研究精力迅速转移到以下任务:1、逗、句与不同层级语用范畴的关系;2、逗组成句有多少常用的模版。
王洪君还代北京语言大学副教授王静做了《关于话题链的一些想法》的简要报告。王厚峰老师对王静报告的有关汉语语篇的话题及话题链问题十分感兴趣,希望能对汉语语篇次级单位的界定和形式分析提供新的思路,当场决定另择时间召开另一次语篇问题研讨会,专门讨论王静的报告和汉语话题链的问题。
第三个发言是北京大学脑科学与认知科学中心、心理学系周晓林教授的《不同句法层级上的句法、语义加工:ERP和fMRI证据》。该报告首先着重介绍了心理学自身的研究目的和研究方法:心理学对语言的研究,目前已经与神经科学交叉,形成认知神经科学,其目的是探询人脑中语言加工的机制和加工过程。其研究方法是:控制、平衡无关变量,操纵感兴趣的自变量、观察因变量上的效应,建立自变量与因变量之间的因果关系;也即一定要把实验条件限制到最小对立。然后介绍了实验设备(脑电仪、眼动仪、核磁共振等)和他们对汉语的汉字的几项研究:汉字声符对汉字语义认知的影响,汉语的词汇语义与句法认知在大脑中是否位于不同的区域(如把字句不同层次的搭配错误,名词与量词或动词在不同层次上的搭配错误等,在大脑中的反应区域的确有不同),汉语韵律节奏模式的认知,语义焦点与语义辖域 (semantic scope)的加工,语言理解过程中情绪和社会信息的加工,汉语阅读文本过程中的眼动控制机制,等等。认知神经学对语言研究的全面介入以及学科特有的研究目的和研究方法,给与会者留下了深刻的印象。
第四个发言是中国人民大学外国语学院王大方老师的《基于语篇结构分析的回指优选解析》。该报告是在她博士论文(北京大学英语系,姜望琪老师指导。论文在许多方面得到北大计算语言所老师们的帮助)基础上摘要而成。该研究综合利用定中心理论、修辞结构理论、优选论对英语语篇中的第三人称代词在语篇层面的使用和解析进行研究,根据报刊上的真实语料,对已有理论进行整合和调整,提出了一个整体的分析模型:1.区分语篇局部分析和宏观分析两级单位分别为: a. 基本单位(Elementary Discourse Unit,EDU),在英语中为小句,但剔除主语从句、表语从句、宾语从句、限定性定语从句等与语篇主线发展无关的降级成分。b. 次级单位:ARU(Atomic Rhetorical Unit,最小修辞单元),这是一个作者根据英语真实语料的回指情况而总结出的一个新概念,用以作为研究英语语篇指代范围的、大于小句的上级单位。3、根据单核/多核、相似/因果/邻近/表述关系等要素把小句之间的广义修辞关系总结为详述、对比、列举、原因、条件、先后顺序、背景、证据8种,并对它们进行了详细分类,为进一步探究语篇宏观结构与回指现象之间的关系奠定了理论基础。4、利用Fox(1987)在修辞结构的框架下定义的两种回指分布基本模式,即积极模式和控制模式,来解读聚焦空间的推进和跃迁,并以此作为确定ARU的边界控制因素。5、选择Agree >> Disjoint>> Recency >> Parallelism >> Saliency >> Align(Recency: EDU>> ACTIVE>> CONTROLL,Saliency: FORM >> EMPATHY >> FOCUS >> TOPIC)作为评估的优选标准,选出正确的指代先行语。最后,借助一个小型英文语料库,对这一优选模型的工作效度进行了检验,其正确率达到95.24%。作者的工作,特别是自创设立并取得很好工作结果的ARU(Atomic Rhetorical Unit,最小修辞单元)概念得到与会者极大的重视,认为这对于如何确定汉语中大于小句的那级单位有很大的启发。但也指出,汉语零形回指多(基本单位不要求具备定式动词的主谓结构)和基本单位之间可以是多种多样的话题-说明关系的两大特点,肯定会对汉语ARU(Atomic Rhetorical Unit,最小修辞单元)的确定标准有重要影响。作者表示下一阶段也将对对汉语中(零形)回指现象进行考察,对汉语的ARU(Atomic Rhetorical Unit,最小修辞单元)进行研究。
会上几位老师的发言引起了与会者强烈的共鸣和热烈的讨论。由于汉语自身的独特性质,对汉语语篇的研究必定会与英语等语言有同有不同,会遇到许多的新问题和新困难。此次研讨会上来自不同学科背景的研究者对于汉语语篇单位、回指现象、心理认知、自然语言处理等等问题所做的研究,彼此碰撞而互有启发,有望推动汉语研究向纵深发展。
爱语报道


发布者:hamburger

发布时间:2010-4-1 18:12:26

返回