基于最小递归语义学和广义量词理论的文本分析技术研究



报告人王佳骏
报告时间2019-04-24
讨论组语法理论与语言工程
关键词语义计算,广义量词,HPSG,语言知识工程
摘要或简介

本次汇报首先梳理了1995年至今最小递归语义的主要文献,然后以曾少勤(2012)为代表介绍了最小递归语义的原理和运用最小递归语义对汉语名词性量化结构进行建模的尝试。

最小递归语义不是一种语义学理论,而是一种基于类型特征结构(Typed Feature Structure)和合一运算的知识表示手段,属于一种元语言,其所要刻画的目标对象是带有广义量词的谓词逻辑。最小递归语义最早出现于 1992 年前后。一开始是为在HPSG框架内进行大规模语言知识库开发服务的,负责语义部分的表示和计算。经过几十年的发展,它的应用范围逐渐扩宽,也可应用于缺乏词汇知识库的 stochastic parser 之中。

最小递归语义有四个代表性特点:①保证表示语义信息的能力足够强大,研究者所关心的语义都能被表示出来(Expressive Adequacy);②保证可计算性(Computational Tractability);③和语法模块兼容(Grammatical Compatibility);④通过 handle 和 label 等机制的设计(详见后续幻灯片),使得扁平结构具备表示量词辖域等需要结构嵌套才能表示的现象。这样做一是降低了计算复杂度,二是允许语义不充分赋值(Underspecifiability),也就是当信息不足以对语义进行消歧的时候,用单个语义表示来表示歧义结构,而不是把所有的歧义结构全部生成出来——正所谓“让歧义飞一会儿”。

论文首先引入广义量词理论以及与之相关的类型论与λ演算过程,然后以汉语名词性量化结构为例具体地展示了最小递归语义的语义表示手段。接着,论文研究了汉语名词性量化结构的句法结构,并设计了HPSG框架下的类型层级,包括表示词类和句法范畴的类型化特征结构以及短语结构规则。最后,作者在LKB上实现了相应的类型层级、词库和句法规则库,并通过令系统分析22个例句检验了语言知识库的。

深入掌握最小递归语义需要以HPSG为基础,结合相关文献,在知识工程的实践中学习。

发布人王佳骏
发布范围全网
讨论记录

最小递归语义“未充分赋值”的特点实际上是保留歧义的一种方法,使得可以将阶段性分析结果作为“最终结果”呈现在用户眼前,而不是如果得不到无歧义的结果则宣告分析失败。另外,包括HPSG在内的“类型层级”实际上并不能很好地概括语言范畴之间的关系:在假设范畴层次的同时,需要引入新的机制来描述子范畴违背从父范畴处继承得到的特征的机制。范畴的层次并没有那么多,类型层级的层数具有弹性,而且难以重用。

下载次数5631
浏览次数5561

下载文献(32.7 MB) 查看幻灯片(2.0 MB)  登录后可执行更多操作


© CCL of   Peking University  2019