汇报博士论文进展:基于树库的现代汉语“wh-条件句”的自然语言理解与知识发现研究



报告人王佳骏
报告时间2021-12-16
讨论组语法理论与语言工程
关键词疑问代词复现;树库;自然语言理解;知识发现
摘要或简介

本次组会汇报了博士论文选题情况以及开题前的推进工作。博士论文拟于自然语言理解和语言学研究的双重背景下,对现代汉语中的同形疑问代词复现结构(暂拟称之为“wh-条件句”)进行研究,主要包含以下四部分内容:
1. 如何在疑问代词复现的实例中正确地识别出带有条件关系的用例(对应NLP的消歧任务);
2. 如何补全实例中省略的论元(对应NLP的语义角色标注任务);
3. 如何确定实例所具有的特殊意义(对应NLP的消歧任务);
4. 探索从语料中以自动或半自动的方法归纳体现“wh-条件句”的性质的语言特征的路径(对应NLP的知识发现任务)。
目前已从CCL语料库中获得1200余条“多少”重复出现的用例,完成了负例的树库的构建,并归纳出了用于排除负例的规则,理论上可以排除本研究所采用的树库样本中92.7%的负例。

发布人王佳骏
发布范围讨论组内部
讨论记录

下载次数0
浏览次数1885

 登录后可执行更多操作


© CCL of   Peking University  2019