基于自然语言处理的空间关系抽取



报告人邱晓枫
报告时间2021-12-09
讨论组语法理论与语言工程
关键词空间概念 信息抽取
摘要或简介

这篇论文以自然语言描述空间关系为研究对象,提出了一套基于自然语言描述的空间概念建模方案,主要包含以下两方面工作
1.研究了空间本体库构建技术。分析了空间本体库构建需要解决的关键问题,提出了一种空间本体概念、若干关系定义以及基于半自动化实例获取方法。在此基础上,综合利用汉语语义库、图形资源构建了小规模的空间本体库。
2.研究了篇章级空间关系抽取技术。提出汉语描述空间关系的形式化描述,把抽象空间关系抽取为二值分类问题,在词性标注的基础上,结合词性、空间语义等特征,利用线性分类器分层次地实现了篇章级空间关系抽取。

发布人obito
发布范围全网
讨论记录

1.文章关于本体的认识并不清晰,基于SUMO的分类方式并不成体系,概念比较杂乱(如“词形”和“边界”同处一级、部分概念不必要)
2.行文安排上并没有显示所要研究问题——空间关系抽取的难点和对应解决措施
3.最终分步抽取空间关系的模型性能计算与原目标不吻合(老师举例:抽取婚姻关系 ≠ 抽取已婚男性+抽取已婚女性)
4.文章关注的空间关系形式“介词+界标+方位”覆盖范围有限,未来工作要考虑自然语言中空间关系的完备性

下载次数816
浏览次数1936

下载文献(7.6 MB) 查看幻灯片(1.7 MB)  登录后可执行更多操作


© CCL of   Peking University  2019