“计算语言学概论”课程期末作业选题

 2021-2022学年第一学期

任课教师:詹卫东  

单位:北京大学中文系

 

请在下面题目中任选一个,完成期末报告。

要求:

(1)参照一般学术论文的格式完成期末报告(包含题目、摘要、关键词、 按层级划分章节的正文、参考文献等)。

(2)篇幅不少于5000字(或A4纸5号字6页)。

(3)期末报告通过电子邮件附件(word文件和/或pdf文件格式)提交。

(4)文件名格式为:学号_姓名_文章标题

 

选题1 词汇语义分析类选题

请选择一定数量的有某种语义共性的动词(也可以是一组形容词、名词、或者副词等),讨论这些词语的语义共性和特性与其句法表现之间的关系,并说明你所做的词汇语义分析在计算机自然语言处理中有哪些应用。

有某种语义共性的动词示例:

(1) 跟“言说”有关的动词: 告诉、通知、埋怨、抱怨、……

(2) 跟“交互”有关的动词: 商量、讨论、交流、吵架、顶嘴、……

(3) 跟“制作”有关的动词:写、画、烤、炸、建造、……

 …… 

 

选题2:句式分析类选题

选择两个有变换关系的句式(记作A和B),给出A和B之间能够变换与不能变换的实例,并从计算机如何判断能否变换的角度,讨论制约变换的条件是什么。

有变换关系的句式示例:

(例1) A = “把”字句  B = “被”字句

      a. 张三把李四打伤了  ->  李四被张三打伤了  (能变换)

       b. 他把脚撞伤了 ->  脚被他撞伤了    (不能变换)

 

(例2) A = N1 的 X + 比 + N2 的 X + VP    B = N1 + 比 + N2 + X + VP

       a.张三 的 脾气 比 李四 的 脾气 大 -> 张三 比 李四 脾气 大 (能变换)

       b.张三 的 汽车 比 李四 的 汽车 贵 ->  张三  比 李四 汽车 贵 (不能变换)

……

 

选题3:歧义格式分析类选题

在课程第二次作业的基础上,自选一个歧义格式(并例举一定数量的歧义实例),构造相应的CFG规则集以及合一约束,讨论计算机消解该格式歧义的具体办法。

 

选题4:语言资源类选题

选择一个有代表性的计算机可用的语言知识库或者标注语料库,介绍其设计理念、构建方法、应用案例,并加以评论。 

 

选题5

跟本学期课程中介绍的知识和讨论的问题相关的任何其他选题。