“计算语言学概论”课程期末作业选题
任课教师:詹卫东
单位:北京大学中文系
请在
要求:
(1)参照一般学术论文的格式完成期末报告(包含题目、摘要、关键词、 按层级划分章节的正文、参考文献等)。
(2)篇幅不少于5000字(或A4纸5号字6页)。
(3)期末报告通过电子邮件附件(word文件和/或pdf文件格式)提交。
(4)文件名格式为:学号_姓名_文章标题
选题1 :词汇语义分析类选题
请选择一定数量的有某种语义共性的动词(也可以是一组形容词、名词、或者副词等),讨论这些词语的语义共性和特性与其句法表现之间的关系,并说明你所做的词汇语义分析在计算机自然语言处理中有哪些应用。
有某种语义共性的动词示例:
(1) 跟“言说”有关的动词: 告诉、通知、埋怨、抱怨、……
(2) 跟“交互”有关的动词: 商量、讨论、交流、吵架、顶嘴、……
(3) 跟“制作”有关的动词:写、画、烤、炸、建造、……
……
选题2:句式分析类选题
选择两个有变换关系的句式(记作A和B),给出A和B之间能够变换与不能变换的实例,并从计算机如何判断能否变换的角度,讨论制约变换的条件是什么。
有变换关系的句式示例:
(例1) A = “把”字句 B = “被”字句
a. 张三把李四打伤了 -> 李四被张三打伤了 (能变换)
b. 他把脚撞伤了 -> 脚被他撞伤了 (不能变换)
(例2) A = N1 的 X + 比 + N2 的 X + VP B = N1 + 比 + N2 + X + VP
a.张三 的 脾气 比 李四 的 脾气 大 -> 张三 比 李四 脾气 大 (能变换)
b.张三 的 汽车 比 李四 的 汽车 贵 -> 张三 比 李四 汽车 贵 (不能变换)
……
选题3:歧义格式分析类选题
在课程第二次作业的基础上,自选一个歧义格式(并例举一定数量的歧义实例),构造相应的CFG规则集以及合一约束,讨论计算机消解该格式歧义的具体办法。
选题4:语言资源类选题
选择一个有代表性的计算机可用的语言知识库或者标注语料库,介绍其设计理念、构建方法、应用案例,并加以评论。
选题5
跟本学期课程中介绍的知识和讨论的问题相关的任何其他选题。