课程名称:计算语言学概论 教师:詹卫东 返回主页
课程讲义下载.
什么是计算语言学?
《翻译》备忘录(Weaver,1949)
Computing Machinery and Intelligence(Turing, 《Mind》,1950)
Loebner Prize for AI (Turing Test)
IBM Watson与人对决智力问答 (2011)
计算语言学与中文信息处理近年来发展综述(2004-2008)
自然语言处理的支撑科学是什么?(2009)
A Pendulum Swung Too Far by Kenneth Church(2011)
语言学知识:结构化、形式化、数据化、可视化(2018)
语言知识的形式化表达, 形式语言, 自动机/有限状态转移网络, 特征结构, 合一
第一次作业:构造汉语自然数表达式的形式文法 作业要求 附1:对CFG规则集进行分析的Python程序 附2:基于合一的自然数表达式分析程序
汉语短语结构语法体系,上下文无关文法+合一约束
基于形式文法对汉语短语结构歧义的系统分析
句法结构歧义的类型及歧义消解
形式语法理论体系概观
句法结构树表示的四要素
附:歧义格式统计程序
语义知识的表示
语篇知识的表示
语料库的构建与应用
条件概率
N-gram
动态规划
最小编辑距离算法
(示例程序)
近30年来中文语言知识资源发展及应用 (《语言战略研究》2018年第4期,58-69页)
中文词法分析
中文自动词性标注
词义标注(WSD)
中文句法分析
左角分析算法
ATN分析算法
Chart分析算法
CYK 分析算法
Earley分析算法
GLR分析算法
带合一约束的Earley分析算法
致谢:
北大计算语言所俞士汶教授, 常宝宝博士,于江生博士,孙斌博士,胡俊峰博士,张化瑞博士
中科院计算所刘群研究员,王斌研究员,白硕研究员
清华大学周强博士,刘颖博士
感谢他们为本课程提供的资料与帮助