1)利用歧义格式分析程序(AmbiguityDetector),对一个你感兴趣的可能有歧义的序列S(至少含3个以上非终结符)进行分析,得出S的各种可能的结构分析方式。

可以有两种方式来确定S,以及产生S的句法结构分析结果:

    a  在tags.txt文件中指定参与序列组合的标记,由AmbiguityDetector程序生成这些标记组合得到的序列的所有结构分析结果,从中选择你感兴趣的序列S。

    b  在sequences.txt 文件中直接指定一个序列S,由AmbiguityDetector程序生成S的所有 句法结构分析结果。

2)说明S的歧义类型,并为S的每个可能的结构分析方式提供真实语言例子。可以自造例子,但最好是从真实的文章中发现的例子。对于程序给出的关于S的每种结构分析,有可能找得到对应的实例,也可能暂时找不到实例, 无论是哪种情况,都要明确说明是否有对应的歧义实例,如果有,则给出例子。

举例:

S序列 S序列的可能存在的内部结构(程序分析结果) 功能类 实例 歧义类型
vp ap np (vp:述宾(vp,np:粘合定中(ap,np))) vp 踢破热水瓶 内含型真歧义
(vp:述宾(vp:粘合述补(vp,ap),np)) vp 踢破热水瓶 

要求:以excel数据表文件形式提交结果。

3)在完成上面两项工作的基础上,就“汉语的歧义结构”这一主题撰写一个报告,报告中论述的内容应包括:

a. 你对汉语歧义结构的认识,对计算机分析汉语句子面临的歧义问题的认识;

b. 对AmbiguityDetector歧义格式统计程序的认识;

c. 谈谈你对计算机分析S序列时碰到的歧义问题的认识;

d. 谈谈你认为有哪些策略,可以帮助计算机更好地分析S序列。

e. 假如由你来设计一个汉语歧义结构知识库,你认为应该包含哪些内容。(可选)   

要求:报告文件同时提供MS word格式文件和PDF格式文件。(A4纸,5号字,不少于6页篇幅)