CL作业

1）利用歧义格式分析程序（AmbiguityDetector），对一个你感兴趣的可能有歧义的序列S（至少含3个以上非终结符）进行分析，得出S的各种可能的结构分析方式。

可以有两种方式来确定S，以及产生S的句法结构分析结果：

a 在tags.txt文件中指定参与序列组合的标记，由AmbiguityDetector程序生成这些标记组合得到的序列的所有结构分析结果，从中选择你感兴趣的序列S。

b 在sequences.txt 文件中直接指定一个序列S，由AmbiguityDetector程序生成S的所有句法结构分析结果。

2）说明S的歧义类型，并为S的每个可能的结构分析方式提供真实语言例子。可以自造例子，但最好是从真实的文章中发现的例子。对于程序给出的关于S的每种结构分析，有可能找得到对应的实例，也可能暂时找不到实例，无论是哪种情况，都要明确说明是否有对应的歧义实例，如果有，则给出例子。

举例：

要求：以excel数据表文件形式提交结果。

3）在完成上面两项工作的基础上，就“汉语的歧义结构”这一主题撰写一个报告，报告中论述的内容应包括：

a. 你对汉语歧义结构的认识，对计算机分析汉语句子面临的歧义问题的认识；

b. 对AmbiguityDetector歧义格式统计程序的认识；

c. 谈谈你对计算机分析S序列时碰到的歧义问题的认识；

d. 谈谈你认为有哪些策略，可以帮助计算机更好地分析S序列。

e. 假如由你来设计一个汉语歧义结构知识库，你认为应该包含哪些内容。（可选）

要求：报告文件同时提供MS word格式文件和PDF格式文件。（A4纸，5号字，不少于6页篇幅）