做语言学研究,最常碰到的一个问题是:这个句子能说吗?
这个问题太重要了。
因为对这个问题的回答经常直接影响到研究者关于某个具体问题的结论。
能说,则是一种结论,不能说,就又是另一种光景了。
然而,回答这个问题,容易吗?
有的人相信自己的语感,有的人相信别人的语感,有的人相信文字资料的
证据。
但是到底什么是可靠的呢?
其实,问“这个句子能说吗?”可以看作是面向自然语言生成的研究需要
问的一个问题。
而如果是面向自然语言理解的研究,就应该问,“这个句子是可理解的吗?”
上面这两种问法的后果是不一样的。
能理解的要求低一些。能说的要求高一些。
针对计算机分析自然语言的要求,应该以一种说法是否能理解来衡量,
来得出结论,而不宜以能说不能说来衡量。
比如,“贵手绢”、“脏糖”,一般是“不说的”,但是是“能理解的”。
“贵打一顿”是不能说的,同时也是“不能理解的”。
这样,在为了理解的目的来描写“贵”能修饰哪些名词时,考虑条件,
就该是倾向于从宽。
上面这个例子可能说服力还不强。Doubtfire还要再琢磨一个更有说服力的
例子。最好能对比说明。