发信人: epicurean (伊鸠), 信区: New_board
标 题: [范文]语言学二人谈(自哲学板)
发信站: BBS 水木清华站 (Sat Jan 2 01:00:36 1999)


doubtfire:
我觉得e在上面这段话中,有几个问题有些含混。比如”语言的逻辑结构“、”语言的 
表层结构“、”语言的深层结构“等。据我所知,以及我个人的看法,这些概念都 
没有一个准确的表述。事实上,Chomsky并不能很好的说明,什么是语言的深层结构。 
而且这种提法也不明确,应该是语言中的某一个句子的深层结构,似乎更准确些。 
关于这个,一个很有代表性的问题是,深层结构到底有多深? 
如果不能把这个问题阐述清楚,实际上”深层结构“就仅仅只是一个隐喻性的说法而已。 

此外,有关Chomsky认为不同语言应该有着同样的深层结构的说法,也纯粹是这位大师 
哲学观念的自然延伸。并没有足够的证据表明这一点。在我看来,目前也没有足够的 
证据同意或反驳这种说法。更实际的情况似乎是,这种说法反映一个人的学术倾向。 
即,你认为不同的语言之间是同多异少,还是异多同少。 

epicurean:
Chomsky的生成语法理论,确实源于他的哲学理念,但他的理论在对 

语言的解释上仍然是相当技术化的,绝不是其哲学的附属物, 否则 

他何以被视为一个语言学家而非哲学家(当然, 他喜欢自称是哲学 

家)。讨论语言的哲学家很多, 象海德格尔、维特根斯坦,他们何 

以不被认为是语言学家呢?Chomsky的理论对语言现象的确有很强的 

解释力。 


语言的共性和差异性的问题,我是这么看的, 我们也许可以算出某 

两种语言的相似度是多大,比另两种语言的相似度是大还是小, 但 

我们似乎不大可能说所有的语言作为整体有什么相似度, 相似度值 

的单个存在是没有意义的。 所以,说各种语言是异大于同还是同大 

于异确实只是学术倾向的问题。 


至于我的倾向,我是觉得同大于异的。语言有三个平面:句法、 语 

义、语用。语用无非是指语言功能的实现, 人想干的事总是同大于 

异吧,其语言实现会有所不同。语义无非是概念逻辑, 这也是同大 

于异吧。句法是差异最大的平面, 但句法层本身是为了实现语义、 

语用的,因而形式主义从逻辑语义(Chomsky虽不愿谈语义,但这在 

这一派中已是大事所趋)的角度、 功能主义从语用的角度提出了各 

自的句法(或语法)理论。我的观点,语言研究到“见森林”的阶段, 

应该是同大于异的。事实上,真正积极坚持语言差异性的,也就是本 

世纪前期的美国结构主义者罢了。 

doubtfire:
一种具体的自然语言(譬如汉语)可以指句子的集合。在这种意义上的语言 
是个包含无穷元素的集合。它的元素就是所有汉语中的有效的表达式(句子)。 
我们说两种自然语言的同与异,并不在这个意义上说。 

谈论语言,还可以不指所有句子的集合。而是用Chomsky形式文法中的四元组概念 
{S V1, V2, P} 其中S表示开始符、V1表示非终结符、V2表示终结符,P表示规则 
语言可以看作由这个四元组定义的东西。我们说两种自然语言的同与异,应该是 
在这个层面上说的。在我看来,应该集中在P的比较上。 
按照Chomsky现在理论的发展情况看,他更加倾向与语言的同,即所谓的原则参数语法 
中(或最简语法)的普遍原则,他的理想是构造对所有自然语言有效的普遍原则。 
在这样的意义上,Chomsky可以宣称,他找到了语言的“同”。 

就像苏格拉底逮着人就问“什么是美”,他问的是“美的本质”是什么,或者 
美的规定性是什么,或者使一样东西成为美的那个特定的要素到底是什么? 

语言也有这样的味道。语言的本质是什么?在Chomasky看来,是他所发现的那些原则 
在配上一些参数。从这个意义上说,语言是“同”的。 

我并不强烈反对Chomsky的上述理论观点。但我处在我自身现有的认识水平,更愿意 
选择这样的立场,即我没有理由断言,语言是“同”的。尽管相当多的语言现象可以 
纳入符号主义的规则描写框架中。 

一方面,所谓语言的三个层面,在我看来,仅仅是为了把一些语言现象看的清楚些, 
或者描述,解释起来更明晰些,提出的理论概念。它们在语言事实中并没有物理 
意义上的对应物。也就是说,这些层面无论怎样都必须由物理上唯一的形式“声音的 
序列”来实现。这在本质上决定了,三个平面尽管对我们看问题的清晰性方面很有 
好处,但它并不能从根本上解决句法分析的问题。一到语用层面,除了含糊,什么也 
容纳不下:-( 当然,我觉不想贬低语用研究的学者的工作和成绩! 
另一方面,也是跟前一个方面密切相关。这三个层面事实上没有界限,当然有人可以抬 
出所谓的范畴理论来辩驳,但这里不是分类,而是层次,主张分三个层面立体地来看 
语言。我的感觉是,多数情况下,这三个层面的说法是含混的。 
结合上面我们对所谓语言的同异这个问题本身的剖析,从三个层面的语言观,也并不能 
严格的证明语言就一定是“同多异少”。或者过多的纠缠语言的同异,在现在的研究水平 
还显得超前了些,不大合适下断语。 

我的主张是,对语言的研究,应该纯粹从单位的大小上做区分,譬如,在句范围内的研究 
,在篇章段落范围内的研究等等。尽管单位的大小也没有完全客观的界限,但相对 
界限是清楚的。在这里原型范畴理论能派上用场。 

语言中的现象,有些是句子范围内能够解释的,有些是篇章范围内才能解释的。 

我喜欢说篇章(话语),不太用语用概念。无路可逃时,可能会考虑语用吧。顺便提 
一句,Chomsky常被人指责只管句法,不理语义。当然更加是不把语用放在眼里了。 
我的看法是,这在很大程度上是国内学者自身认识有误造成的。此外,一个学者 
不关注某某东东,并不因此就应该被指责。 

epicurean:
在三个平面中,确实只有句法平面能找到物理对应物,但意义和功 

能是具有着心理现实性的,它们不是虚无飘渺之物。 


你好象受结构主义的影响很深。语音确实是线形的,但语言却不是 

线形的,如语言的功能就不能纳入一个线形模型。从线形的语音开 

始对语言进行分析也许是最显而易见的方法,但功能和意义也不是 

不可以分析的。我不敢说“三平面说”就能解决句法分析的问题, 

但句法分析却从未真正离开过语义和语用。比如“语言的结构单位 

是如何确定的”这个问题就不可能在不涉及语义、语用的情况下回 

答,你能在不涉及语义、语用的情况下说出什么是词素、词、短语、 

句子、篇章吗? 

doubtfire:
对计算机而言,确定这些结构单位,可以纯粹就从形式标记上加以定义。词素和词是以有 
穷集合的清单 
形式给出的定义,它们都是功能单位。短语是结构单位,它可以是一个词,也可以是由2 
个以上词、词素 
组成的词组。句子是功能单位,有短语加标点(有限的几种)构成。篇章也是结构由一个 
以上的句子构成,或者段落 
等标记来判定,是结构单位。 
所谓结构单位,是指这个单位可以构成它本身,即可以递归。 
所谓功能单位,是指这个单位只能构成比它大的单位,不能构成它本身,即不允许递归。 


当然,对人学习语言来使用这些词素、词、短语等概念时,这样讲太费劲了。因为无论你 
操何种自然语言 
为母语,你都具有语义、语用的一些知识,当然可以顺手利用了。 

然而计算机没有自然语言母语。

epicurean:
不错,将语言规则写入计算机程序,确实只能诉诸形式标记。然而,形式 

标记的确定,不可能由形式分析自身来完成。比方说,我把这样一条规则 

写入程序:一个动词的过去时在大多数情况下是由原形加ed构成的。对计 

算机来说,这确实仅是一个形式规则。然而,对这一规则的确定,是由人 

通过语义分析来完成的(然后又将其形式化教给了计算机)。人们通过分 

布分析,也许能分析出v+ed这样一个结构,但却不知道它是什么意思、是 

干嘛的,这种分析与语音识别中的频谱分析何异,那不是语言分析。从这 

个意义上说,除非计算机能超越形式,否则,它只能是个规则运算工具, 

不可能具备对语言的理解能力或是任何一种其他智能。 


事实上,用计算机处理自然语言的理论与实践的主流一向是紧跟语义的, 

格语法可能是机器翻译中运用最广的语言学模型, Chomsky的短语结构文 

法也被扩充成了广义短语结构文法,引进了语义。至于计算机科学家自己 

提出的模型,象中心词驱动、词汇功能、功能合一等语法,更是以语义为 

出发点。 

doubtfire:
你这样说当然没错。但是只说了一半。我来补上另一半。那就是: 

任何关于意义的分析,如果不能转化成形式上能够操作的符号运算,就是没有意义的。 
(或者用无效更准确些) 

V+ed这个形式表示“过去”这样的意义,是可以进行形式操作的,所以这样的分析有效。 
而如果你来一条规则:说汉语被动句(先暂且限制为出现“被”字的被动句吧)中的 
动词只能是贬义的。(暂且假定这个规则本身是正确的) 
那么这条基于语义的规则是无效的。你还得进一步还原到具体的动词形式上,因为从 
形式上,除了一个动词的词形本身,你没有任何可供确定它是褒义还是贬义的依据。 
从这点上说,对人也许有效的语义分析,对计算机是不够的。 
在这点上,我想e可能有些误解。我把我的看法提出来供你参考。如果不对,也请 
指正。 

说格语法是机器翻译中运用最光的语言学模型,似乎不妥。首先应用的广不广,甚或 
是最广,我且不敢断言。就拿语言学模型来说吧。格语法能否称得上是一个独立的语言 
学模型,相信是该掂量掂量的。格语法是一种描写动名语义关系的一种描述方式,大概 
还差不多,称为语言模型,不恰当。基于规则方法来构造语言处理的模型,就我所知 
,最起码也得把架子搭在上下文无关文法的基础上。你这里提到的HPSG、LFG、FUG等等 
,也都是如此,这些都是在上下文无关文法的基础上,想着法儿来增强规则的约束限制 
能力(可以参看北京语言学院出版的方立的书,黑封皮的,书名一下想不全了) 
说它们以语义为出发点,真不知道从哪儿说起。 

我觉得再准确一点,可以这样表述,80年代以来,冠以语法名目的理论新花样出来了 
一大堆,大多是计算语言学领域的专家的发明。包括上面提到的,还有什么link Grammar 
、GPSG、Interface Grammar等等,这些东东跟什么格语法、配价语法、依存语法、 
还有Chomsky祖师爷的GB理论之类的放在一起,好象都是语法,其实稍微想想就能知道, 
这些是不能放在一个层面上排队的。 

在我看来,语法大致分为两类:一是以一定的理论模式来描写解释语言事实本身的。譬如 
格语法、配价语法、等等;再一类就是以一定的形式化手段把语言知识规则化的,提供 
给程序人员进一步的进行算法处理用。譬如HPSG、LFG、FUG等。这些所谓的语法,并 
不直接以发现语言知识,总结语言规律为己任,而是把语言知识以一定的形式化方式 
进行表述,有别于用自然语言来表述语言知识。 

结构主义旗帜下的诸多语言学流派(传统的语言学)都是以描写和解释语言事实的规律 
为直接目标的,最近很热的认知、功能语 法学派,也是如此,这些都属于我划归到第 
一类的语法。第二类以形式化表达为目标的语法,可以对第一类中的任何语法研究的成果 
进行操作,无论语法的还是语义的,只要有形式操作上的有效性保证就行。 

所以说,所谓LFG等都注重从语义出发,真是不知从那里说起。这种说法反映了对令人 
眼花缭乱的各种语法名目的认识不清晰。 

epicurean:
你说的是对的,语义要落实到形式。但就你举的例子来说,只要给语义 

规则加上一部词典就能解决问题。所谓词典,也就是一个词汇与语义的 

对照表,这个对照表本身不是形式规则,获得这样一个对照表似乎也不 

需要形式规则。词汇是一种形态,而不是一种形式。借用词汇语法的说 

法:词汇和语法是两个层面。 

我确实有误解,我对语言学的了解有限,尤其是形式主义的,并未受过 

什么正规的训练。 

计算语言学不是语言学,你的说法我同意。但从对语言的描述来看,格语 

法、配价语法、依存语法都有着独立的方法和概念,只不过没有提供一种 

全面的语言观罢了,如果它们不能称为独立的语言学模型,那能被称为独 

立语言学模型的恐怕也没几个了。 

GPSG、LFG、HPSG、FUG的确都不是面向语义的,这一点我错了。 

doubtfire:
注意,所谓形式化,并不一定以规则的面貌体现。词典同样是形式化的一种手段。 
你所说的对照表,通常不称之为规则,但是从形式系统来说,可以看作是形式定义 
或者广义地理解为规则,也是一样的。 
清华大学黄昌宁教授在最近举行的现代汉语语法国际研讨会上做报告,强调目前国际 
上计算语言学的趋势是主张词汇主义。实际上,这正好说明了规则可以下放到一个一个词 
上。也就是说,就形式表达而言,无论你在词上表达,还是用规则形式来表达,这只是 
效率和组织的方便程度问题,根本而言,人要解决的是语言的知识问题。 
你可以说词汇和语法是两个层面。我也可以说词汇中也有语法。这种说法上的差异并 
不是根本。最关键的是,无论在哪个层面,用什么方式,人们都必须去研究,有多少 
形式上的依据可以用来判断意义的异同。 

如果是基于统计模型来做这件事,形式化就表现为事件发生的概率值,这跟"规则形式" 
更是差得远了 。 
有时候,不妨静一静,想想到底什么是形式化。规则跟词典是截然对立的吗?规则方法 
跟统计方法是本质差异的吗? 
在我看来,非也! 

系统功能语法可以算一个。维诺哥拉德在70年代做的积木系统,就是建立在这个 
语言学模型上的。 
Chomsky的转换生成语法当然也得算上了。此外经典的结构主义语言模型当然也是了。 

……

--
※ 来源:·BBS 水木清华站 bbs.net.tsinghua.edu.cn·[FROM: 166.111.10.131]