汉语的词向量与类推测试



报告人唐乾桐
报告时间2019-01-09
讨论组语法理论与语言工程
关键词词向量;词嵌入;词类推;类推测试
摘要或简介

学界一般用类推测试来测试词向量的性能,但在汉语研究领域缺少可靠的类推测试集。以往的研究大都是直接将BATS这些针对英语的类推问题集翻译或改写成汉语,这样做的好处是能够快速得到比较有效的语义类推测试集,例如Chen X等(2015);但是,对于语法上的类推测试而言,由于汉英的语法有很大差异,其类推测试集不能直接通过翻译得到。这样一来,汉语词向量就缺少一个全面的类推测试集,这不仅不能满足汉语语法工程、语法研究的需要,也不能全面地测试汉语词向量的性能。因此,建立一个面向汉语的类推问题集迫在眉睫。这篇文章就是对这一问题的一个尝试。

发布人Ford
发布范围全网
讨论记录

下载次数7039
浏览次数5787

下载文献(2.2 MB) 查看幻灯片(3.5 MB)  登录后可执行更多操作


© CCL of   Peking University  2019