单词的向量表征
本节lecture主要是对上一节内容的扩展,重点还是在如何用向量来表征单词上,以使得单词间获得更好的相似性,而且我们可以直观地理解这种相似性。
核心思想是通过计算单词间的共现(co-occurence)次数/频率/概率来表征单词间的相似性——两个单词同时出现在相同context中的次数多了,我们就认为这两个单词比较相似。
- 一种模型是skip-gram模型,一步步地计算每个窗口,最终得出单词间相似性。
- 另一种模型是Glove,基于共现矩阵的思想,一次性统计语料库中所有单词两两间的共现次数,从而得出单词间的相似性。
如何评估词向量的优劣
两种评价思路:intrinsic & extrinsic(内部评价和外部评价)
- intrinsic evaluation
通过分析词向量本身的一些特性来评价:如词与词之间的余弦相似度、 欧式距离或类比关系(analogy, 即 man-woman=king-queen 这种线性关系),如果得出的词向量这些关系好(eg. 词义相似的词向量在向量空间中距离也很近),那么这个词向量就好。
注:总的来说Glove表现的最好。extrinsic evaluation
通过一些下游的任务来评价词向量的好坏,如我们把训练好的词向量用于命名实体识别任务中,看词向量实际表现的怎么样。
注:还是Glove模型表现的最好。两种评价方法的优劣
intrinsic evaluation速度快,可以帮助我们更好地理解这个任务本身。但实际上这并不是一种真实的评价方法,即我们不知道这种词向量模型在实际任务中到底表现得怎么样。
extrinsic evaluation则是一种真实的评价方法,可以确切地得出词向量模型的好坏。但缺点是计算出最终结果很费时间,而且如果表现不好,我们并不能准确地分析出原因(到底是向量模型本身的原因,还是向量模型和其他模型互相影响(interact)的原因)
Post Date: 2018-11-26
版权声明: 本文为原创文章,转载请注明出处