这篇文章是我发表在《计算机工程》上的《基于方差权重因子选词改进的平滑反频率句向量模型》论文中实验的源代码,论文暂时还没有见刊. 本文参考了Sanjeev Arora等人的SIF句向量模型,详见论文“A Simple but Tough-to-Beat Baseline for Sentence Embeddings”,在此致谢!
- GLoVe词向量
- news20.tar.gz通过import sklearn.dataset就可获得
孙毅,裘杭萍,康睿智.基于方差权重因子选词的SIF句向量模型[J].计算机工程,2019,45(09):204-210+234.