文章目录
前言
Word2vec,是一群用来产生词向量的相关模型。这些模型为浅而双层的神经网络,用来训练以重新建构语言学之词文本。网络以词表现,并且需猜测相邻位置的输入词,在word2vec中词袋模型假设下,词的顺序是不重要的。训练完成之后,word2vec模型可用来映射每个词到一个向量,可用来表示词对词之间的关系,该向量为神经网络之隐藏层。
c#中也可以使用word2vec.net库进行Word2vec的使用,但是网上相关中文资料很少,对于初学者有点不友好,这里写一下c#大概怎么使用word2vec.net。
文章目录
一、Word2vec.Net是什么?
这里给的是网页翻译的说明,GitHub地址是:https://github.com/eabdullin/Word2Vec.Net 有兴趣可以看一下。
https://github.com/tmteam/Word2vec.Tools/tree/master/Word2vec.Tools

二、使用步骤
1.使用NuGet安装
搜索word2.vec,可以安装Word2Vec.Net,建议同时安装Word2vec.Tools(一款比较合适的tmteam自制工具):

2.使用dll导入
这里给出百度网盘的连接,可以在此下载:https://pan.baidu.com/s/13edfVKJIxFo68CUel_M-KA
提取码:v1z6
3.使用using引用
代码如下(示例):
using Word2Vec.Net;
using Word2vec.Tools;
4.生成vocab.bin文件
代码如下(示例),和GitHub给的说明基本一样,使用时可以改一下输入输出的位置:
string trainfile = "G:\\rus_ksu.txt";
float a = 0.05F;
string outputFileName = "G:\\output.bin";
var word2Vec = Word2VecBuilder.Create()
.WithTrainFile(trainfile)// Use text data to train the model;
.WithOutputFile(outputFileName)//Use to save the resulting word vectors / word clusters
.WithSize<

本文介绍了如何在C#中使用Word2Vec.NET库,包括通过NuGet安装、导入dll、生成vocab.bin文件以及使用Word2Vec2.Net和Word2Vec2.Net.Tools进行相似度计算。虽然网上资源有限,但通过提供的链接和示例代码,开发者可以更好地理解和应用Word2Vec工具。

863

被折叠的 条评论
为什么被折叠?



