Word2vec

Word2vec是一群用來產生詞向量的相關模型。這些模型為淺层雙層的神經網路，用來訓練以重新建構語言學之詞文本。網路以詞表現，並且需猜測相鄰位置的輸入詞，在word2vec中词袋模型假設下，詞的順序是不重要的。

訓練完成之後，word2vec模型可以把每個詞映射到一個向量，來表示詞与詞之間的關係。該向量為神經網路的隱藏層[1]。

Word2vec依賴skip-grams或連續詞袋（CBOW）來建立神經詞嵌入。Word2vec為托馬斯·米科洛夫（Tomas Mikolov）在Google帶領的研究團隊創造。該演算法漸漸被其他人所分析和解釋[2][3]。

Skip-grams和CBOW

CBOW把一個詞從詞窗剔除。在CBOW下給定 $n$ 詞圍繞著詞 $w$ ，word2vec預測一個句子中其中一個缺漏的詞 $c$ ，即以機率 $p(c|w)$ 來表示。相反地，Skip-gram給定詞窗中的文本，預測當前的詞 $p(w|c)$ 。

延伸

Word2vec用來建構整份文件（而分獨立的詞）的延伸應用已被提出[4]，該延伸稱為paragraph2vec或doc2vec，並且用C、Python[5][6]和 Java/Scala[7]實做成工具（參考下方）。Java和Python也支援推斷文件嵌入於未觀測的文件。

分析

對word2vec框架為何做词嵌入如此成功知之甚少，約阿夫·哥德堡（Yoav Goldberg）和歐莫·列維（Omer Levy）指出word2vec的功能導致相似文本擁有相似的嵌入（用余弦相似性計算）並且和約翰·魯伯特·弗斯的分佈假說有關。

實作

C （页面存档备份，存于）
Java/Scala
Python （页面存档备份，存于）
Python （页面存档备份，存于）

參見

向量空間模型

参考文献

Mikolov, Tomas; et al. (PDF). [2015-08-14]. （原始内容 (PDF)存档于2022-05-09）.
Goldberg, Yoav; Levy, Omar. (PDF). [2015-08-14]. （原始内容 (PDF)存档于2022-01-22）.
Řehůřek, Radim. (Youtube video). [2015-08-14]. （原始内容存档于2020-05-22）.
Le, Quoc; et al. (PDF). [2016-02-18]. （原始内容 (PDF)存档于2021-11-23）.
. [2015-08-02]. （原始内容存档于2021-01-23）.
. [2016-02-18]. （原始内容存档于2020-01-07）.
. [2016-01-13]. （原始内容存档于2015-12-31）.

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.

[mikolov-1] Mikolov, Tomas; et al. (PDF). [2015-08-14]. （原始内容 (PDF)存档于2022-05-09）.

[explain-2] Goldberg, Yoav; Levy, Omar. (PDF). [2015-08-14]. （原始内容 (PDF)存档于2022-01-22）.

[extensions-3] Řehůřek, Radim. (Youtube video). [2015-08-14]. （原始内容存档于2020-05-22）.

[doc2vec-4] Le, Quoc; et al. (PDF). [2016-02-18]. （原始内容 (PDF)存档于2021-11-23）.

[doc2vec_python-5] . [2015-08-02]. （原始内容存档于2021-01-23）.

[doc2vec_imdb-6] . [2016-02-18]. （原始内容存档于2020-01-07）.

[doc2vec_java-7] . [2016-01-13]. （原始内容存档于2015-12-31）.

机器学习与

范式监督学习無監督學習線上機器學習元学习半监督学习自监督学习强化学习基于规则的机器学习量子機器學習
问题统计分类生成模型迴歸分析聚类分析降维密度估计异常检测数据清洗自动机器学习关联规则学习語意分析结构预测特征工程表征学习排序学习语法归纳本体学习多模态学习
监督学习 (分类 · 回归) 学徒学习决策树学习集成学习 Bagging 提升方法随机森林 k-NN 線性回歸朴素贝叶斯人工神经网络邏輯斯諦迴歸感知器相关向量机（RVM）支持向量机（SVM）迁移学习微调
聚类分析 BIRCH CURE算法层次 k-平均 Fuzzy 期望最大化（EM） DBSCAN OPTICS 均值飘移
降维因素分析 CCA ICA LDA NMF PCA PGD t-SNE SDL
结构预测圖模式貝氏網路條件隨機域隐马尔可夫模型
异常检测 RANSAC k-NN 局部异常因子孤立森林
人工神经网络自编码器認知計算深度学习 DeepDream 多层感知器 RNN LSTM GRU ESN 储备池计算受限玻尔兹曼机 GAN SOM CNN U-Net Transformer Vision transforme 脉冲神经网络 Memtransistor 电化学RAM（ECRAM）
强化学习 Q学习 SARSA 时序差分（TD）多智能体 Self-play RLHF
与人类学习主动学习众包 Human-in-the-loop
模型诊断学习曲线
数学基础内核机器偏差–方差困境计算学习理论经验风险最小化奥卡姆学习 PAC学习统计学习 VC理论
大会与出版物 NeurIPS ICML ICLR ML JMLR
相关条目人工智能术语机器学习研究数据集列表机器学习概要