当前位置:首页 > 实用技巧 >

w2013文档构造图怎么弄(w2013使用教程)

来源:原点资讯(www.yd166.com)时间:2023-11-13 04:53:20作者:YD166手机阅读>>

背景

作为一个深度学习的爱好者,肯定对 Embedding不陌生,但是你知道Embedding为什么那么热门吗?想知道Embedding技术流行的原因就一定要深入讲解一下 Word2vec。它不仅让词向量在自然语言处理领域再度流行,更关键的是,自从 2013 年谷歌提出 Word2vec 一来,Embedding 技术从自然语言处理领域推广到广告、搜索、图像、推荐等几乎所有深度学习的领域,成了深度学习知识框架中不可或缺的技术点。Word2vec 作为经典的 Embedding 方法,熟悉它对于我们理解之后所有的 Embedding 相关技术和概念都是至关重要的。下面,详细讲一讲 Word2vec 的原理。

w2013文档构造图怎么弄,w2013使用教程(1)

为什么我们需要对词进行编码,也就是所谓的词向量化?

我们知道任何模型,其输入都需要为数值型,而在NLP中,大多数是文字为主,而文字是无法直接被模型进行使用。所以我们需要将文字进行编码,而编码就是给每一个字符一个向量来进行表示。

word2vec出来之前--one-hot编码

在word2vec出来之前,我们常用的主要是one-hot编码的方法,也就是对于每一个单词,我们用在一个位置为1,其余位置为0的向量进行表示。而向量的维度就是我们单词量的大小。而向量的每一个位置,只能用来表示唯一的一个单词。

假设我们的有词库只有10个单词,分别是:今,天,是,你,我,他,买,水,果,家。这里我们分别用one hot encoding的方法来表示每一个词,那么有下面的结果:

w2013文档构造图怎么弄,w2013使用教程(2)

看到对于每一个单词,我们用唯一的一个向量对它进行了表示。那么很显然这种表示方法至少有下面的一些缺陷

  • 单词与单词间的距离都是没有差别的,“今”和“天”的距离和“今”和“果”的距离是一样的。
  • 随着单词量的增加,向量的维度也随之增加,而且对于词库中没有的新词,都无无法有唯一的向量与之一一对应。
  • 当单词量较大时,也即向量的维度过高时,势必加大了任何机器学习模型的计算量,降低了计算效率。

如果将单词量为N,用一个n维的向量来表示每一个单词,并且n远远小于N,那是不是可以解决上述问题呢?基于这个思想Word2vec出现了,迎来了各种Embedding方法和相关应用。

什么是 Word2vec?

自从Embedding技术出现自然语言处理(NLP)领域打开新大门了,在NLP领域中出现了各种Embedding模型,如Sentence2Vec、Doc2Vec、Everything2Vec等等。较于传统NLP的高维、稀疏的表示法(One-hot Representation),Word2Vec训练出的词向量是低维、稠密的。Word2Vec利用了词的上下文信息,语义信息更加丰富。

Word2vec 是“word to vector”的简称,顾名思义,它是一个生成对“词”的向量表达的模型。用一句简单的话来总结,word2vec是用一个一层的神经网络(即CBOW)把one-hot形式的稀疏词向量映射称为一个n维(n一般为几百)的稠密向量的过程

想要训练 Word2vec 模型,我们需要准备由一组句子组成的语料库。假设其中一个长度为 _T_ 的句子包含的词有,并且我们假定每个词都跟其相邻词的关系最密切。

w2013文档构造图怎么弄,w2013使用教程(3)

Word2vec的两种模型结构CBOW和Skip-gram

根据模型假设的不同,Word2vec 模型分为两种形式,CBOW 模型(图左)和 Skipgram 模型(图右)。

CBOW 模型假设句子中每个词的选取都由相邻的词决定, 因此我们就看到 CBOW 模型的输入是 wt 周边的词,预测的输出是 wt。

Skip-gram 模型则正好相反,它假设句子中的每个词都决定了相邻词的选取,所以你可以看到 Skip-gram 模型的输入是 wt,预测的输出是 wt 周边的词。

在实践中,Skip-gram 模型的效果会更好一些。

w2013文档构造图怎么弄,w2013使用教程(4)

下次给你们讲讲 Word2vec 的模型细节和实现方式。

,

栏目热文

word2010的页面背景可以设置哪些(word2010文档的页面背景有几下类型)

word2010的页面背景可以设置哪些(word2010文档的页面背景有几下类型)

在做一些文档排版策划的时候,为了美化Word文档,通常会给文档添加背景,那么要怎么设置背景呢?今天给大家分享Word文档...

2023-11-13 04:54:43查看全文 >>

2010页面设置在哪(2010工具栏怎么调出来)

2010页面设置在哪(2010工具栏怎么调出来)

Office的组件中,我们用的最多的就数Word了。在升级换代后,Word2013文字和表格处理功能更强大,外观界面更...

2023-11-13 04:22:35查看全文 >>

word2010页面颜色设置在哪(word中的页面颜色在哪里设置)

word2010页面颜色设置在哪(word中的页面颜色在哪里设置)

在实际的工作场景中,经常会遇到调整文档背景色的情况,很多人不会调整,抓耳挠腮半天。其实会了就很简单,本文将描述两种调整背...

2023-11-13 04:31:13查看全文 >>

在word2010中要设置页面的背景(word里页面背景怎么设置)

在word2010中要设置页面的背景(word里页面背景怎么设置)

“我想在我的Word文档里加入一些背景图片,让整个文档看起来更美观,但是我不知道应该怎么操作,希望大家帮帮我!”很多朋友...

2023-11-13 04:38:06查看全文 >>

页面背景怎么设置word2010中(2010word页面背景怎么设置)

页面背景怎么设置word2010中(2010word页面背景怎么设置)

我们经常使用Word来编辑文件,通常我们看到Word工具栏的背景是深蓝色的,估计很多不知道这种蓝色还可以自己进行调整,下...

2023-11-13 04:45:37查看全文 >>

迎春花是攀爬的植物吗(迎春花是长日照植物吗)

迎春花是攀爬的植物吗(迎春花是长日照植物吗)

如果你想要改善一下院子里冬季的植物景观,那迎春花就是不错的选择,它的枝条会不断向上生长,茎叶会生长特别旺盛,到了冬季开花...

2023-11-13 04:51:00查看全文 >>

迎春花秋天落叶吗(迎春花冬季不落叶能开花吗)

迎春花秋天落叶吗(迎春花冬季不落叶能开花吗)

东方网记者柏可林1月4日报道:今年冬天温度偏高,使得迎春花的花期提前了。记者从上海植物园获悉,今年迎春花刷新了早开纪录,...

2023-11-13 04:30:14查看全文 >>

迎春柳图片(迎春柳的功效与作用)

迎春柳图片(迎春柳的功效与作用)

迎春花,因早春开放,而得名。因其长有蔓状长枝,满枝间开着金钟般小黄花,而又名满条金、金钟花、金腰带、迎春柳,有的地方叫黄...

2023-11-13 04:46:30查看全文 >>

迎春花是什么花(哪些花是迎春花)

迎春花是什么花(哪些花是迎春花)

一,迎春花(学名:Jasminum nudiflorum Lindl. ):别名迎春、金腰带,落叶灌木丛生。株高30-5...

2023-11-13 04:25:42查看全文 >>

迎春花是算植物吗(迎春花是常青植物吗)

迎春花是算植物吗(迎春花是常青植物吗)

寒冬过去春天要来了,最能代表春天的迎春花,你家养了吗?很快进入了1月份的尾声,这也就意味着寒冷的冬天渐渐的离我们远去,即...

2023-11-13 04:15:39查看全文 >>

文档排行