当前位置: 首页 > news >正文

昆山外贸网站建设推广seo行业岗位有哪些

昆山外贸网站建设推广,seo行业岗位有哪些,海淀区网站制作公司,网页设计旅游模板创作不易,免费的赞 前面有介绍了GPT2如何进行token化的过程,现在讲下transformer的Embedding层 Embedding层就是一个巨大的矩阵,边长分别是词汇表长度和词向量维度,矩阵里面的每一个数字都是一个随机初始化的,或者是…

创作不易,免费的赞

前面有介绍了GPT2如何进行token化的过程,现在讲下transformer的Embedding层

Embedding层就是一个巨大的矩阵,边长分别是词汇表长度和词向量维度,矩阵里面的每一个数字都是一个随机初始化的,或者是其他地方经过训练之后拿过来的。在transformer训练过程中,这些每个token的维度浮点数会发生改变。
在这里插入图片描述

在训练的过程中,假设我们窗口为50个token,意思就是我们生成下一个词的时候,只使用前面50个词去预测下个词,就算前面继续有词,我也不会应用,那么就变成下图。但是当本来就没有50个词的时候怎么办,那么需要填充字符,可以是任意字符,反正你就当成是个填充码,这里使用的是PAD,PAD在token当中也是存在的,你甚至自己定义一个token,如<<notoken!>>都可以。

为什么需要填充满50个字符,不满就不满,感觉也什么问题啊?

这是因为如果限定成50个,那么在使用显卡的训练的时候速度就可以快很多,没有的话也可以。

在这里插入图片描述

上图这个矩阵就是输入到下一个层级的矩阵,下一层就是添加位置编码,本系列中也已经有章节介绍。

http://www.hengruixuexiao.com/news/51830.html

相关文章:

  • 网站目录爬行上海aso苹果关键词优化
  • 网站代码如何做优化今日中央新闻
  • 只做av搬运工的网站百度问答一天能赚100块吗
  • 视频分享网站怎么做2023年百度小说风云榜
  • 网站改名 备案时事新闻最新
  • 设计素材免费下载网站资源网
  • 教做发绳的网站线上推广费用预算
  • 如何加强旅游电子商务网站的建设如何做好互联网营销推广
  • 江阴网页设计培训百度seo优化推广公司
  • 智慧团建网站登录电脑版做营销策划的公司
  • 永川网站开发网络市场调研
  • 西安做推广网站设计深圳小程序开发公司
  • 子网站怎么建设北京网站推广机构
  • 无锡宏腾网站建设网站优化排名软件哪些最好
  • 做网站定金一般多少app开发平台
  • 河南住房和城乡建设厅网官方网站google推广公司哪家好
  • 外贸网站建设报价微信小程序开发零基础入门
  • wordpress如何用nginx优化设计高中
  • 关于建筑工程的网站泉州全网推广
  • lamp wordpress主题网店关键词怎么优化
  • 网站建设北京贵百度知道灰色词代发收录
  • 二级网站排名做不上去网络营销未来有哪些发展趋势
  • 雄安网站开发宁波seo网络推广代理公司
  • 广西桂林旅游团报价谷歌官方seo入门指南
  • 网站建设在开封找谁做承接网络推广外包业务
  • h5网站开发技术新媒体营销策略有哪些
  • 淘宝客怎样做自己的网站推广网络营销意思
  • 杭州网站开发企业pc网站建设和推广
  • 汕头网站推广找谁视频seo优化教程
  • 在线做视频的网站域名seo查询