当前位置: 首页 > news >正文

锦州网站建设最低价平台推广公司

锦州网站建设最低价,平台推广公司,开网站做私彩赚钱吗,wordpress 工具安装一.论文 1.1 P-tuning 区别于之前的工作,这篇工作认为promote可以在句子中的任意位置起到作用,可以将它们插入上下文或目标中 上图中,左图是不使用任何操作,右图是选择在居首和目标前插入promote的embedding,插入pro…

一.论文

1.1 P-tuning

区别于之前的工作,这篇工作认为promote可以在句子中的任意位置起到作用,可以将它们插入上下文或目标中

上图中,左图是不使用任何操作,右图是选择在居首和目标前插入promote的embedding,插入promote的过程可以表示为

其中x代表一系列离散的输入令牌,y代表目标(可以理解为希望模型想要给你的回答),e()表示对应的embedding,其实就是将其参数化映射成为伪tokens,即

通过最小化这些参数

1.2 promote生成

嵌入的promote实际上可以理解为不一定离散不相互关联的,而实际上的promote其实应该是高度离散的且具有关联性的,因此作者选择使用双向长短期记忆网络(LSTM),激活函数和MLP来建模这种关系

在推理中,我们只需要输出嵌入h,并且可以丢弃LSTM头

二.代码

本质上是使用一个PromptEncoder来生成伪的embedding添加到原先的embedding中

2.1 训练

训练过程只更新promote_encoder中的参数

 2.1.1 PromptEncoder

在PTuneForLAMA中实例化了PromptEncoder

 PromptEncoder本质上是一个(嵌入 + LSTM + MLP)

import torch
import torch.nn as nnclass PromptEncoder(torch.nn.Module):def __init__(self, template, hidden_size, tokenizer, device, args):super().__init__()self.device = deviceself.spell_length = sum(template)self.hidden_size = hidden_sizeself.tokenizer = tokenizerself.args = args# ent embeddingself.cloze_length = templateself.cloze_mask = [[1] * self.cloze_length[0]  # first cloze+ [1] * self.cloze_length[1]  # second cloze+ [1] * self.cloze_length[2]  # third cloze]self.cloze_mask = torch.LongTensor(self.cloze_mask).bool().to(self.device)self.seq_indices = torch.LongTensor(list(range(len(self.cloze_mask[0])))).to(self.device)# embeddingself.embedding = torch.nn.Embedding(len(self.cloze_mask[0]), self.hidden_size).to(self.device)# LSTMself.lstm_head = torch.nn.LSTM(input_size=self.hidden_size,hidden_size=self.hidden_size // 2,num_layers=2,dropout=self.args.lstm_dropout,bidirectional=True,batch_first=True)self.mlp_head = nn.Sequential(nn.Linear(self.hidden_size, self.hidden_size),nn.ReLU(),nn.Linear(self.hidden_size, self.hidden_size))print("init prompt encoder...")def forward(self):input_embeds = self.embedding(self.seq_indices).unsqueeze(0)output_embeds = self.mlp_head(self.lstm_head(input_embeds)[0]).squeeze()return output_embeds

2.1.2 调用

在PTuneForLAMA的forward函数中调用了embed_input来实现

http://www.hengruixuexiao.com/news/15323.html

相关文章:

  • 黔东南网站设计公司怎么注册中视频账号
  • 网站规划建设南昌seo排名扣费
  • 平面设计可以自学吗搜狗搜索排名优化
  • 微网站如何制作官方网站怎么注册
  • 用万网可以备案其他的个人网站吗友情链接交换形式有哪些
  • 济南做网站公司电话谷歌搜索引擎首页
  • 广告图片素材网seo优化文章网站
  • wordpress做网站百度网盘登录首页
  • 摄影师如何做网站武汉seo广告推广
  • 影视公司注册流程及费用零基础seo入门教学
  • ecshop网站开发个人模板建站
  • 湘潭做网站的公司网络广告投放
  • 网站做301重定向手机百度旧版本下载
  • 五个h5制作网站厦门seo测试
  • 武汉专业建站seo推广员是做什么的
  • 彩票网站的建设优化设计四年级上册数学答案
  • 网站设计师需要学什么成都最新消息今天
  • 福田庆三价格百度seo还有前景吗
  • flask做的网站如何上传文件网站设计论文
  • 贵州省安顺市网站建设企业网站设计与推广
  • 正规淘宝店铺交易平台苏州搜索引擎优化
  • 网站支付的功能如何做企业网站seo案例
  • 网站开发精灵湖南百度推广代理商
  • 1元涨1000粉网站如何进行优化
  • 网站文章正文可以做内链吗西安网站建设公司
  • 学做点心的网站站长工具浪潮
  • 阿里云服务起做网站软文类型
  • 常州哪家做网站便宜今日重大新闻头条财经
  • 苏宁易购网站设计怎么制作大兴今日头条新闻
  • iis 网站建设中软文发布平台哪个好