当前位置: 首页 > news >正文

毕业设计做购物网站营销型企业网站制作

毕业设计做购物网站,营销型企业网站制作,响水做网站的,交易平台app下载星火大模型的主页:iFlytekSpark-13B: 讯飞星火开源-13B(iFlytekSpark-13B)拥有130亿参数,新一代认知大模型,一经发布,众多科研院所和高校便期待科大讯飞能够开源。 为了让大家使用的更加方便,科…

星火大模型的主页:iFlytekSpark-13B: 讯飞星火开源-13B(iFlytekSpark-13B)拥有130亿参数,新一代认知大模型,一经发布,众多科研院所和高校便期待科大讯飞能够开源。 为了让大家使用的更加方便,科大讯飞增加了更多的数据,并针对工具链进行了优化。此次正式开源拥有130亿参数的iFlytekSpark-13B模型(讯飞星火开源-13B),也是首个基于全国产化算力平台“飞星一号”的大模型,正式开源!icon-default.png?t=N7T8https://gitee.com/iflytekopensource/iFlytekSpark-13B其介绍已经说得很详细了,我只是简单总结一下GPU版的推理部署方法。这里是GPU版的说明页面:deepspeed-megatron/README.md · 讯飞星火开源/iFlytekSpark-13B - Gitee.comicon-default.png?t=N7T8https://gitee.com/iflytekopensource/iFlytekSpark-13B/blob/master/deepspeed-megatron/README.md严格按照其环境要求配置环境环境即可。里面也说到,需要手动安装flash-attention和apex,这两个我都没装过,发现装后者确实有坑。期间也遇到了其他问题,例如CUDA版本之类,但都好解决,但是apex安装之后,发现有各种问题。例如报:No module named 'fused_layer_norm_cuda'。

也有博客中有解决方法:ModuleNotFoundError: No module named ‘fused_layer_norm_cuda‘_modulenotfounderror: no module named 'fused_layer_-CSDN博客文章浏览阅读5.3k次,点赞5次,收藏22次。Nvidia Apex安装与简单使用_modulenotfounderror: no module named 'fused_layer_norm_cudahttps://blog.csdn.net/Zhangye1011/article/details/125962036但是照做还是会报错,试了无数次,最终在这里看到:GPU版本报错no module named 'fused_layer_norm_cuda' · Issue #I91FJC · 讯飞星火开源/iFlytekSpark-13B - Gitee.com

结合上面的博客,感觉有可能确实是分支的问题。 apex也确实有这样的分支:

GitHub - NVIDIA/apex at 22.04-dev

所以把repo clone下来之后,首先:

git checkout 22.04-dev

再运行:

pip install -v --disable-pip-version-check --no-cache-dir --global-option="--cpp_ext" --global-option="--cuda_ext" ./

竟然就没错了!想不通这么多人遇到的问题为啥不好好解决。

另外就是下载已经训练好的模型,是在这里下载:

iFlytekSpark-13B-model-GPU: 星火开源大模型13BGPU的模型权重icon-default.png?t=N7T8https://gitee.com/iflytekopensource/i-flytek-spark-13-b-model-gpu需要注意的是,如上面repo里介绍的,由于模型太大所以使用Git LFS存储,如果直接用git clone是没法下载的。需要做的是先安装Git LFS(有很多git工具已经自带了):

sudo apt-get install git-lfs

然后:

git lfs install

接下来就可以clone这个repo了:

git lfs clone https://gitee.com/iflytekopensource/i-flytek-spark-13-b-model-gpu.git

需要注意的是,从网页上看mp_rank_00_model_states.pt大概大小有50GB,两个权重文件加起来也只有100GB,我怎么clone了458GB。估计是因为repo中多次commit,不知道设置clone深度会不会解决,我没有测试。

最后总结一下目录关系,这点repo里写得也不是很详细:

运行推理的bash脚本在:iFlytekSpark-13B/deepspeed-megatron/examples_deepspeed/iFlytekSpark里,但是repo和bash脚本里写的权重文件和tokenizer的位置:

# 若文件结构如上所示,则对应参数如下
from_pretrained="/data/ckpt_download"
tokenizer_file="/data/tokenizer/tokenizer" #注意使用tokenizer/目录下.model和vocab的前缀名字tokenizer ,而不是只到tokenizer/目录

让人不明就里,实际上可以写成绝对路径,例如我为方便起见,改成了:

from_pretrained="/home/quyu/Projects/iFlytekSpark-13B/Data/ckpt_download"
tokenizer_file="/home/quyu/Projects/iFlytekSpark-13B/Data/tokenizer/tokenizer"

最后说说硬件要求,我做完了以上配置就不报别的错了,只是还是显存溢出了,我的电脑是3090*2的,看来最低只能用40GB单卡,两个24GB由于各种原因会爆显存。

http://www.hengruixuexiao.com/news/49580.html

相关文章:

  • 做网站首页置顶多少钱深圳外贸seo
  • 做网站西美花街怎么免费建个人网站
  • 开发公司电梯前室只给一楼吊顶seo优化有哪些
  • html5 css3 网站源码河南网站顾问
  • 专业做消防工程师的正规网站爱网站
  • 日用品网站模板山东最新资讯
  • 邯郸专业网站建设网站推广优化外包公司哪家好
  • 江苏建设委员网站建筑焊工查询网络营销的核心是
  • 在线生成电子印章太原seo服务
  • 网站建设销售销售流程图德州seo整站优化
  • 服务器网站后台登陆密码黄框显示百度com百度一下你
  • 代刷网站app制作教程推广拉新app哪几个靠谱
  • 怎样做淘客网站seo数据
  • 网站建设专家选哪家互联网营销师报名
  • 黑河企业网站建设公司网站制作专业
  • 广东今日最新消息新闻重庆高端seo
  • 盗版视频网站怎么做的搜索引擎营销的内容有哪些
  • 自己网站怎么建设焊工培训技术学校
  • 网站推广费用网络营销项目策划方案
  • 在今日头条之类网站做电商上海营销公司
  • 做医疗器械网站seo搜索引擎优化就业前景
  • 公司网络维护具体做什么怎么提高seo关键词排名
  • 商城网站建设开发多少钱网站维护工作内容
  • 做外贸兼职的网站视频营销的策略与方法
  • 温州网站推广优化站长工具seo查询5g5g
  • 广州网站关键词优化推广淘宝关键词推广
  • 佛山网站设计全国疫情突然又严重了
  • 自适应网站好建们电脑系统优化软件排行榜
  • 传媒公司可以做网站么市场调研与分析
  • 珠海网站建设电话百度客服人工电话24小时