当前位置: 首页 > news >正文

南山建设网站苏州旺道seo

南山建设网站,苏州旺道seo,中装建设重组最新消息,劳务派遣做网站有必要吗多模态模型的训练llamafactory也可以训练,但是总的来说,llamafactory对多模态模型的支持还是不太多,ms-swift支持的多模态模型更多,因此有时候去找框架是否够支持相应的模型时会有所困难,所以对这些框架的代码也要稍微…

多模态模型的训练llamafactory也可以训练,但是总的来说,llamafactory对多模态模型的支持还是不太多,ms-swift支持的多模态模型更多,因此有时候去找框架是否够支持相应的模型时会有所困难,所以对这些框架的代码也要稍微熟悉一些。

1.model_type

模型支持在swift/llm/utils/model.py中,目前能够支持的多模态模型还是很多,这对我们做一些实验室相对方便的,直接我记得我sft qwenvl时还有bs不能大于1的bug,不知道目前解决了没有,目前我实验的llava和internvl2都没有bs=1的限制了。目前llama-vision只能在最新的swift的main分支中,还有合并进最新版本,不过问题也不大。

2.swift对数据的支持包括两种

一种是data.jsonl中添加,这和llamafactory一致的

另一种直接加载相应的转换格式的jsonl或者json文件。

3.template_type

swift中的参数基本都是一致的,没有太多需要调的空间,唯一需要调整的也就是model_type和template_type了,swift/llm/utils/template.py,其实这种框架本质上都是依赖hf的transformer和peft等库进行训练的,当然trainer基本都是自家封装的,但是训练这块基本都是相似的transformer的模式,因此其实更多的还是数据转换,一些预处理之类的东西有所区别。

4.参数

swift/llm/utils/argument.py中,主要关注的就是SftArguments了。

http://www.hengruixuexiao.com/news/55591.html

相关文章:

  • 网站主持人制作方法app引流推广软件
  • 网站做管制户外刀具化妆品营销推广方案
  • 南京网络推广网站陕西seo关键词优化外包
  • 面签拍照 网站备案关键词优化最好的方法
  • 网站建设文字域名反查
  • 淘宝网站建设预算表seo技术培训江门
  • 销售性网站建设需求百度指数电脑端查询
  • seo整站优化网站建设2022年新闻热点摘抄
  • 吴江规划建设局网站网络运营是什么意思
  • wp大学wordpress建站流程免费关键词搜索工具
  • wordpress时间云储存百度上做优化一年多少钱
  • 专做定制型网站百度惠生活怎么优化排名
  • 网站付费推广渠道中国站长站官网
  • 做家具网站要多少钱境外电商有哪些平台
  • 佛山网站建设及优化公司十大暗网搜索引擎
  • app开发注意事项湖南靠谱seo优化报价
  • 手机站和网站有区别吗长沙seo外包优化
  • 如何拥有自己的私人网站平台b2b模式的电商平台有哪些
  • 遵义外国网站制作谷歌seo网站排名优化
  • 做网站业务的怎么寻找客户百度一下首页网页
  • 微信平台微网站开发网上推广用什么平台推广最好
  • 网站服务器过期了郑州seo招聘
  • 长沙3合1网站建设价格站长之家权重查询
  • 织梦源码怎样做单页网站营销推广投放
  • 怎样租用个人网站空间百度识图网页版入口
  • 城乡建设管理局的网站推广工作的流程及内容
  • 有哪些可以做h5的网站网站优化排名资源
  • 沈阳怎么做网站石家庄seo网站排名
  • 网站不见了seo观察网
  • h5 网站开发流程热门关键词