当前位置: 首页 > news >正文

做婚庆网站图片下载百度快速排名系统查询

做婚庆网站图片下载,百度快速排名系统查询,台州网红打卡地,签订网站制作合同注意事项文章目录 写在前面大模型简介LLM简介RAG简介LangChain开发框架开发LLM应用的整体流程 写在前面 大模型时代从GPT爆发开始到现在已有一年多了,深度学习发展之快无法想象,一味感叹技术发展速度超越个人学习速度是没用的,倒不如花点时间参加一些…

文章目录

  • 写在前面
    • 大模型简介
      • LLM简介
      • RAG简介
      • LangChain开发框架
      • 开发LLM应用的整体流程

写在前面

大模型时代从GPT爆发开始到现在已有一年多了,深度学习发展之快无法想象,一味感叹技术发展速度超越个人学习速度是没用的,倒不如花点时间参加一些活动,比如思考大模型时代下如何训练小模型呢?

大模型简介

LLM简介

在这里插入图片描述
毫无例外,openai的GPT系列是我们值得了解的一个重要模型,不过很可惜其并未开源,现在我们常用的GPT是3.5-turbo,可以执行各种任务,包括代码编写、数学问题求解、写作建议等。
其余模型见datawhale的开源学习文档。

RAG简介

大型语言模型(LLM)相较于传统的语言模型具有更强大的能力,然而在某些情况下,它们仍可能无法提供准确的答案。为了解决大型语言模型在生成文本时面临的一系列挑战,提高模型的性能和输出质量,研究人员提出了一种新的模型架构:检索增强生成(RAG, Retrieval-Augmented Generation)。该架构巧妙地整合了从庞大知识库中检索到的相关信息,并以此为基础,指导大型语言模型生成更为精准的答案,从而显著提升了回答的准确性与深度。

由于基于网络公开数据大量训练,应用于实际业务场景时基础大模型无法满足我们的实际业务需求,主要有以下几方面原因:

  • 知识的局限性:模型自身的知识完全源于它的训练数据,而现有的主流大模型(ChatGPT、文心一言、通义千问…)的训练集基本都是构建于网络公开的数据,对于一些实时性的、非公开的或离线的数据是无法获取到的,这部分知识也就无从具备。
  • 幻觉问题:所有的AI模型的底层原理都是基于数学概率,其模型输出实质上是一系列数值运算,大模型也不例外,所以它有时候会一本正经地胡说八道,尤其是在大模型自身不具备某一方面的知识或不擅长的场景。而这种幻觉问题的区分是比较困难的,因为它要求使用者自身具备相应领域的知识。
  • 数据安全性:对于企业来说,数据安全至关重要,没有企业愿意承担数据泄露的风险,将自身的私域数据上传第三方平台进行训练。这也导致完全依赖通用大模型自身能力的应用方案不得不在数据安全和效果方面进行取舍。

在这里插入图片描述
RAG的架构如图中所示,简单来讲,RAG就是通过检索获取相关的知识并将其融入Prompt,让大模型能够参考相应的知识从而给出合理回答。因此,可以将RAG的核心理解为“检索+生成”,前者主要是利用向量数据库的高效存储和检索能力,召回目标知识;后者则是利用大模型和Prompt工程,将召回的知识合理利用,生成目标答案

通常我们有新数据来的时候,往往我们会将模型在新数据上进行微调,但是RAG确是另外一种思路。RAG和Finetune的对比如下。
在这里插入图片描述

LangChain开发框架

LangChain 框架是一个开源工具,充分利用了大型语言模型的强大能力,以便开发各种下游应用。它的目标是为各种大型语言模型应用提供通用接口,从而简化应用程序的开发流程。
在这里插入图片描述
LangChain 主要由以下 6 个核心组件组成:

  • 模型输入/输出(Model I/O):与语言模型交互的接口
  • 数据连接(Data connection):与特定应用程序的数据进行交互的接口
  • 链(Chains):将组件组合实现端到端应用。比如后续我们会将搭建检索问答链来完成检索问答。
  • 记忆(Memory):用于链的多次运行之间持久化应用程序状态;
  • 代理(Agents):扩展模型的推理能力。用于复杂的应用的调用序列;
  • 回调(Callbacks):扩展模型的推理能力。用于复杂的应用的调用序列;

开发LLM应用的整体流程

  • 传统 AI 开发:需要首先构造训练集、测试集、验证集,通过在训练集上训练模型、在测试集上调优模型、在验证集上最终验证模型效果来实现性能的评估。
  • 大模型开发:流程更为灵活和敏捷。从实际业务需求出发构造小批量验证集,设计合理 Prompt 来满足验证集效果。然后,将不断从业务逻辑中收集当下 Prompt 的 Bad Case,并将 Bad Case 加入到验证集中,针对性优化 Prompt,最后实现较好的泛化效果。

在这里插入图片描述
在这里插入图片描述

http://www.hengruixuexiao.com/news/33470.html

相关文章:

  • 响应式网站实例优化公司
  • 电脑上如何做网站宣传无锡百度正规推广
  • 网站建设行业发展百度推广登录平台
  • wordpress头部信息杭州谷歌seo公司
  • 学做饼干网站国内重大新闻10条
  • 网站公司维护杭州优化商务服务公司
  • 珠海做网站设计服务好网站建站网站
  • 做那种类型的网站seo好百度seo排名在线点击器
  • 辽宁建设工程信息网入辽备案被锁定武汉seo招聘
  • 学校网站制作模板百度网盘app下载
  • 企业每月报账在哪个网站做seo的培训班
  • 企业网站建设合作协议范文楚雄seo
  • 网站设计中建设规划和准备阶段网页推广链接怎么做
  • 织梦建站教程视频2022今天刚刚发生地震了
  • wordpress完全开源么石家庄seo优化
  • 网站优化排名软件电工培训机构
  • 郑州金水区网站建设西安网络推广公司
  • 网站开发js路径网站如何快速被百度收录
  • 宜昌市住房城乡建设网站公司网址怎么注册
  • 空间怎么做网站培训机构管理系统
  • 江苏住房和城乡建设厅官方网站搜索引擎排名谷歌
  • 做网站用c 还是php百度热议怎么上首页
  • 玫瑰花代码编程pythonaso优化{ }贴吧
  • 餐饮 公司 网站建设友情链接出售平台
  • 外贸网站宗旨朝阳网站建设
  • 全国商城网站建设福州网站建设方案外包
  • 网站是否有管理员权限百度知道客服电话人工服务
  • 百度搜到自己网站国产免费crm系统有哪些在线
  • 商城 网站 功能酒店网络营销方式有哪些
  • wordpress环境配置文件全达seo