当前位置: 首页 > news >正文

信息化建设 调查报告 乡镇网站公司的网站

信息化建设 调查报告 乡镇网站,公司的网站,东营专业网站建设,网站建设端口要对数据的复杂关系建模,可以借用树结构来帮助切分数据,如何实现数据的切分?怎样才能知道是否已经充分切分?这些问题的答案取决于叶节点的建模方式。回归树假设叶节点是常数值,这种策略认为数据中的复杂关系可以用树结…

要对数据的复杂关系建模,可以借用树结构来帮助切分数据,如何实现数据的切分?怎样才能知道是否已经充分切分?这些问题的答案取决于叶节点的建模方式。回归树假设叶节点是常数值,这种策略认为数据中的复杂关系可以用树结构来概括

为成功构建以分段常数为叶节点的树,需要度量出数据的一致性。事实上,在数据集上计算混乱度是非常简单的:首先计算所有数据的均值,然后计算每条数据的值到均值的差值。为了对正负值差同等看待,一般使用绝对值或平方值来代替上述差值。

构建树

构建回归树,需要补充一些新的代码。给定某个误差计算方法,该函数会找到数据集上最佳的二元切分方式。另外,该函数还要确定什么时候停止切分,一旦停止切分会生成一个叶节点。因此,函数只需要完成两件事:用最佳方式切分数据集和生成相应的叶节点。

下面的代码中,chooseBestSplit()最复杂,该函数的目标是找到数据集切分的最佳位置。它遍历所有的特征及其可能的取值来找到使误差最小化的切分阈值。该函数的伪代码大致如下:

对每个特征:

    对每个特征值:

        将数据集切分成两份

        计算切分的误差

        如果当前误差小于当前最小误差,那么将当前切分设定为最佳切分并更新最小误差

返回最佳切分的特征和阈值

具体实现代码:

def binSplitDataSet(dataSet,feature,value):mat0=dataSet[nonzero(dataSet[:,feature]>value)[0],:][0]mat1=dataSet[nonzero(dataSet[:,feature]<=value)[0],:][0]return mat0,mat1def regLeaf(dataSet):# 负责生成叶节点。当chooseBestSplit()函数确定不再对数据进行切分时,调用本函数来得到叶节点的模型,在回归树中,该模型其实就是目标变量的均值return mean(dataSet[:,-1])def regErr(dataSet):#在给定数据上计算目标变量的平方误差。return var(dataSet[:,-1])*shape(dataSet)[0]def chooseBestSplit(dataSet,leafType=regLeaf,errType=regErr,ops=(1,4)):#回归树构建的核心函数,目的是找到数据的最佳二元切分方式。#如果找不到一个好的二元切分,返回None并同时调用createTree()来产生叶节点,叶节点的值也会返回None#tolS和tolN是用户指定的参数,用于控制函数的停止时机。其中tolS是容许的误差下降值,tolN是切分的最小样本数。tolS=ops[0]tolN=ops[1]if len(set(dataSet[:,-1].T.tolist()[0]))==1:#如果剩余特征的数目为1,那么就不需要再切分而直接返回return None,leafType(dataSet)m,n=shape(dataSet)S=errType(dataSet)bestS=infbestIndex=0bestValue=0for featIndex in range(n-1):for splitVal in set(dataSet[:,featIndex]):mat0,mat1=binSplitDataSet(dataSet,featIndex,splitVal)if (shape(mat0)[0]<tolN) or (shape(mat1)[0]<tolN):continuenewS=errType(mat0)+errType(mat1)if newS<bestS:bestIndex=featIndexbestValue=splitValbestS=newSif (S-bestS)<tolS:#如果切分数据集后效果提升不够大,那么就不进行切分操作而直接创建叶节点return None,leafType(dataSet)mat0,mat1=binSplitDataSet(dataSet,bestIndex,bestValue)if (shape(mat0)[0]<tolN) or (shape(mat1)[0]<tolN):return bestIndex,bestValue

http://www.hengruixuexiao.com/news/18061.html

相关文章:

  • 网站链接怎么做跳转厦门seo推广外包
  • 网站套餐方案谷歌seo招聘
  • 如何做淘宝代购网站一份完整的活动策划方案
  • 做网站以后的趋势知乎东莞网站优化关键词排名
  • 网站建设前的市场分析优质的seo网站排名优化软件
  • 长春网站制作wang营销图片大全
  • 重庆企业网站建设哪家专业网络广告营销典型案例
  • 网上创业及网站建设实训总结如何制作一个自己的网页
  • 湖南做电商网站需要什么条件小学生简短小新闻
  • 网站建设教程吧广州关于进一步优化疫情防控措施
  • 网站设计技巧免费seo教程资源
  • 广东seo网站设计多少钱公司以优化为理由裁员合法吗
  • 网站平台建设重点难点分析b站视频未能成功转码
  • 公司手机网站效果图邵阳seo优化
  • 企业简介的网站怎么做b站视频推广怎么买
  • 百度推广账号申请seo是怎么优化的
  • 做电影网站失败软文推广渠道
  • 鞍山做网站公司互联网营销师培训课程
  • 国外效果做的好的网站推广普通话的意义是什么
  • seo整站优化更能准确获得客户搜狐三季度营收多少
  • 哪种语言做的网站好点击seo软件
  • 代理分佣后台网站开发网站新域名查询
  • 做网站哪家好产品推广软文300字
  • 松阳网站建设怎么网上推广自己的产品
  • 东软网站建设百度链接提交
  • 网站怎么做json数据库百度推广登录入口登录
  • 嘉兴免费做网站网络建站优化科技
  • 做的很好的画册网站搜索大全引擎
  • 微信公众号对接网站做东莞seo培训
  • 有做全棉坯布的网站吗找谁做百度关键词排名