当前位置: 首页 > news >正文

上海服装品牌网站建设一键优化

上海服装品牌网站建设,一键优化,电脑网站有哪些,网站统计代码目录 一、第一种:parallelize 获取rdd时 二、第二种:通过外部读取数据-textFile 三、上面提到了默认分区数,那么默认分区是怎么计算呢? 一、第一种:parallelize 获取rdd时 没有指定:spark.default.paral…

目录

一、第一种:parallelize 获取rdd时

二、第二种:通过外部读取数据-textFile

三、上面提到了默认分区数,那么默认分区是怎么计算呢?


一、第一种:parallelize 获取rdd时

  • 没有指定:spark.default.parallelism参数值决定
  • 指定分区:指定几个,就是几个分区

总结:假如指定了分区数,分区数就是这个,假如没有指定spark.default.parallelism。

二、第二种:通过外部读取数据-textFile

  • 没有指定:spark.default.parallelism和2取最小值,

                         具体计算并行度的公式:min(spark.default.parallelism,2)

  • 指定分区:最小分区数,最少有这么多分区,具体的分区数可以根据HDFS分片规则来 hdfs                     ( 一片是128M或者128*1.1 = 140.8M)

rdd3 = sc.textFile("hdfs://bigdata01:9820/datas/wordcount/data.txt", minPartitions=2) 

假如你这个data.txt = 500M ,此时的分区数是:4  因为 500 =  128+ 128+ 128+ 116

三、上面提到了默认分区数,那么默认分区是怎么计算呢?

  • local模式

     默认并行度取决于本地机器的核数,即:

  1. local: 没有指定CPU核数,则所有计算都运行在一个线程当中,没有任何并行计算
  2. local[K]:指定使用K个Core来运行计算,比如local[2]就是运行2个Core来执行
  3. local[*]: 自动帮你按照CPU的核数来设置线程数。比如CPU有4核,Spark帮你自动设置4个线程计算
  • 集群模式

      集群模式包含Stanalone、Yarn模式,Mesos的默认并行度为8
      默认并行度取决于所有executor上的总核数与2的最大值,比如集群模式的设置如下:

--num-executors 5
--executor-cores 2
上面配置Executor的数量为5,每个Executor的CPU Core数量为2,
executor上的总核数10,则默认并行度为Max(10,2)=10。

http://www.hengruixuexiao.com/news/39863.html

相关文章:

  • 中山网站建设外包百度站长工具怎么关闭教程视频
  • 如何找外贸公司合作成都seo正规优化
  • css建设网站的步骤百度视频
  • 网站开发实践研究报告营销怎么做
  • 网站建设公司河南百度竞价推广技巧
  • 石家庄网站建设报价深圳网站推广
  • 下载类网站怎么做百度知道官网入口
  • 网站商城网络整合营销网络营销的主要传播渠道是
  • 网站的测试和网站上线中国网站建设公司
  • wordpress的restful台州关键词优化服务
  • 城乡建设环保部网站全国疫情最新名单
  • 广州建网站腾虎seo建站还有市场吗
  • 相亲网站男人拉我做外汇企业培训十大热门课程
  • 网站关键词怎么做效果好微信投放广告多少钱
  • seo是网站搜索引擎上的优化旅游景区网络营销案例
  • 阿里云网站备案信息真实性核验单谷歌搜图
  • 平面设计师培训廊坊关键词优化排名
  • 网站开发建设合同范本2022年新闻摘抄十条
  • 做瞹网站企业网络营销系统分析报告
  • 软件商店下载安装到桌面网站的seo如何优化
  • 网站怎么维护更新百度域名查询官网
  • 温州网站域名注册服务公司一句话宣传自己的产品
  • 网页布局设计说明关键词优化报价推荐
  • 女性做网站很有名的外贸营销
  • c语言做网站后台磁力宅在线搜种子
  • 上海哪家公司可以做网站精准营销的成功案例
  • 做淘宝网站java代码吗seo网站优化做什么
  • 微博网站开发与设计开题报告上海牛巨微seo优化
  • 查看网站开通时间链爱交易平台
  • 在哪个网站上做兼职比较好app下载