当前位置: 首页 > news >正文

武汉老牌网站建设公司互联网营销师证书骗局

武汉老牌网站建设公司,互联网营销师证书骗局,织梦网站默认密码,网页制作素材中国文化一、RDD持久化 1、不采用持久化操作 查看要操作的HDFS文件 以集群模式启动Spark Shell 按照图示进行操作,得RDD4和RDD5 查看RDD4内容,会从RDD1到RDD2到RDD3到RDD4跑一趟 显示RDD5内容,也会从RDD1到RDD2到RDD3到RDD5跑一趟 2、采用持久化…

一、RDD持久化

1、不采用持久化操作
查看要操作的HDFS文件
在这里插入图片描述
以集群模式启动Spark Shell
在这里插入图片描述
按照图示进行操作,得RDD4和RDD5
在这里插入图片描述
查看RDD4内容,会从RDD1到RDD2到RDD3到RDD4跑一趟
在这里插入图片描述
显示RDD5内容,也会从RDD1到RDD2到RDD3到RDD5跑一趟

在这里插入图片描述
2、采用持久化操作
在这里插入图片描述
计算RDD4,就是基于RDD3缓存的数据开始计算,不用从头到尾跑一趟
在这里插入图片描述
计算RDD5,就是基于RDD3缓存的数据开始计算,不用从头到尾跑一趟
在这里插入图片描述

二、存储级别

案例演示设置存储级别
在这里插入图片描述

package net.cxf.rdd.day05import org.apache.log4j.{Level, Logger}
import org.apache.spark.storage.StorageLevel
import org.apache.spark.{SparkConf, SparkContext}import java.awt.SystemTray/*** 功能:* 作者:cxf* 日期:2023年05月06日*/
object SetStorageLevel {def main(args: Array[String]): Unit = {//创建Spark配置对象val conf = new SparkConf().setAppName("SetStorageLevel") //设置应用名称.setMaster("local[*]") //设置主节点位置(本地调试>// 基于Spark配置对象创建Spark容器val sc = new SparkContext(conf)//去除Spark运行信息Logger.getLogger("org").setLevel(Level.OFF)Logger.getLogger("com").setLevel(Level.OFF)System.setProperty("spark.ui.showConsoleProgress", "false")Logger.getRootLogger().setLevel(Level.OFF)//创建RDDval rdd = sc.textFile("hdfs://master:9000/park/words.txt")//将rdd标记为持久化,采用默认存储级别- StorageLevel.MEMORY_ONLYrdd.persist() //无参持久化方法//对rdd做扁平映射,得到rdd1val rdd1 = rdd.flatMap(_.split(" "))//将rdd1持久化都磁盘rdd1.persist(StorageLevel.DISK_ONLY)//将rdd1映射成二元组,得到rdd2val rdd2 = rdd1.map((_, 1))//将rdd2持久化到内存,溢出的数据持久化到磁盘rdd2.persist(StorageLevel.MEMORY_AND_DISK)//第一次行动算子,对标记为持久化的RDD进行不同级别的持久化曹println("元素个数:" + rdd2.count)//第二次行动算子,直接利用rdd2的持久化数据进行操作,无须从头进行计算rdd2.collect.foreach(println)}}

运行程序,查看结果

在这里插入图片描述

三、利用Spark WebUI查看缓存

最好重启Spark Shell
在这里插入图片描述
(一)创建RDD并标记为持久化
在这里插入图片描述
(二)Spark WebUI查看RDD存储信息
在这里插入图片描述
收集RDD数据
在这里插入图片描述
刷新WebUI,发现出现了一个ParallelCollectionRDD的存储信息,该RDD的存储级别为MEMORY,持久化的分区为8,完全存储于内存中。
在这里插入图片描述
单击ParallelCollectionRDD超链接,可以查看该RDD的详细存储信息
在这里插入图片描述
执行以下命令,创建rdd2,并将rdd2持久化到磁盘
在这里插入图片描述
刷新上述WebUI,发现多了一个MapPartitionsRDD的存储信息,该RDD的存储级别为DISK,持久化的分区为8,完全存储于磁盘中。
在这里插入图片描述
(三)将RDD从缓存中删除
在这里插入图片描述
刷新上述WebUI,发现只剩下了MapPartitionsRDD,ParallelCollectionRDD已被移除。
在这里插入图片描述

http://www.hengruixuexiao.com/news/24617.html

相关文章:

  • 外贸网站啥需要掌握在自己手里网络营销推广计划书
  • 承接网站开发文案免费seo免费培训
  • htdocs wordpressseo优化网站查询
  • 做金属小飞机的网站国内网络推广渠道
  • 什么网站做婚礼请柬关键词优化哪个好
  • 网站后台登录模板html沧州网站优化公司
  • 都匀网站建设公司武汉百度推广seo
  • 做网站的一般步骤郑州网站推广方案
  • 做网站如何使用网页插件海外发布新闻
  • 做网站需要学会哪些在线优化网站
  • 建站模板系统如何做推广和引流
  • 网站ui企业网站优化报告
  • 手机微信客户端网站建设域名免费注册0元注册
  • 电商 网站模板武汉网站设计公司
  • 专门做兼职的网站做网站的网络公司
  • 无锡网站建设服务公司淘宝关键词挖掘工具
  • 杭州一起做网站百度指数网址是什么
  • 滁州做网站优化福州百度推广优化排名
  • 邯郸网站建设外包站长之家网站
  • 营销网站解决方案百度查重免费
  • 做的好的区块链网站磁力屋 最好用
  • 婴儿用品网站模板百度网站打开
  • 白洋湾做网站公司网络策划方案
  • 龙岗营销网站建设公司哪家好seo优质友链购买
  • 网页框架图百度快速排名优化工具
  • 深圳高端做网站公司宣传推广渠道有哪些
  • 有回定ip怎么做网站不花钱网站推广
  • 郑州网站建设选微锐x网站页面分析
  • 泰州市网站制作公司南宁seo优化公司
  • 国内投资咨询网站 html模板四年级下册数学优化设计答案