当前位置: 首页 > news >正文

宝鸡网站建设设计网站地址ip域名查询

宝鸡网站建设设计,网站地址ip域名查询,个人摄影网站模版,怎么下载建筑工程网一、RDD对象 PySpark支持多种数据的输入,在输入完成后,都会得到一个:RDD类的对象 RDD全称为:弹性分布式数据集(Resilient Distributed Datasets) PySpark针对数据的处理,都是以RDD对象作为载…

一、RDD对象

PySpark支持多种数据的输入,在输入完成后,都会得到一个:RDD类的对象

RDD全称为:弹性分布式数据集(Resilient Distributed Datasets)

PySpark针对数据的处理,都是以RDD对象作为载体,即:

  • 数据存储在RDD内
  • 各类数据的计算方法,也都是RDD的成员方法
  • RDD的数据计算方法,返回值依旧是RDD对象

40cb420610664ebc8eed66760c45c62b.png

        PySpark的编程模型可以归纳为:准备数据到RDD -> RDD迭代计算 -> RDD导出为list、文本文件等,即:源数据 -> RDD -> 结果数据

二、Python数据容器转RDD对象

        PySpark支持通过SparkContext对象的parallelize成员方法,将:list、tuple、set、dict、str转换为PySpark的RDD对象

3679f65e4a844246bd4cdae1dcba74cf.png

         PySpark也支持通过SparkContext入口对象,来读取文件,来构建出RDD对象。

fc7f66772cdf441a8a7cf77a8bcdcc0b.png

代码案例:

"""
#通过PySpark代码加载数据,即数据输入
"""
from pyspark import SparkConf,SparkContext
conf = SparkConf().setMaster("local[*]").setAppName("test_spark")
sc = SparkContext(conf = conf)# 通过parallelize方法将Python对象加载到Spark内,成为RDD对象
rdd1 = sc.parallelize([1, 2, 3, 4, 5])
rdd2 = sc.parallelize((1, 2, 3, 4, 5))
rdd3 = sc.parallelize("abcdefg")
rdd4 = sc.parallelize({1, 2, 3, 4, 5})
rdd5 = sc.parallelize({"key1": "value1", "key2": "value2"})# 如果要查看RDD里面有什么内容,需要用collect()方法
print(rdd1.collect())
print(rdd2.collect())
print(rdd3.collect())
print(rdd4.collect())
print(rdd5.collect())

打印结果:

8acffe7a3ba04323a5d04dac1d4d86e0.png

pyspark安装方法 :

第一种方法时命令行安装:pip install pyspark;

第二种方式是直接在Pycharm进行安装,如下图所示;

a231807459f74d538bd57dcef43b4058.png

33537244fa3f43548a6c773a47d30627.png

        安装完成后,运行代码出现缺少Java环境依赖,需要配置java运行环境才可以运行Pyspark导入报对象,配置环境的过程可以参考博客教程:

java 环境配置(详细教程)_java环境配置_多加点辣也没关系的博客-CSDN博客

JDK 8.0 的安装包已上传资源包,希望可以帮助到大家!

f0c9da8980984f24bac46648ed89e3e4.gif

 

http://www.hengruixuexiao.com/news/22505.html

相关文章:

  • 苏州专业网站制作深圳市企业网站seo营销工具
  • 赢展网站建设今日头条最新新闻消息
  • 东莞做网站-南城信科百度查看订单
  • 旅游电子商务网站的建设方案泉州全网推广
  • 伊犁州住房城乡建设局网站优化大师最新版本
  • 网站建设专家如何选产品推广软文
  • 直销系统开发哈尔滨知乎关键词优化软件
  • 益阳网站开发网店怎么运营和推广
  • 九江建设监督网站google手机官网
  • 美食网站开发的意义公司做网络推广哪个网站好
  • 网站 前台后台推广品牌的方法
  • wordpress模板建站潍坊网站排名提升
  • 做业务网站宁德市市长
  • 六安市建设银行网站百度查询入口
  • 内蒙古中汇建设有限公司网站工程建设数字化管理平台
  • 安装完wordpress怎么打开长沙百度搜索排名优化
  • 学校电脑课做网站的软件在线代理浏览网站免费
  • 做性爱图片网站网址大全下载
  • 合肥网站建设网站推广免费b站推广网站下载
  • 用vs做网站成都网站快速优化排名
  • 域名连接到网站怎么做百度识图入口
  • 无锡专业做网站的公司爱站网长尾关键词挖掘查询工具
  • 欧美做视频网站有哪些如何开网站详细步骤
  • 怎样做网站快照艺考培训
  • 企业网站排名提升百度学术搜索入口
  • 合肥网站搭建网络推广渠道都有哪些
  • b2b 贸易网站一个平台怎么推广
  • 婚恋网站 没法做网络营销优化推广公司
  • 优钙网logo设计网站优化推广怎么做
  • wordpress开启全站sslsem竞价推广代运营