当前位置：首页 > news >正文

新公司网站建设流程最有效的15个营销方法

news 2025/7/3 13:59:33

新公司网站建设流程,最有效的15个营销方法,网络优化app哪个好,上海城隍庙景点介绍目录 Spark入门: 概述历史概述SparkCore：RDDSparkSQL:SparkStreamingSpark内核调优 Spark概述回顾： Hadoop HDFS存储 MR分析计算 YARN调度 Hadoop的MR计算中的shuffle需要落盘，速度不够快。 Spark是一种基于内存的分析计算引擎。历史…

Hadoop MR框架: 计算过程中Map和Reduce之间的shuffle过程需要落盘，reduce结束后也需要落盘。
Spark RDD框架：会主动考虑前后数据的逻辑性，只在必要时进行shuffle落盘。适合迭代式计算，图形计算。Spark支持优化，避免了一些重复冗余的计算操作，是基于懒加载机制的框架。

Spark模块和特点

模块： SparkSQL + SparkCore +Yarn
特点：

快：基于内存运算比Hadoop MR快100倍以上，有很强的自适应优化，帮你自动计算出最合适的任务资源调度方案。
易用：支持java, Python, Scala的API
通用：提供了统一的解决方案，支持SQL、实时流处理
兼容性：调度和计算分离，支持其他调度器，比如yarn调度器

安装部署

本地模式

提交Spark任务

bin/spark-submit \ # 提交任务
--class org.apache.spark.examples.SparkPi \
--master local[2] \ # 运行模式
# Spark案例任务，求PI
./examples/jars/spark-examples_2.12-3.1.1.jar \   
10  # 任务跑10次，取平均值

–master : 表示运行模式，默认是local[], 中括号里面表示CPU核数， 表示当前机器的全部CPU。

hadoop102:4040 Spark任务运行查看界面，建议将10替换为1000，任务结束后无法进入。可以看到计算过程的有向无环图。

YARN模式

关闭虚拟机
重新解压spark，命名为spark-yarn目录
关闭物理和虚拟的内存检查
修改spark-env.sh配置文件的YARN_CONF_DIR，告诉spark，yarn配置文件在哪里。
hadoop103:8088 通过YARN查看任务执行情况。
配置历史服务
- 修改spark-defaults.conf, 配置日志存储路径
- 修改spark-env.sh, 添加如下配置

export SPARK_HISTORY_OPTS="
-Dspark.history.ui.port=18080 
-Dspark.history.fs.logDirectory=hdfs://hadoop102:8020/directory 
-Dspark.history.retainedApplications=30"

创建历史服务器的目录
sbin/start-history-server.sh，启动历史服务器HistoryServer
再次提交计算PI的任务，使用Hadoop102:18080查看任务DAG图解，查看有多少个阶段和计算过程。主要查看executor界面，查看任务申请了多少个执行器，和执行器的运行时间。
10.配置历史日志，为了能够通过YARN网页跳转到Spark历史日志网页中。在spark-defaults.conf添加如下信息：

spark.yarn.historyServer.address=hadoop102:18080
spark.history.ui.port=18080

运行流程

Spark yarn 也有两种模式：

客户端模式：初始化，任务的切分都在本地执行。适合内网执行，大数据一般都是内网运行，故一般是客户端模式，任务结果就在当前客户端可以看到。
集群模式：初始化，任务的切分在集群的AM中执行，适合外网执行，任务结果需要到YARN中才能查看到。

查看全文

http://www.hengruixuexiao.com/news/15934.html

自己做的网站怎样弄网上搜索引擎优化到底是优化什么

电子商务网站的建设和维护网站google搜索优化

北京房山区住房和城乡建设委员会网站怎么seo关键词优化排名

游戏类网站备案需要前置审批吗seo1现在怎么看不了

长沙网站开发培训网店代运营哪个好

wordpress seo技巧seo相关ppt

黑龙江建设教育信息网站首页百度投票人气排行榜入口

网站规划建设与管理维护课后答案wordpress外贸独立站

建筑工程网站哪个好百度百科词条入口

备案网站公共查询系统5g影讯5g天线在线观看免费视频

上海劳务市场招聘信息查询常见的系统优化软件

做网站的软件是什么网络营销考试答案

高端产品网站建设市场调研分析报告怎么写

做跨境电商网站报价百度首页纯净版怎么设置

新公司网站建设流程最有效的15个营销方法

目录

Spark概述

历史

两种模式

Hadoop和Spark的对比

Spark模块和特点

安装部署

本地模式

YARN模式

运行流程

相关文章：