当前位置: 首页 > news >正文

日本wordpress宁波免费建站seo排名

日本wordpress,宁波免费建站seo排名,淘宝客网站怎么做优化,网站建设与代运营产品介绍文章目录 1. 准备数据文件2. 文件上传到HDFS指定目录2.1 创建HDFS目录2.2 上传文件到HDFS2.3 查看上传的文件 3. 运行词频统计程序的jar包3.1 查看Hadoop自带示例jar包3.2 运行示例jar包里的词频统计 4. 查看词频统计结果5. 在HDFS集群UI界面查看结果文件6. 在YARN集群UI界面查…

文章目录

  • 1. 准备数据文件
  • 2. 文件上传到HDFS指定目录
    • 2.1 创建HDFS目录
    • 2.2 上传文件到HDFS
    • 2.3 查看上传的文件
  • 3. 运行词频统计程序的jar包
    • 3.1 查看Hadoop自带示例jar包
    • 3.2 运行示例jar包里的词频统计
  • 4. 查看词频统计结果
  • 5. 在HDFS集群UI界面查看结果文件
  • 6. 在YARN集群UI界面查看程序运行状态
  • 7. 失败状态原因分析与解决

在这里插入图片描述

1. 准备数据文件

首先,我们需要在Hadoop集群的主节点上准备数据文件,用于词频统计MapReduce作业。

  • 在master云主机上创建一个名为 test.txt 的文件。

2. 文件上传到HDFS指定目录

接下来,我们将本地文件系统上的数据文件上传到HDFS的指定目录。

2.1 创建HDFS目录

  • 执行命令:hdfs dfs -mkdir -p /wordcount/input 来创建HDFS目录。

2.2 上传文件到HDFS

  • 执行命令:hdfs dfs -put test.txt /wordcount/input 来上传文件。

2.3 查看上传的文件

  • 执行命令:hdfs dfs -ls /wordcount/input 来查看目录中的文件。
  • 执行命令:hdfs dfs -cat /wordcount/input/test.txt 来查看文件内容。
  • 也可以通过Hadoop WebUI界面来查看文件。

3. 运行词频统计程序的jar包

我们将使用Hadoop自带的示例jar包来运行词频统计程序。

3.1 查看Hadoop自带示例jar包

  • 切换到MR示例目录:执行命令 cd $HADOOP_HOME/share/hadoop/mapreduce
  • 列出目录信息:执行命令 ls
  • 找到示例程序jar包:hadoop-mapreduce-examples-3.3.4.jar

3.2 运行示例jar包里的词频统计

  • 执行命令:hadoop jar ./hadoop-mapreduce-examples-3.3.4.jar wordcount /wordcount/input/test.txt /wordcount/output 来运行词频统计程序。

4. 查看词频统计结果

  • 执行命令:hdfs dfs -ls /wordcount/output 来查看结果文件。
  • 执行命令:hdfs dfs -cat /wordcount/output/* 来查看词频统计的结果内容。

5. 在HDFS集群UI界面查看结果文件

  • 通过HDFS集群UI界面查看 /wordcount/output 目录下的文件。

6. 在YARN集群UI界面查看程序运行状态

  • 在浏览器中访问 http://master:8088 来查看YARN集群的界面。
  • 观察应用程序的运行状态,例如 application_1728606339394_0001

7. 失败状态原因分析与解决

如果作业失败,可能是因为 mapred-site.xml 文件中没有配置必要的环境变量。

  • 配置必要的环境变量:
    <configuration><!-- 配置项 --><property><name>mapreduce.framework.name</name><value>yarn</value></property><property><name>yarn.app.mapreduce.am.env</name><value>HADOOP_MAPRED_HOME=/usr/local/hadoop-3.3.4</value></property><property><name>mapreduce.map.env</name><value>HADOOP_MAPRED_HOME=/usr/local/hadoop-3.3.4</value></property><property><name>mapreduce.reduce.env</name><value>HADOOP_MAPRED_HOME=/usr/local/hadoop-3.3.4</value></property>
    </configuration>
    
  • 修改配置后,需要将配置分发到所有节点,并重启Hadoop服务。

通过以上步骤,我们完成了一个词频统计的MapReduce作业,从准备数据到运行作业,再到查看结果。这个过程展示了Hadoop MapReduce作业的基本流程和一些常见的配置问题及其解决方法。

http://www.hengruixuexiao.com/news/47060.html

相关文章:

  • 用JSP做电商网站dw网页制作教程
  • 垣曲做网站免费查权重工具
  • 企业网站做电脑营销网络推广有多少种方法
  • 北京高端网站公司哪家好公司建网站流程
  • 网站建设型网站横幅(banner)图片厦门seo外包平台
  • 电信电信网站备案系统如何引流推广产品
  • 新闻网站广告怎么做宁波seo企业推广
  • 网站开发语言排名百度竞价怎么做
  • 外贸网站优化怎么做免费外链网盘
  • 网站和自媒体都可以做淘宝指数转换工具
  • 做三级分销网站制作seo怎么优化关键词排名培训
  • 中山做营销型网站最全bt磁力搜索引擎索引
  • 如何给别人做网站赚钱网络营销案例具体分析
  • 网站使用什么数据库青岛网站建设有限公司
  • 用html5做商城网站怎么做2024年重大新闻摘抄
  • 营销网站建设的因素精准信息预测
  • 深圳做网站报价潍坊网站排名提升
  • 竞价网站与竞价网站之间做友情链接谷歌搜索引擎网页版入口
  • 做老虎机网站犯法么网站链接推广工具
  • 如何规避电子政务网站建设教训做小程序的公司
  • 好看的网站你明白的如何在百度上推广自己
  • 北京 网站建设|小程序|软件开发|app开发公司广告设计
  • 网站建设微信运营公司百度自然排名优化
  • 购物网站推广方案seo排名优化什么意思
  • 湛江seo排名外包网站seo入门基础教程书籍
  • 公司网站如何被百度收录免费建网站最新视频教程
  • 金山网页设计关键词怎样做优化排名
  • 网站如何建数据库郑州模板网站建设
  • 天通苑网站建设关键词搜索技巧
  • 那些网站是用python做的营销策划的概念