前期回顾:
大数据学习笔记1——hdfs架构原理
1、安装
从官网
https://hadoop.apache.org/releases.html下载所需版本。
把tar.gz文件上传到linux系统环境中解压即可。
2、主要文件配置
HDFS配置文件存放在Hadoop安装目录下的etc/hadoop下,主要与core-site.xml和hdfs-site.xml两个文件相关。
core-site.xml配置环境变量
hadoop.tmp.dir
file:/usr/local/hadoop/tmp
A base for other temporary directories.
fs.defaultFS
hdfs://hadoop:9000
hadoop.proxyuser.bigdata.groups
hadoop
hadoop.proxyuser.bigdata.hosts
hadoop
hdfs-site.xml配置文件系统
dfs.replication
1
dfs.namenode.name.dir
file:/usr/local/hadoop/tmp/dfs/name
dfs.datanode.data.dir
file:/usr/local/hadoop/tmp/dfs/data
mapred-site.xml配置计算框架
mapreduce.framework.name
yarn
yarn-site.xml配置yarn
yarn.nodemanager.aux-services
mapreduce_shuffle
yarn.resourcemanager.address
hadoop:18040
yarn.resourcemanager.scheduler.address
hadoop:18030
yarn.resourcemanager.resource-tracker.address
hadoop:18025
yarn.resourcemanager.admin.address
hadoop:18141
yarn.resourcemanager.webapp.address
hadoop:18088
下篇:大数据学习笔记3——hdfs 文件系统shell命令(1)