Hadoop环境安装完之后需要进行相应的配置
Hadoop组件通过XML来配置,core-site.xml用于配置Common组件的属性,hdfs-site.xml文件用于配置HDFS属性,mapred-site.xml文件用于配置MapReduce属性,hdoop支持独立模式、伪分布模式、全分布模式,在不同模式下,各属性的配置:
组件 | 属性 | 独立模式 | 伪分布模式 | 全分布模式 |
common | fs.default.name | file:///(默认) | hdfs://localhost/ | hdfs://namenode |
hdfs | dfs.replication | N/A | 1 | 3 |
mapreduce | mapred.job.tracker(hadoop2不用配置) | local(默认) | localhost:8021 | jobtracker:8021 |
我hadoop2的配置如下:
core-site.xml
fs.default.name hdfs://localhost/ hadoop.tmp.dir /usr/lib/hadoop/tmp/
hdfs-site.xml:
dfs.default.name /usr/lib/hadoop/logs/ dfs.replication 1 dfs.permissions false
mapred-site.xml:
mapreduce.framework.name Yarn
yarn-site.xml:
yarn.resourcemanager.resource-tracker.address localhost:8990 yarn.resourcemanager.scheduler.address localhost:8991 yarn.resourcemanager.scheduler.class org.apache.hadoop.yarn.server.resourcemanage.scheduler.capacity.CapacityScheduler yarn.resourcemanager.address localhost:8993 yarn.nodemanager.local-dirs /usr/lib/hadoop/tmp/node yarn.nodemanager.address localhost:8994 yarn.nodemanager.resource.memory-mb 102040 yarn.nodemanager.remote-app-log-dir /usr/lib/hadoop/tmp/app-logs yarn.nodemanager.log-dirs /usr/lib/hadoop/tmp/node yarn.nodemanager.aux-services mapreduce_shuffle
slaves:
localhost
完事之后执行hadoop namenode -fromat 格式化hdfs文件系统。