Hadoop - Single Node, Single Node Cluster

본문 바로가기 메뉴 바로가기

티스토리 뷰

Hadoop

Hadoop - Single Node, Single Node Cluster

˙ᵕ˙ 2020. 8. 13. 09:33

Hadoop

하둡에 붙여서 쓰는 것 : 에코 시스템
Single Node : Hadoop
Single Node Cluster : NameNode, DataNode를 1대로
Multi Node Cluster : NameNode 1대, DataNode 3대
- 짝수로 써야함

Hadoop 설치

https://hadoop.apache.org/releases.html

세팅 추가

설치 확인

Single Node 단독모드

mapreduce
wordcount 사용하기
단어 횟수 분석

성공하면 _SUCCESS가 뜸

결과
결과 디렉터리가 있으면 에러가 나므로 같은 디렉토리를 쓰려면 삭제해야한다

Single Node Cluster 의사 분산 모드

openssh 패키지 설치

key 생성

공개키를 ssh 인증키로 등록

접속

로그아웃(현재 세션을 나가야 작업 가능)

환경설정
JAVA_HOME을 인식하지 못해서 써줘야 함

복제옵션
많으면 느려진다

설정 변경 시 format

실행

모니터링 (하둡 켠 상태로 실행)
http://localhost:9870

Yarn 분산 환경 관리

실행

하둡 저장소

하둡 저장소에 분석 파일 넣음

분석

결과 확인

'Hadoop' 카테고리의 다른 글

Flume (0)	2020.08.14
Hadoop - Multi Node Cluster (0)	2020.08.13
Oracle 설치 (0)	2020.08.11
Tomcat설치 (0)	2020.08.11
Java 설치 (0)	2020.08.11

댓글

공지사항

최근에 올라온 글

최근에 달린 댓글

Total

Today

Yesterday

링크

TAG more

글 보관함

티스토리툴바