티스토리 뷰
Hadoop
-
하둡에 붙여서 쓰는 것 : 에코 시스템
-
Single Node : Hadoop
-
Single Node Cluster : NameNode, DataNode를 1대로
-
Multi Node Cluster : NameNode 1대, DataNode 3대
-
짝수로 써야함
-
Hadoop 설치
-
세팅 추가
-
설치 확인
Single Node 단독모드
-
mapreduce
-
wordcount 사용하기
-
단어 횟수 분석
-
성공하면 _SUCCESS가 뜸
-
결과
-
결과 디렉터리가 있으면 에러가 나므로 같은 디렉토리를 쓰려면 삭제해야한다
Single Node Cluster 의사 분산 모드
-
openssh 패키지 설치
-
key 생성
-
공개키를 ssh 인증키로 등록
-
접속
-
로그아웃(현재 세션을 나가야 작업 가능)
-
환경설정
-
JAVA_HOME을 인식하지 못해서 써줘야 함
-
복제옵션
-
많으면 느려진다
-
설정 변경 시 format
-
실행
-
모니터링 (하둡 켠 상태로 실행)
Yarn 분산 환경 관리
-
실행
하둡 저장소
-
하둡 저장소에 분석 파일 넣음
-
분석
-
결과 확인
댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- linux
- I/O Mechanisms
- File Protection
- hadoop
- Java
- mapreduce
- Flume
- vmware
- oracle
- Disk Scheduling
- HDFS
- aop
- Spring
- 하둡
- Variable allocation
- springboot
- RAID Architecture
- Disk System
- Replacement Strategies
- Allocation methods
- SPARK
- I/O Services of OS
- JSON
- Free space management
- jdbc
- gradle
- 빅데이터 플랫폼
- 빅데이터
- SQL
- maven
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
글 보관함