티스토리 뷰

Hadoop

  • 하둡에 붙여서 쓰는 것 : 에코 시스템

  • Single Node : Hadoop

  • Single Node Cluster : NameNode, DataNode를 1대로

  • Multi Node Cluster : NameNode 1대, DataNode 3대

    •  

      짝수로 써야함

       

Hadoop 설치

  • 세팅 추가

  • 설치 확인

Single Node 단독모드

  • mapreduce

  • wordcount 사용하기

  • 단어 횟수 분석

  • 성공하면 _SUCCESS가 뜸

  • 결과

  • 결과 디렉터리가 있으면 에러가 나므로 같은 디렉토리를 쓰려면 삭제해야한다

Single Node Cluster 의사 분산 모드

  • openssh 패키지 설치

  • key 생성

  • 공개키를 ssh 인증키로 등록

  • 접속

  • 로그아웃(현재 세션을 나가야 작업 가능)

  • 환경설정

  • JAVA_HOME을 인식하지 못해서 써줘야 함

  • 복제옵션

  • 많으면 느려진다

  • 설정 변경 시 format

  • 실행

Yarn 분산 환경 관리

  • 실행

하둡 저장소

  • 하둡 저장소에 분석 파일 넣음

  • 분석

  • 결과 확인

'Hadoop' 카테고리의 다른 글

Flume  (0) 2020.08.14
Hadoop - Multi Node Cluster  (0) 2020.08.13
Oracle 설치  (0) 2020.08.11
Tomcat설치  (0) 2020.08.11
Java 설치  (0) 2020.08.11
댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2025/01   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함