학원/BigData (2) 썸네일형 리스트형 하둡 1. 가상머신 서버 실행 2. 포더로사 접속 3. 포더로사에 접속한 호스트, id, pw로 파일질라 접속(포트 22) [전처리 : 수집/적재] => [하둡(Hodoop)] => [후처리: 탐색/분석] 수집 레이어 => 적재 레이어 로그등을 수집하기하 위해 플럼(Flume) 사용 : 로우데이터 => 플럼 => 하둡 실시간 처리를 위해 스톰(Strom) 사용 로우데이터 => 플럼 => 카프카(버퍼링,트랜잭션 처리) => 스톰 => Hbase, 레디스 적재 레이어 => 처리/탐색 레이어 적재대상 : 하둡, HBase, 레디스 대용량 데이터 : 플럼 => 하둡 실시간 데이터 : 분석 결과에 따라 Hbase, 레디스 처리/탐색 레이어 => 분석/응용 레이어 하둡 데이터 => 하이브 => 정제/변형/분리/탐색 작업.. 가상머신 설치, 설정과 Poderosa 연결 1. 가상머신 환경 구성을 위한 CentOS Download https://mirror.nsc.liu.se/centos-store/6.7/isos/x86_64/ Index of /centos-store/6.7/isos/x86_64/ mirror.nsc.liu.se 2. 버추얼 박스 다운로드 1) 자신에게 맞는 운영체제와 버전을 고려하여 다운로드 2) 수업에서는 5.2 윈도우 사용 https://www.virtualbox.org/wiki/Download_Old_Builds Download_Old_Builds – Oracle VM VirtualBox www.virtualbox.org 3. 리눅스 설치 1) 가상머신에 리눅스를 설치 2) 부팅 설정 변경 - 명령 프롬프트 1] vi /etc/inittab 2].. 이전 1 다음