*수강대상 : 기업 내 정보화 및 IT 혁신사업 담당자 빅데이터 분석 및 마이닝 기술 습득이 필요한 업무담당자 현업에서 데이터 분석을 하고자 하는 재직자
*과정소개 : 빅데이터 분석 및 오픈소스 R의 이해 R 시각화의 이론과 실습 R 기반 데이터 분석 방법과 하둡 기반 병렬처리 실습 데이터 분석 과정 및 수행 방법 수립 R 기반의 시각화 실습 및 분석 모델링 실습 데이터 전처리와 R 기반 고급분석 및 평가
*교육내용 : 빅데이터 분석 개요 빅데이터 분석의 활용과 가치 데이터 사이언티스트의 역할 개별 영역에서의 빅데이터 활용 사례
오픈소스 통계분석 도구 R R의 소개 및 설치 R, 그리고 빅데이터 데이터 객체, 연산 및 조작 데이터 입출력, 제어구문 R 활용 및 시각화 함수 및 객체관리 다양한 데이터 소스 연계 유용한 패키지 소개 R Visualization 고전적인 데이터 분석 데이터 분석의 필요성 및 적용분야 데이터 분석에 필요한 통계학 리뷰 데이터 분석 Case Study 데이터 탐색 및 전처리 고급분석 방법론 회귀분석 - 연관분석/군집분석 의사결정나무 분석 고급과정(주성분분석, 요인분석 등) 소개 데이터 분석 실습 과정 빅데이터 분석 프로세스 실습 데이터 소개 및 스키마 가설 설정 및 비즈니스 모델 변수 도출 및 수행 방법 수립 데이터 분석 방법론 K Means Clustering / Association Rules Linear Regression / Logistic Regression Naive Bayesian Classifier / Decision Trees Time Series Analysis / 분석 모델 평가 실습 데이터 정제 및 전처리 하둡 기반 분석 플랫폼 이해 데이터 전처리 절차 수립 Hive를 활용한 데이터 전처리 Pig를 활용한 데이터 전처리 R 기반 데이터 분석 R을 활용한 고급분석 변수값 추출 및 검증 데이터 분석 과정 수행 결과 예측 및 모델 적용 데이터 분석 결과 평가 R을 활용한 분석 결과 시각화 최종 산출물에 대한 평가 빅데이터 분석 실무 응용 교육과정 Review