최근 IT 뿐만 아니라 거의 모든 사업 분야에서 트렌드로 대두되고 있는 빅 데이터에 대한 정의 및 필요성에 대해 학습하고 빅 데이터를 활용하기 위해 꼭 필요한 플랫폼인 하둡 분산 파일 시스템을 실제로 구축해 보며 파일의 입출력의 원리를 생각해 봅니다. 또한, 하둡 파일시스템으로 파일을 이동하거나 로그 수집 등을 위해 사용되는 하둡 생태계의 이해를 돕습니다. 그리고 빅 데이터를 분석하기 위한 방법으로 R 언어를 제시하고 있습니다. R 언어를 이용하여 샘플 데이터를 가지고 데이터 분석을 해 봄으로써 빅 데이터를 어떻게 분석하고 활용할 수 있는지 생각해 볼 수 있습니다.
* 기대 효과
?빅 데이터의 정의를 이해할 수 있습니다. ?빅 데이터 플랫폼인 하둡 파일시스템을 구축할 수 있습니다. ?R을 이용한 빅 데이터 분석을 할 수 있습니다. ?Map Reduce의 동작 원리를 이해할 수 있습니다. ?하둡 생태계를 이해할 수 있습니다.
* 과정의 특징
?시스템 관리자가 하둡 시스템 구축 시 필요한 지식과 실습이 준비되어 있습니다. ?하둡 생태계에 대해 관심이 있는 시스템 관리자 또는 관련 업무 종사자들이 이론적인 지식을 습득하고 이와 관련 있는 실습을 해 볼 수 있습니다. ?데이터 분석에 대해 관심이 있는 입문자에게 마이닝에 대한 기초를 다져 줄 수 있습니다. ?빅 데이터에 관심이 있는 분들에게 다양한 사례를 통해 쉽게 이해할 수 있습니다.