Skip to content

nextmining/course-hadoop

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Hadoop을 이용한 빅데이터 분석 입문 과정

Hadoop을 이용한 빅데이터 분석 입문 과정을 위한 다양한 샘플 소스 코드를 제공합니다.

강의 구성

본 강의는 하루에 약 6~7시간씩 총 2일에 걸쳐 진행됩니다. 강의 관련 문의: nextmining@gmail.com

Get Started

  • WordCount

정렬(Sort)

  • 부분 정렬(Partial Sort)
  • 전체 정렬(Total Sort)
  • 보조 정렬(Secondary Sort)

Partitioner, Comparator, GroupComparator 사용법

조인(Join)

실습과제

  • 국립기후자료(NCDC)데이터 분석: 국립기후자료(NCDC)데이터에서 연도별/기상청별 최고기온을 분석
  • 앱스토어 유저 리뷰 분석: LINE 아이폰 앱스토어에서 수집한 사용자 리뷰 데이터에서 평점(1,2,3,4,5)별로 많이 언급된 word 순으로 분석

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Packages

No packages published