Hadoop을 이용한 빅데이터 분석 입문 과정을 위한 다양한 샘플 소스 코드를 제공합니다.
본 강의는 하루에 약 6~7시간씩 총 2일에 걸쳐 진행됩니다. 강의 관련 문의: nextmining@gmail.com
- WordCount
- 부분 정렬(Partial Sort)
- 전체 정렬(Total Sort)
- 보조 정렬(Secondary Sort)
- 국립기후자료(NCDC)데이터 분석: 국립기후자료(NCDC)데이터에서 연도별/기상청별 최고기온을 분석
- 앱스토어 유저 리뷰 분석: LINE 아이폰 앱스토어에서 수집한 사용자 리뷰 데이터에서 평점(1,2,3,4,5)별로 많이 언급된 word 순으로 분석