4. 빅데이터 수집 개요
빅데이터 프로젝트는 크게 수집, 적재, 처리/탐색, 분석.응용으로 크게 4단계로 구성이 되어있다. 첫 번째인 수집 단계입니다. 빅데이터는 크게 내부 데이터와 외부 데이터로 나누어진다. ※내부 데이터 빅데이터 시대 이전에는 주로 내부 데이터를 주로 활용하였다. 특징은 정형 데이터이며, RDBMS에서 주로 사용하였다. 종류에는 기업의 조직에 담긴 데이터 즉, 고객정보, 거래정보, 상품/서비스 정보 등이 있다. ※외부 데이터 특징은 비정형 데이터이며, 스키마가 없는 구조이다. 비정형은 크게 반정형 데이터(CSV 형태), 완전형 비정형 데이터(SNS, 포털 블로그)로 되어있다. 수집 대상을 선정을 하고 수집 계획을 수립을 후 수집 실행을 한다. 수집 정의서/계획서 기반으로 개발을 진행을 하기 때문에 매우 중요하..
Hadoop
2021. 9. 13. 11:16