OLAP: 다차원의 데이터를 대화식으로 분석하기 위한 소프트웨어
BI(Business Intelligence): 경영 의사결정을 위한 통계적으로 수하적인 분석에 추점을 둔 기법
BA(Business Analytics): 데이터 기반 의사결정을 지원하기 위한 리포트 중심의 도구
Data Mining: 대용량 데이터로부터 의미 있는 관계, 규칙, 패턴을 찾는 과정
데이터 사이언스는..
- 데이터로부터 의미 있는 정보를 추출해내는 학문이다.
- 정형 또는 비정형을 막론하고 다양한 유형의 데이터를 대상으로 한다
- 기존의 통계학과 다른 점은 총체적 접근법을 사용한다는 점이다.
데이터웨어하우스의 고유특성: 데이터의 시계열성(문제출제)
데이터 웨어하우스의 특징
- 주제지향적: 정보를 특정한 주제에 맞게(고객, 창구, 상품 등) 분류, 가공하여 구조화 한다.
- 통합적
- 시계열성
- 비소멸성
하둡(Hadoop): 대용량 분산 처리 기술
데이터와 정보의 관계
지식 피라미드
지혜: a기업의 다른 상품들도 b기업보다 저렴할 것으로 판단했다.->원리를 이해하고 도출되는 아이디어
지식: 상대적으로 저렴한 a회사에서 물건을 사야겠다.->예측한 결과물
정보: a기업의 물건이 더 가격이 저렴하다->패턴을 인식하고 의미 부여
데이터: a기업은 책 값이 1000원, b기업은 2000원에 판매한다->가공 전 순수한 수치나 기호를 의미
데이터분석기획
최적화: 분석방법 및 분석 대상 모두 알고 있다.
통찰: 분석방법은 알고 있지만, 분석대상은 모르고 있다.
솔루션: 분석방법은 모르고 있지만 분석대상은 알고 있다.
발견: 분석 방법 및 분석대상 모두 모르고 있다.
분석비용 및 예산은 분석 거버넌스 체계의 고려 사항에 해당되지 않는다.
분산형 분석 조직구조: 분석 결과에 대한 신속한 실행이 가능하다.
집중형 분석 조직 구조:
- 전사 분석 업무를 별도로 독립된 분석 전담조직에서 담당한다
- 전략적 중요도에 따라 분석 조직이 우선순위를 정하여 추진 가능하다
- 현업 업무부서의 분석업무와 이중화 또는 이원화 될 가능성이 높다
데이터 분석
reshape 패키지는 자료의 구조를 유연하게 재구성하는 함수들을 제공한다.