728x90
반응형
KDD(Knowledge Discovery in Database) 1996년 Fayyad가 정리한 데이터 마이닝 프로세스로서 데이터베이스에서 의미 있는 지식을 탐색하는 데이터마이닝, 기계학습, 패턴인식, 데이터 시각화 등에서 응용될 수 있는 구조
절차
프로세스 순서 | 단계 | 내용 |
1 | 데이터셋 선택 | 분석 대상의 비지니스 도메인에 대한 이해와 프로젝트 목표 설정 |
2 | 데이터 전처리(Preprocessing) | 분석 데이터셋에 포함되어 있는 잡음(noise), 이상값(outlier), 결측치(missing value)를 식별하고 필요시 제거 |
3 | 데이터 변환(Transformation) | 분석 목적에 맞는 변수를 선택하거나 데이터의 차원을 축소하여 데이터 마이닝을 효율적으로 적용할 수 있도록 데이터셋 변경 |
4 | 데이터 마이닝(Data Mining) | 변환된 데이터셋을 이용하여 분석 목적에 맞는 데이터 마이닝 기법을 선택하고, 데이터 마이닝 알고리즘을 선택하여 데이터의 패턴을 찾거나 데이터를 분류 또는 예측 등의 마이닝 작업을 시행 |
5 | 데이터 마이닝 결과평과 | 분석 결과에 대한 해석과 평가 그리고 활용 |
** 데이터 마이닝이란 ?
- 많은 데이터 가운데 숨겨져 있는 유용한 상관관계를 발견하여, 미래에 실행 가능한 정보를 추출해 내고 의사 결정에 이용하는 과정을 말한다
728x90
반응형
'자격증 > ADsP' 카테고리의 다른 글
빅데이터 분석 방법론 / 단계별 프로세스 (0) | 2023.02.16 |
---|---|
CRISP-DM 분석 방법론 (0) | 2023.02.15 |
데이터 형태 분류 ( 정형, 반정형, 비정형 ) (0) | 2023.02.14 |
분석 주제 유형( 최적화, 솔루션, 인사이트, 발견 ) (0) | 2023.02.14 |
비지니스 모델 - 빅데이터 활용 테크닉 (0) | 2023.02.07 |