본문 바로가기
자격증/ADsP

KDD 분석 방법론

by Royal! 2023. 2. 15.
728x90
반응형

KDD(Knowledge Discovery in Database) 1996년 Fayyad가 정리한 데이터 마이닝 프로세스로서 데이터베이스에서 의미 있는 지식을 탐색하는 데이터마이닝, 기계학습, 패턴인식, 데이터 시각화 등에서 응용될 수 있는 구조

 

절차 

프로세스 순서 단계 내용
1 데이터셋 선택 분석 대상의 비지니스 도메인에 대한 이해와 프로젝트 목표 설정
데이터 전처리(Preprocessing) 분석 데이터셋에 포함되어 있는 잡음(noise), 이상값(outlier), 결측치(missing value)를 식별하고 필요시 제거
3 데이터 변환(Transformation) 분석 목적에 맞는 변수를 선택하거나 데이터의 차원을 축소하여 데이터 마이닝을 효율적으로 적용할 수 있도록 데이터셋 변경
4 데이터 마이닝(Data Mining) 변환된 데이터셋을 이용하여 분석 목적에 맞는 데이터 마이닝 기법을 선택하고, 데이터 마이닝 알고리즘을 선택하여 데이터의 패턴을 찾거나 데이터를 분류 또는 예측 등의 마이닝 작업을 시행
5 데이터 마이닝 결과평과 분석 결과에 대한 해석과 평가 그리고 활용

 

** 데이터 마이닝이란 ? 

- 많은 데이터 가운데 숨겨져 있는 유용한 상관관계를 발견하여, 미래에 실행 가능한 정보를 추출해 내고 의사 결정에 이용하는 과정을 말한다

728x90
반응형

최근댓글

최근글

Royal! © 2024