데이터 형태 분류 ( 정형, 반정형, 비정형 )

2023. 2. 14. 13:02·자격증/ADsP
728x90
반응형

정형 데이터 : 고정된 칼럼에 저장되는 데이터와 파일. 스키마 구조를 가지고 있기 때문에 데이터를 탐색하는 과정이 테이블 검색, 컬럼 구조 검색, 로우 탐색 순으로 정형화 돼 있다. 

 

비정형 데이터와 가장 큰 차이점은 데이터의 스키마를 지원한다는 점이다.

** 스키마 : 데이터베이스의 구조와 제약조건에 관해 전반적인 명세를 기술한 것

 

EX) 스프레드 시트, RDBMS의 테이블 

 

반정형 데이터  : 데이터 내부에 정형 데이터의 스키마에 해당 되는 메타데이터를 갖고 있으며, 일반적으로 파일 형태로 저장된다. 풀어 이야기 하면 반정형 데이터 + 메타 데이터 = 진짜 데이터이다. 데이터 내부에 있는 규칙성을 파악해 데이터를 파싱할 수 있는 파싱 규칙을 적용한다.

 

** 메타 데이터 : 다른 데이터를 설명 해주는 데이터. 

EX) URL 형태로 존재
       HTML, 오튼 API 형태로 제공 - XML, JSON

 

비정형 데이터 : 데이터 세트가 아닌 하나의 데이터가 수집 데이터로 객체화 돼 있다. 이미지, 동영상 같은 멀티미디어 데이터가 대표적인 비정형 데이터이다.

 

EX) 소셜 데이터의 텍스트, 동영상, 이미지

 

정리하자면 정형/반정형 데이터는 스키마를 보유해서 Ctrl + F(찾기) 해서 데이터를 찾을 수 있다고 생각하면 되는데,

비정형 데이터는 스키마가 없어서 Ctrl + F(찾기) 가 안 된다고 생각하면 이해하기 편하다.

728x90
반응형

'자격증 > ADsP' 카테고리의 다른 글

CRISP-DM 분석 방법론  (0) 2023.02.15
KDD 분석 방법론  (0) 2023.02.15
분석 주제 유형( 최적화, 솔루션, 인사이트, 발견 )  (0) 2023.02.14
비지니스 모델 - 빅데이터 활용 테크닉  (0) 2023.02.07
데이터의 가치와 미래(위기 요인과 통제 방안)  (0) 2021.08.13
'자격증/ADsP' 카테고리의 다른 글
  • CRISP-DM 분석 방법론
  • KDD 분석 방법론
  • 분석 주제 유형( 최적화, 솔루션, 인사이트, 발견 )
  • 비지니스 모델 - 빅데이터 활용 테크닉
Royal!
Royal!
Bachelor of Arts. Bachelor of Science in Engineering. Master of Science in Engineering (In Progress). Job Title: Infrastructure & Security & Cloud Engineer. Etc: Mentor at Fourth Industrial Revolution Center.
  • Royal!
    Security
    Royal!
  • 전체
    오늘
    어제
    • 분류 전체보기
      • 운영체제
      • 네트워크
      • 클라우드
      • 서버
      • Container
      • 프로그래밍
        • Python_혼자 끄적끄적
        • Python_AI(영상처리)
        • 빅데이터
        • C_정보올림피아드 Language_Coder
        • C_QnA
      • 자격증
        • 정보보안기사
        • 정보처리기사
        • ADsP
        • CPPG
        • 보안법률
        • NCA~NCP
        • AWS Certified Solutions Arc..
      • 리버싱
        • 리버싱 걸음마
      • Wargame & CTF
        • Hackerschool FTZ
      • 기타 교육
        • KISA 정보보호제품실습군
        • 빅데이터_분석실무
        • 시큐어코딩진단전문교육(호남정보보호센터)
        • SW테스트 전문가 과정(ISTQB CTFL자격)
        • 정보보호 컨설팅 전문가 양성과정
      • 기타
        • 면접일지
        • 기타
        • 인턴활동
        • 논문 요약
      • K-Shield Jr
        • 악성코드분석
        • 침해사고분석
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    euid란
    euid가 중요한 이유
    kernel 구성요소
    fragment-free
    rest api 제약조건
    스위치 프레임 포워딩 방식
    restful api 개념
    l2 스위치 프레임 전달 방식
    switch forwarding mode
    rest api 논문
    kernel모드
    304 code
    nce dump
    상태코드 304
    304코드
    rest api 공부
    getuid()
    네이버클라우드 ftp 설정
    geteuid
    rest api 아키텍처
    redirect 304
    nce덤프
    swtich frame
    rest api 문법
    kernel 사용자 모드
    스위치 프레임 동작 방식
    uid란
    getuid
    geteuid()
    rest api 정리
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
Royal!
데이터 형태 분류 ( 정형, 반정형, 비정형 )
상단으로

티스토리툴바