데이터 형태 분류 ( 정형, 반정형, 비정형 )
·
자격증/ADsP
정형 데이터 : 고정된 칼럼에 저장되는 데이터와 파일. 스키마 구조를 가지고 있기 때문에 데이터를 탐색하는 과정이 테이블 검색, 컬럼 구조 검색, 로우 탐색 순으로 정형화 돼 있다. 비정형 데이터와 가장 큰 차이점은 데이터의 스키마를 지원한다는 점이다. ** 스키마 : 데이터베이스의 구조와 제약조건에 관해 전반적인 명세를 기술한 것 EX) 스프레드 시트, RDBMS의 테이블 반정형 데이터 : 데이터 내부에 정형 데이터의 스키마에 해당 되는 메타데이터를 갖고 있으며, 일반적으로 파일 형태로 저장된다. 풀어 이야기 하면 반정형 데이터 + 메타 데이터 = 진짜 데이터이다. 데이터 내부에 있는 규칙성을 파악해 데이터를 파싱할 수 있는 파싱 규칙을 적용한다. ** 메타 데이터 : 다른 데이터를 설명 해주는 데이터..
분석 주제 유형( 최적화, 솔루션, 인사이트, 발견 )
·
자격증/ADsP
Optimization : 분석 대상 및 분석 방법을 이해하고 현 문제를 최적화의 형태로 수행 Solution : 분석 과제는 수행되고, 분석 방법을 알지 못하는 경우 솔루션을 찾는 방식으로 과제 수행 Insight : 분석 대상이 불분명하고, 분석 방법을 알고 있는 경우 인사이트 제출 Discovery : 분석 대상, 방법을 모른다면 발견을 통해 분석 대상 자체를 새롭게 도출
비지니스 모델 - 빅데이터 활용 테크닉
·
자격증/ADsP
연관규칙학습(Association rule learning) : 어떤 변수간에 주목할 만한 상관관계가 있는지 찾아내는 방법 EX) 마트에서 상관관계가 높은 상품을 함께 진열 - 기저귀와 분유 유형 분석(Classification tree Analysis) : 사용자가 어떤 특성을 가진 집단에 속하는지 등의 문제를 해결할 때 EX) MBTI 특성에 따라 수강생을 분류 유전 알고리즘(Genetic algorithms) : 최적화의 매커니즘을 찾는 것. 최대의 시청률을 얻을려면 어떤 방송을 어떤 시간에 해야하는가와 같은 문제를 해결 할 때 사용. EX) 자동차 출력을 좋게하려면 어떤 부품을 어디에 설치해야하는가 기계학습(Machine learnign) : 기존의 시청기록을 바탕으로 "시청자가 현재 보유한 영화..
HTTP Version
·
네트워크
HTTP Version은 4가지로 나눠집니다. HTTP 0.9 HTTP 1.0 HTTP 1.1 HTTP 2.0 0.9 버전은 현재 거의 사용하지 않습니다. 현재 가장 많이 사용하고 있는 Version은 HTTP 1.1입니다. 1.0과 1.1 사이에는 많은 차이가 있지만 , 1.0에 중요 부분들이 1.1에도 포함 돼 있습니다. HTTP 1.1 주요 기능 Pesistent Connections(multiple Requests-Response pairs in a single TCP Connection) 1.0에서 Keep - Alive Header를 지원하지만 1.1 Vesion에서는 Default 값으로 지정돼 있습니다. Caching 1.0에서는 Expire Header 를 사용하여 시간 동기화가 제대로 ..