본문 바로가기
728x90
반응형

기타 교육/빅데이터_분석실무4

2주차- GoolgelMotionChart , 웹크롤링, ggplot2 GoogleMotionChart 웹 크롤링 데이터를 가져오는 단계 요청 - 추출 - 저장 반복 - 예외처리 - 최적화 rvest node , attr, text만 기억하면 된다. 1. html 문서데이터 가져오기 2. 필요한 노트 선택하기 3. 노드내에 text를 가져오기 변수값을 항상 초기화해줘야한다. ggplot2 brand year sales 를 축에 넣어주고 boxplot눌리면 차트 선택 할 수 있다. Rstudio로코드 가져와진다. insert code in script 눌리면 2020. 9. 26.
2주차 - leaflet 을 활용한 지도자료분석 및 Google Motion Leaflet 라이브러리를 이용해서 지도분석 필수로 library(leaflet) 및 library(dplyr) 필수로 실행하고 밑에 자료를 입력한다. 라이브러리 설치. 파이프라인 연산자 사용하려면 dplyr를 무조건 설치해야한다. ctrl +shift +m 파이프라인 단축키 중간 값을 넣어줘야 가운데서 볼 수 있다. 팝업확인 Txt파일이더라도 , , , 이루어지면 csv파일로 읽어 올 수 있다. Google Motion Chart 클릭하면 모션이 움직이고, Sales 부분을 원하는 형식으로 바꾸면 원하는 데이터가 출력된다. 아래와 같이 바꿀 수 있다. 2020. 9. 26.
1주차 - 함수 및 단어 추출 및 출력 Matrix nrow로 행 갯수를 지정 할 수 있다. c(행,열)로 구성한다. 행은 다나오고 1,3열 출력 ' , ' 로 출력한다. 반대로 출력하는 방법. grep함수 결과 값을 출력하고 싶으면 value =T 를 쓴다. 숫자로 시작하는 것을 찾는 식 숫자로 시작하지 않는것 출력하는법. paste함수 묶어주는 함수(풀친하다고 생각해라.) 공백을 없애주는 방법. 가운데 '-'넣어주는 방법. paste00 함수는 알아서 값을 붙여준다. a와A를 가진 값을 출력. 실제로는 이렇게 많이 안쓰고 아래와 같이 쓴다. nchar 함수 : 문자길이를 알려주는 함수. substr은 위치를 출력해주는 함수(헷갈리지 말자.) strsplit 분리해주는 함수 ,뒤의 기준으로 stringr패키지 주요함수 str replace:.. 2020. 9. 19.
1주차 - 기본 설치 및 실행, 함수 설치 www.r-project.org/healthstat.snu.ac.kr/CRAN/ 설치 시 관리자 권한으로 실행해주는 것이 좋다. 32-bit 와 64bit를 두개 다 체크하면 충돌 가능성이 높다. 계속 다음 JAVA설치(*자바설치이유: 한글 데이터 수집을 위해) www.java.com/ko/download/manual.jsp KoNLP 라이브러리 수정 R프로그램 관리자 권한 실행으로 바꿔주기(항상) 스크립트를 드래그 후 ctrl + r 을 눌러줘서 실행한다. 실행결과 나머지 밑에 적혀 있는 모든 패키지를 다 설치해야한다.(KoNLP_설치_소스)파일의 내용 모두. 대표적인 한글 추출 예시 useSejongDic()을 써야하며, 단어가 사전 안 에 있어야 한다. (*자세한 사용하는 방식은 KoLNP i.. 2020. 9. 18.
728x90
반응형