본문 바로가기

Programming & Machine Learning/R X 머신러닝13

R을 이용한 통계분석 - 3 (R을 이용한 데이터 조작 및 가설검정 방법) 1. 데이터 조작 1.1 데이터 생성 및 저장 # write data file write.xlsx(iris, 'iris.csv') methods(plot) # check methods a1 = iris a2 = cars save(a1, a2, file = 'a.rdata') # rdata save and load load('a.rdata') 1.2 데이터 manipulation x1 = matrix(1:15, nrow=5) x2 = matrix(1:15, nrow=5, byrow = T) rbind(x1,x2) # bind row data x3 = c(1,3) # concatenate vector data for(i in 1:10){ x3 = c(x3, i) } x4 = c(1,2,3) x5 = c(5,.. 2017. 7. 5.
R을 이용한 통계분석 - 2 (Textmining 에서의 데이터 전처리 & 종류별 데이터 import방법) 1. 비정형 데이터 처리 R 패키지 참고 : http://r4pda.co.kr/ 텍스트와 음성, 이미지는 비정형 데이터라고 할 수 있다. 최근 머신러닝 분야에서 가장 활발하게 연구 및 개발이 이루어지고 있는 것들이 바로 이 비정형 데이터라고 할 수 있다. 비정형 데이터를 이용하여 인사이트를 도출하는 것이 데이터 분석 / 머신 러닝 분야의 가장 큰 화두인듯 하다. 1.1 텍스트 처리 : KoNLP를 이용 텍스트마이닝 전처리 과정 텍스트를 분석에 용이한 형태로 전처리 하기 위해서는, 가장 먼저 사전작업이 필요하다. 여기서 사전은 Dictionary를 의미한다. R Studio에서는 사전을 메모리상에 올린 뒤, MergeUserDic(discrete 되었다.) 으로 사전을 구성한다. 다음으로 텍스트를 pre-.. 2017. 7. 5.
R을 이용한 통계분석 - 1 (기본 통계분석 실습과 rJava 환경설정 Window + Mac OS) 1. 개발환경 구축 1.1 기본 설치 : Java 최신버전과 R, Rstudio 설치. 참고 : R 패키지 리스트 (https://cran.r-project.org/ - package) cmd, terminal 에서 javac 명령어로 자바 설치 및 path 확인 1.2 javac 명령어가 안될때 / 설정법 (윈도우 7 기준) JAVA_HOME 이라는 변수를 추가하고, JAVA_HOME에는 java sdk 설치 경로를 입력한다. 시스템 변수 path에 JAVA_HOME을 추가하고, bin을 하위 디렉토리로 가리킨다. (;%JAVA_HOME%\bin) 다음처럼 되었으면 성공. 1.3 Mac OS에서 rJava 연동하기 맥 환경에서 R, R Studio 설치는 동일하다. sudo R CMD javarecon.. 2017. 7. 3.