반응형

R Programming 21

R을 활용한 텍스트마이닝

OverView회사에서 텍스트마이닝을 하고 있다.물론 노가다가 99.999%이긴 하다.텍스트마이닝을 R로 한번 시도해보자 란 생각을 했다.어떤 것으로 해볼까 찾다가 트위터로 텍스트마이닝이라는 내용을 보게 된다. 어? 트위터로 분석을 할 수 있었어????? 진짜 빅데이터네????그러자 바로 떠오르는 건.. 방탄소년단...내가 좋아하는 가수... 후훗... 방탄소년단 트위터 분석을 해봐야겠단 생각이 들었다. 요새 방탄소년단 트위터엔 어떤 내용이 있을까? 궁금궁금...... 아우...... 보기만 해도 흐뭇하구만....ㅋㅋㅋ Process1. 트위터 디벨로퍼에서 API키를 생성한다. 1) https://developer.twitter.com/en/apply-for-access -> Standards APIs ..

R Programming 2019.01.26

BostonHousing 자료 다중선형회귀

> install.packages("mlbench")trying URL 'https://cran.rstudio.com/bin/windows/contrib/3.2/mlbench_2.1-1.zip'Content type 'application/zip' length 1032213 bytes (1008 KB)downloaded 1008 KB package ‘mlbench’ successfully unpacked and MD5 sums checked The downloaded binary packages are inC:\Users\Administrator\AppData\Local\Temp\RtmpMvhAiU\downloaded_packages> library("mlbench")> data("BostonHousin..

제 2장 기술통계

> length(trees$Volume)[1] 31> mean(trees$Volume)[1] 30.17097> length(trees$Volume) #표본수[1] 31> mean(trees$Volume) #평균[1] 30.17097> var(trees$Volume) #분[1] 270.2028> sd(trees$Volume) #표준편[1] 16.43785> sd(trees$Volume)/sqrt(length(trees$Volume))[1] 2.952324> sd(trees$Volume) #표준편[1] 16.43785> sd(trees$Volume) #표준편차[1] 16.43785> sd(trees$Volume)/sqrt(length(trees$Volume)) #표준오차[1] 2.952324> sd(tree..

group_by ()

## 데이터를 조건에 맞게 그룹으로 분할 ddply(diamonds, .(cut), summarise, priceMean=mean(price))## diamond_df를 cut을 기준으로 그룹화 df=group_by(diamonds_df, cut) Source: local data frame [53,940 x 10] Groups: cut ## cut으로 그룹화 되어있는 것을 볼 수 있다.carat cut color clarity depth table price x y z 1 0.23 Ideal E SI2 61.5 55 326 3.95 3.98 2.43 2 0.21 Premium E SI1 59.8 61 326 3.89 3.84 2.31 3 0.23 Good E VS1 56.9 65 327 4.05 4.0..

반응형