R Programming/R을 이용한 누구나 하는 통계분석

제 1장 시작하기

루치아 (Lucia) 2015. 7. 3. 01:29
반응형

> trees

   Girth Height Volume

1    8.3     70   10.3

2    8.6     65   10.3

3    8.8     63   10.2

4   10.5     72   16.4

5   10.7     81   18.8

6   10.8     83   19.7

7   11.0     66   15.6

8   11.0     75   18.2

9   11.1     80   22.6

10  11.2     75   19.9

11  11.3     79   24.2

12  11.4     76   21.0

13  11.4     76   21.4

14  11.7     69   21.3

15  12.0     75   19.1

16  12.9     74   22.2

17  12.9     85   33.8

18  13.3     86   27.4

19  13.7     71   25.7

20  13.8     64   24.9

21  14.0     78   34.5

22  14.2     80   31.7

23  14.5     74   36.3

24  16.0     72   38.3

25  16.3     77   42.6

26  17.3     81   55.4

27  17.5     82   55.7

28  17.9     80   58.3

29  18.0     80   51.5

30  18.0     80   51.0

31  20.6     87   77.0

> ?trees

> summary(trees)

     Girth           Height       Volume     

 Min.   : 8.30   Min.   :63   Min.   :10.20  

 1st Qu.:11.05   1st Qu.:72   1st Qu.:19.40  

 Median :12.90   Median :76   Median :24.20  

 Mean   :13.25   Mean   :76   Mean   :30.17  

 3rd Qu.:15.25   3rd Qu.:80   3rd Qu.:37.30  

 Max.   :20.60   Max.   :87   Max.   :77.00  

> boxplot(trees)


> pairs(trees)


> cars

   speed dist

1      4    2

2      4   10

3      7    4

4      7   22

5      8   16

6      9   10

7     10   18

8     10   26

9     10   34

10    11   17

11    11   28

12    12   14

13    12   20

14    12   24

15    12   28

16    13   26

17    13   34

18    13   34

19    13   46

20    14   26

21    14   36

22    14   60

23    14   80

24    15   20

25    15   26

26    15   54

27    16   32

28    16   40

29    17   32

30    17   40

31    17   50

32    18   42

33    18   56

34    18   76

35    18   84

36    19   36

37    19   46

38    19   68

39    20   32

40    20   48

41    20   52

42    20   56

43    20   64

44    22   66

45    23   54

46    24   70

47    24   92

48    24   93

49    24  120

50    25   85

> lm(dist~speed,data=cars)


Call:

lm(formula = dist ~ speed, data = cars)


Coefficients:

(Intercept)        speed  

    -17.579        3.932  


> boxplot(cars)

> plot(cars)

> plot(cars,type="l")

> plot(lm(cars)

+ plot(lm(cars))

Error: unexpected symbol in:

"plot(lm(cars)

plot"

> plot(cars)

> anova(lm(dist~speed,data=cars))

Analysis of Variance Table


Response: dist

          Df Sum Sq Mean Sq F value   Pr(>F)    

speed      1  21186 21185.5  89.567 1.49e-12 ***

Residuals 48  11354   236.5                     

---

Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

> chickwts

   weight      feed

1     179 horsebean

2     160 horsebean

3     136 horsebean

4     227 horsebean

5     217 horsebean

6     168 horsebean

7     108 horsebean

8     124 horsebean

9     143 horsebean

10    140 horsebean

11    309   linseed

12    229   linseed

13    181   linseed

14    141   linseed

15    260   linseed

16    203   linseed

17    148   linseed

18    169   linseed

19    213   linseed

20    257   linseed

21    244   linseed

22    271   linseed

23    243   soybean

24    230   soybean

25    248   soybean

26    327   soybean

27    329   soybean

28    250   soybean

29    193   soybean

30    271   soybean

31    316   soybean

32    267   soybean

33    199   soybean

34    171   soybean

35    158   soybean

36    248   soybean

37    423 sunflower

38    340 sunflower

39    392 sunflower

40    339 sunflower

41    341 sunflower

42    226 sunflower

43    320 sunflower

44    295 sunflower

45    334 sunflower

46    322 sunflower

47    297 sunflower

48    318 sunflower

49    325  meatmeal

50    257  meatmeal

51    303  meatmeal

52    315  meatmeal

53    380  meatmeal

54    153  meatmeal

55    263  meatmeal

56    242  meatmeal

57    206  meatmeal

58    344  meatmeal

59    258  meatmeal

60    368    casein

61    390    casein

62    379    casein

63    260    casein

64    404    casein

65    318    casein

66    352    casein

67    359    casein

68    216    casein

69    222    casein

70    283    casein

71    332    casein

> summary(chickwts)

     weight             feed   

 Min.   :108.0   casein   :12  

 1st Qu.:204.5   horsebean:10  

 Median :258.0   linseed  :12  

 Mean   :261.3   meatmeal :11  

 3rd Qu.:323.5   soybean  :14  

 Max.   :423.0   sunflower:12  

> boxplot(weight~feed,data=chickwts)


> anova(lm(weight~feed,data=chickwts))

Analysis of Variance Table


Response: weight

          Df Sum Sq Mean Sq F value    Pr(>F)    

feed       5 231129   46226  15.365 5.936e-10 ***

Residuals 65 195556    3009                      

---

Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

> mean(trees$Volume)

[1] 30.17097

> attach(trees)

> mean(Volume)

[1] 30.17097

> detach(Volume)

Error in detach(Volume) : 유효한 'name' 인자가 아닙니다

> detach(trees)

> with(trees,mean(Volume))

[1] 30.17097

> trees$Volume+trees$Girth+trees$Height

 [1]  88.6  83.9  82.0  98.9 110.5 113.5  92.6 104.2 113.7 106.1 114.5 108.4 108.8 102.0

[15] 106.1 109.1 131.7 126.7 110.4 102.7 126.5 125.9 124.8 126.3 135.9 153.7 155.2 156.2

[29] 149.5 149.0 184.6

> with(trees,Volume+Girth+Height)

 [1]  88.6  83.9  82.0  98.9 110.5 113.5  92.6 104.2 113.7 106.1 114.5 108.4 108.8 102.0

[15] 106.1 109.1 131.7 126.7 110.4 102.7 126.5 125.9 124.8 126.3 135.9 153.7 155.2 156.2

[29] 149.5 149.0 184.6

> setwd("C:/Data")


연습

> ex<-read.csv("ex")

Error in file(file, "rt") : cannot open the connection

In addition: Warning message:

In file(file, "rt") : cannot open file 'ex': No such file or directory

> ex<-read.csv("ex.csv")

> ex

  x    y

1 1 10.2

2 2  9.7

3 3  6.5

4 4  5.1

> ex<-data.frame(ex)

> plot(y~x,data=ex)



반응형