반응형

평균을 얻어내는데 벡터로 저장한다.

이때 na는 NA를 의미하고 rm은 remove를 의미한다. 따라서 NA로 기록된 값들을 지움으로써 추후 총합 / 개수에서 개수에 영향을 주지 않게 한다.

> sapply(mtcars, mean, na.rm=TRUE)

       mpg        cyl       disp         hp       drat         wt 

 20.090625   6.187500 230.721875 146.687500   3.596563   3.217250 

      qsec         vs         am       gear       carb 

 17.848750   0.437500   0.406250   3.687500   2.812500 


평균을 얻어내는데 벡터로 저장한다.

na.rm은 TRUE가 베이스가 되며 현재 mtcars에는 NA가 없기에 무시된다.


> sapply(mtcars, mean)

       mpg        cyl       disp         hp       drat         wt 

 20.090625   6.187500 230.721875 146.687500   3.596563   3.217250 

      qsec         vs         am       gear       carb 

 17.848750   0.437500   0.406250   3.687500   2.812500 



summary를 이용하면 다양한 수학적 정보 확인 가능


> summary(mtcars)

      mpg             cyl             disp             hp       

 Min.   :10.40   Min.   :4.000   Min.   : 71.1   Min.   : 52.0  

 1st Qu.:15.43   1st Qu.:4.000   1st Qu.:120.8   1st Qu.: 96.5  

 Median :19.20   Median :6.000   Median :196.3   Median :123.0  

 Mean   :20.09   Mean   :6.188   Mean   :230.7   Mean   :146.7  

 3rd Qu.:22.80   3rd Qu.:8.000   3rd Qu.:326.0   3rd Qu.:180.0  

 Max.   :33.90   Max.   :8.000   Max.   :472.0   Max.   :335.0  

      drat             wt             qsec             vs        

 Min.   :2.760   Min.   :1.513   Min.   :14.50   Min.   :0.0000  

 1st Qu.:3.080   1st Qu.:2.581   1st Qu.:16.89   1st Qu.:0.0000  

 Median :3.695   Median :3.325   Median :17.71   Median :0.0000  

 Mean   :3.597   Mean   :3.217   Mean   :17.85   Mean   :0.4375  

 3rd Qu.:3.920   3rd Qu.:3.610   3rd Qu.:18.90   3rd Qu.:1.0000  

 Max.   :4.930   Max.   :5.424   Max.   :22.90   Max.   :1.0000  

       am              gear            carb      

 Min.   :0.0000   Min.   :3.000   Min.   :1.000  

 1st Qu.:0.0000   1st Qu.:3.000   1st Qu.:2.000  

 Median :0.0000   Median :4.000   Median :2.000  

 Mean   :0.4062   Mean   :3.688   Mean   :2.812  

 3rd Qu.:1.0000   3rd Qu.:4.000   3rd Qu.:4.000  

 Max.   :1.0000   Max.   :5.000   Max.   :8.000  



표준편차 계산

> sapply(mtcars, sd)

        mpg         cyl        disp          hp        drat 

  6.0269481   1.7859216 123.9386938  68.5628685   0.5346787 

         wt        qsec          vs          am        gear 

  0.9784574   1.7869432   0.5040161   0.4989909   0.7378041 

       carb 

  1.6152000 


분산 계산

> sapply(mtcars, var)

         mpg          cyl         disp           hp         drat 

3.632410e+01 3.189516e+00 1.536080e+04 4.700867e+03 2.858814e-01 

          wt         qsec           vs           am         gear 

9.573790e-01 3.193166e+00 2.540323e-01 2.489919e-01 5.443548e-01 

        carb 

2.608871e+00 



히스토그램을 표현한다.

> hist(mtcars$mpg)


freq = FALSE # area = 1이 들어가게 되면 

> hist(mtcars$mpg, freq = FALSE) # area = 1



d에 mtcars의 밀도를 저장해주고

> d <- density(mtcars$mpg) # returns the density data


d를 콜해보면 다음과 같이 나타난다.

> d


Call:

density.default(x = mtcars$mpg)


Data: mtcars$mpg (32 obs.); Bandwidth 'bw' = 2.477


       x               y            

 Min.   : 2.97   Min.   :6.481e-05  

 1st Qu.:12.56   1st Qu.:5.461e-03  

 Median :22.15   Median :1.926e-02  

 Mean   :22.15   Mean   :2.604e-02  

 3rd Qu.:31.74   3rd Qu.:4.530e-02  

 Max.   :41.33   Max.   :6.795e-02  


plot에 의해 플로우 차트로 만들어내고

> plot(d) # plots the results


polygon으로 색은 빨강, 경계선은 파란색으로 플로우차트를 채울 수 있게 된다.

> polygon(d, col="red", border="blue") # fill




히스토그램도 이러한 방법으로 색을 채울 수 있게 된다.


hist(AirPassengers,main="Histogram for Air Passengers",xlab="Passengers",border="blue", col="green",xlim=c(100,700),las=1,breaks=5)




반응형