수원대학교 2015년 통계학 개론 수강생을 위한 초간단 R

R을 다운로드 받는 가장 간단한 방법

구글(www.google.com)으로 가서 검색창에 R download라고 입력한다. Windows (base) installer를 찾아 설치하면 된다.

R을 실행하기

R은 R i386이나 R x64는 R 콘솔을 실행하는 간단한 그래픽유저인터페이스 도구이다. 실행 창을 통해 이들 프로그램을 찾아 실행한다.

벡터 데이터 입력하기

R의 가장 기본적인 자료형은 벡터이다.
다음과 같이 학생 성적을 나타내는 벡터가 있다고 하자.
10,20,30,40,50,60
이들 자료를 score라는 이름의 벡터로 저장하려면
score = c( 10,20,30,40,50,60 )
이라고 입력하면 된다. R의 콘솔화면을 보면

앞으로 설명을 위해 R의 명령어 앞에 R> 이라는 기호를 붙인다. 이는 콘솔 명령을 실행하는 것을 뜻한다.

벡터 자료를 보려면 score를 그냥 입력하고 엔터를 누른다.

괄호는 index function을 의미한다. 벡터 score의 첫 번째 원소, 즉 i=1인 경우는 score[1]이고, i=3, 즉 세 번째 원소는 score[3]이다. 1번부터 3번까지, 즉, 1,2,3은 간단하게 1:3이라고 표기한다.

표본 평균과 표본 표준편차 구하기

수업 시간에 배운 표본 평균과 표본 표준편차는 함수  mean()과 sd()로 구할 수 있다. 이들 함수는 벡터를 입력 받는다. 예를 들어
R> mean(score)
R> sd(score)

표준정규분포의 probability density function

표준정규분포는 Z~N(0,1)로 표현한다.
이때, Z가 2일 경우의 확률값, 즉 pdf는 dnorm()으로 계산한다.
R> dnorm(2)

표준정규분포의 cumulative PDF

누적확률의 경우의 함수는 pnorm()이다.
R> pnorm(2)
이 경우에 마이너스 무한대에서 2까지의 누적확률을 구한다.

Cumulative PDF의 역함수

p문자의 반대는 q이다. pnorm()의 역함수는 qnorm()이다. 즉, 어떤 확률값이 주어질 경우 Z의 값을 구하는 함수이다. 예를 들어 0.5라는 누적확률이 위치한 Z값을 구하려면
R> qnorm(0.5)




댓글

이 블로그의 인기 게시물

Bradley-Terry Model: paired comparison models

R에서 csv 파일 읽는 법

xlwings tutorial - 데이터 계산하여 붙여 넣기