상세 컨텐츠

본문 제목

R의 기본형과 자료 구조 1

R

by 견오수 2021. 9. 16. 13:57

본문

728x90

code : https://github.com/kyeonminsu/R-Study/tree/main/1.%EA%B8%B0%EB%B3%B8%20%EB%AC%B8%EB%B2%95

 

1. 변수만들기 

 

변수를 만들 때는 왼쪽을 향한 기호 <- 또는 ->를 사용한다.

 

 

여러 값으로 구성된 변수는 c()함수와 seq()함수로 만들 수 있다.

 

따옴표(“)를 사용하여 문자로 된 변수도 만들 수 있다.

 

2. Data Type

 

기본 데이터 타입

 

  • 수치형(Numeric) : 숫자로 되어 있으며, 정수형과 실수형을 의미한다. L 기호를 이용하면 정수형, 그렇지않으면 실수형으로 간주한다.
  • 문자형(character) : 하나의 문자 혹은 문자열로 되어 있으며 " " 혹은 ' '을 사용한다.
  • 논리형(logical) : 참과 거짓의 논리값으로 TRUE(T) 혹은 FALSE(F)로 표현된다.
  • 복소수형(complex) : 실수와 허수로 이루어진 복소수형태로 표현된다.

 

특수 데이터 타입

  • NULL : NULL은 그 자체가 객체이며 존재하지 않는 객체를 지정할 때 사용된다.
  • NA : Not Available의 약자로 결측치(missing value)를 의미한다.
  • NaN : Not available Number의 약자로 수학적으로 연산이 불가능한 수를 의미한다. ) sqrt(-3)
  • Inf : Infinite의 약자로 양의 무한대를 의미한다.
  • -Inf : 음의 무한대를 의미한다.

 

Data Type을 알려주는 함수는 mode()함수와 is로 시작하는 함수가 제공이 된다. mode()함수는 문자열 형태로 최종 결과를 알려주고 is계열의 함수는 TRUE 혹은 FALSE의 논리값으로 리턴된다.

 

mode()함수를 사용한 예제이다.

 

is() 함수를 사용한 예제이다.

 

RData Type의 우선순위가 존재한다. R에는 vector라는 자료구조가 존재한다. vector는 여러개의 데이터를 가질 수 있는 자료구조인데 하나의 Data Type만을 가질 수 있다. 따라서 vector를 만들 때 여러 Data Type을 이용해도 최종적으로는 하나의 Data Type으로 통일되며 우선순위에 의해서 최종 Data Type이 결정된다.

 

Data Type의 우선순위

 

  • 문자형(character) > 복소수형(complex) > 수치형(numeric) > 논리형(logical)

 

 

 

3. package함수

 

R에서 제공하는 package는 처리할 Data와 기능(function) 그리고 알고리즘이 하나의 꾸러미 형태로 제공된다. R 프로그래밍 실력은 얼마나 많은 package를 데이터 분석에 효과적으로 적용할 수 있는가의 능력에 따라 좌우된다고 할 수 있다.

 

RBase systemOther package로 구분할 수 있다. Base System은 우리가 설치한 R을 지칭한다. Base system에는 두가지 종류의 package가 존재하는데 Base packageRecommended package로 구분된다.

 

  • Base package는 설치가 필요없고 사용하기 위해서 불러오기(library())를 할 필요가 없다.
  • Recommended package는 설치가 필요없지만 사용하기 위해서는 불러오기를 해야 한다.
  • other package는 당연히 설치한 후에 불러오기를 해야 사용할 수 있다.

 

package 설치

 

  • install.packages('패키지명')의 형태로 설치할 수 있다.
  • R을 설치하면 기본적으로 설치되는 package들은 설치과정없이 바로 사용할 수 있다,
  • installed.packages()를 사용하면 설치된 package를 확인할 수 있다.
  • .libPaths()를 사용하면 library 설치 경로를 확인할 수 있다.
  • library 설치 경로 변경하려면 .libPaths("C:/myLib") 처럼 이용하면 된다.

 

installed.packages(‘패키지명’)을 사용한 예이다.

 

 

RStduio package 메뉴에서 설치한 예이다.

 

 

package의 사용

 

  • library('패키지명')
  • require('패키지명')
  • library() 함수와 require() 함수의 차이점은 설치되어 있지 않은 경우에 library() 함수는 오류를 발생시키지만 require() 함수는 경고 메시지를 보여주는 차이가 있다.

 

package의 제거

 

  • remove.packages('패키지명')

R에서 시각화하는 packageggplot2를 사용한 예제이다.

 

R을 설치하면 기본적으로 몇개의 package가 같이 설치된다. 이러한 package안에 속한 함수는 별도의 설치과정없이 바로 사용할 수 있다. 하지만 이 수많은 함수를 모두 외워서 사용하는 것은 불가능하며, 따라서 함수 사용에 도움을 주는 몇가지 함수를 알아둬야 함수를 사용하기 편하다.

 

함수 도움말

 

  • help()를 이용하면 함수 도움말을 볼 수 있다.

 

함수 파라미터 확인

 

  • args() 함수는 특정 함수를 대상으로 사용 가능한 파라미터를 보여준다.

 

함수 사용 예제보기

 

example() 함수는 R에서 제공하는 기본 함수들을 사용하는 예제를 보여준다.

 

숫자를 다루는 함수 이용해보기

 

  • mean() 함수 : 평균을 구하는 함수
  • max() 함수 : 최댓값을 구하는 함수
  • min() 함수 : 최솟값을 구하는 함수

 

 

728x90

'R' 카테고리의 다른 글

R 기본 함수 정리 2  (0) 2021.09.17
R 기본 함수 정리 1  (0) 2021.09.17
R의 기본형과 자료 구조 2  (0) 2021.09.16
R소개 및 Rstudio 설치  (0) 2021.09.15

관련글 더보기

댓글 영역