728x90
반응형

R은 기본적으로 스칼라(Scalar), 벡터(Vector), 리스트(List), 행렬(Matrix), 배열(Array), 데이터 프레임(Data Frame)으로 총 6개의 데이터 타입을 가지고 있다.

물론 이 외에도 다른 라이브러리에서 제공하는 tibble, fread등 다양한 형태가 있지만, 이는 특수한 상황에서 쓰이거나 추후 해당 데이터 타입을 다루는 라이브러리를 학습하면서, 다시 다루게 될 것이므로, 거기까지 생각하진 말도록 하자.

R을 능숙하게 쓰기 위해선 각각의 데이터 타입이 갖는 특징을 이해하고 있어야하며, 특히 Indexing을 이용한, 내가 원하는 데이터만 골라서 가져오기는 Data Handling(데이터 전처리)에서 가장 기본이 되는 부분이다.

 

 

1. 변수(Variable)

데이터 타입 하나하나에 대해 알아보기 전에 변수(Variable)에 대해 알아보자.

변수란 무엇일까?

한국 위키피디아에서 변수는 다음과 같게 설명하고 있다.

  • 변수(變數, variable)는 수학에서 쓰이는 수식에 따라서 변하는 값을 뜻한다.
  • 변수(variable)는 컴퓨터 프로그래밍에서 아직 알려지지 않거나 어느 정도까지만 알려져 있는 양이나 정보에 대한 상징적인 이름이다.

필자가 위 내용을 바탕으로 변수를 좀 더 쉽게 줄여 쓴다면

변수(Variable): "변하는 값으로 다양한 값을 지닐 수 있는 하나의 속성"이라 할 수 있다.
즉, 가변적인 값이 할당되고(변하는 값), 문자, 숫자와 같은 다양한 값이 주어지는 것이 바로 변수이다.

 

 

2. 변수 이름 규칙

R에서 변수 이름 명명 시, 다음과 같은 규칙을 다른다.

  • 알파벳, 숫자, "_"(Underscore), "."(Period)로 구성된다.
  • 첫 글자는 문자 또는 "."로 시작해야한다.
  • "."로 시작한다면 "." 뒤에는 숫자가 올 수 없다.(소수로 인식되므로)
  • 예약어(Reserved word)는 사용할 수 없다.
    (break, else, FALSE, for, function, if, in, Inf, NA, NaN, next, NULL, repeat, TRUE, while 등)
  • 단, T나 F 같은 TRUE와 FALSE로 초기화된 전역변수(Global variable)는 사용할 수 있다.

 

 

3. 변숫값 할당

  • "<-", "<<-", "=" 를 할당 연산자로 사용할 수 있다.
  • "<-"는 어느 곳에서나 쓸 수 있는 반면에, "<<-"는 명령의 최상위 수준에서만 사용할 수 있다.
  • 함수 호출과 동시에 변수에 값을 할당하는 목적으로는 "<-"만 사용할 수 있다.
  • "<-"의 단축키는 "art" + "-"이다. 매우 자주 활용하는 단축키이므로 잊지말도록 하자.

 

 

다음 포스트에선 데이터 타입의 하나인 스칼라(Scalar)에 대해 알아보도록 하자.

728x90
반응형

'R > Basic' 카테고리의 다른 글

R(기초) 연산자와 변수 타입  (0) 2020.06.18
R(기초) 데이터 타입: 벡터(Vector)(2부)  (0) 2020.06.18
R(기초) 데이터 타입: 벡터(Vector)(1부)  (0) 2020.06.18
R(기초) 데이터 타입: 스칼라 (Scalar)  (0) 2020.06.18
R이란?  (0) 2020.06.16

+ Recent posts