728x90

안녕하십니까, 간토끼입니다.



드디어 첫 포스팅이네요. 감격스럽습니다.


먼저 앞으로 제 포스팅에 가장 메인이 될 R program에 대해서 다뤄보도록 하겠습니다.




먼저 R은 어떤 친구일까요?

R is a programming language and free software environment for statistical computing and graphics supported by the R Foundation for Statistical Computing.[6] The R language is widely used among statisticians and data miners for developing statistical software[7] and data analysis.[8] Polls, data mining surveys, and studies of scholarly literature databases show substantial increases in popularity;[9] as of February 2020, R ranks 13th in the TIOBE index, a measure of popularity of programming languages.[10]

 

R (programming language) - Wikipedia

R is a programming language and free software environment for statistical computing and graphics supported by the R Foundation for Statistical Computing.[6] The R language is widely used among statisticians and data miners for developing statistical softwa

en.wikipedia.org

위키피디아에서 가져와봤습니다. 대충 통계계산을 할 수 있는 대중적인 무료 프로그래밍 언어라는 거죠?


실제로 뭐 C, JAVA, Python 등 범용성 넓은 언어들과 다르게 R은 통계 연산에 특화되어 있습니다.
(사실 C나 JAVA나 잘 모릅니다....)



Python과 구별되는 R의 장점은 데이터프레임 형식을 기본적으로 제공한다는 거죠.

즉 엑셀같은 '스프레드형식'의 데이터를 사용하는 게 기본적으로 가능해요.

기본적으로 행과 열로 이루어진 데이터를 생각하면 이해가 편하겠죠?

Python은 데이터프레임 형식을 사용하려면 Pandas라는 별도의 라이브러리를 설치해서 사용해야 합니다.


이것만 해도 큰 강점이라고 할 수 있습니다. 뭐 파이썬은 나중에 다뤄보도록 하고요.


사실 R은 어쨌든 프로그래밍 랭귀지이기 때문에, 직접 프로그래밍을 해야만 원하는 결과를 추출할 수 있습니다.


그렇기에 약간의 진입 장벽이 있는 셈이죠. 물론 지금도 고생하지만 처음엔 저도 엄청 고생했습니다...


실제로 통계 프로그램은 R 말고도 누구나 아는 엑셀부터 SPSS, STATA, SAS 등 여러 전문적인 소프트웨어가 있습니다.


이러한 프로그램의 장점은 정말 편합니다. SAS는 조금 어려운데 나머진 쉬워요... 특히 SPSS는 진입장벽이 없는 수준입니다.


SPSS는 명령어도 따로 필요없이 버튼만 클릭하면 알아서 연산을 출력해주기 때문에, 개인적으로 위 프로그램 중 제일 쉬운 것 같아요.


다만 단점은 유료입니다. 그것도 꽤 비싸요. 저도 캠퍼스 라이센스로만 써봤는데, 개인적으로 구하려면 꽤나 비싼 돈을 지불해야 하는 것으로 알고 있습니다.


하지만 우린 일개 학부생이라 돈이 없겠죠? 그러니까 조금 어려워도 오픈 소스 프로그램을 사용합시다.
원래 아프니까 청춘이잖아요? 돈 없으면 고생해야죠~


자 그럼 이제 한번 설치해볼까요?


1. R project 사이트에 접속
www.r-project.org

 

R: The R Project for Statistical Computing

www.r-project.org

2. 좌측 Download 탭에 CRAN 클릭




3. Korea를 찾아 마음에 드는 아무 링크나 클릭

저는 서울시에서 구축한 R CRAN을 사용했군요.

국가별로 R을 다운 받을 수 있도록 미러링 사이트(?)를 구축해놓은 건데요.
그냥 아무거나 클릭하셔도 상관없습니다.




4. 본인 운영체제에 맞는 R Download 클릭 -> base에 있는 install R for the first time 클릭

90%는 윈도우 쓰시겠죠? ㅎㅎ

5. 나오는 순서대로 클릭~




6. 설치 완료 후 실행해봅시다.


사실 어차피 R 자체는 쓸 일이 없습니다. 보다시피 콘솔창(입력과 동시에 실행이 되는 창이라고 생각하면 됩니다)만 덩그러니 있거든요.

이래저래 인터페이스도 구리고 R 자체는 딱히 쓸 일이 없습니다.


그래서 우리는 무엇을 쓸 것이냐 하면, 바로 RStudio를 사용할 겁니다.


R언어를 기반으로 훨씬 편하게 쓸 수 있도록 만든 프로그램이라고 생각하시면 돼요. 인터페이스를 좋게 만들어줍니다.


그럼 다음 포스팅엔 RStudio 사용하는 방법을 알려드릴게요.



감사합니다.

잘 읽으셨다면 게시글 하단에 ♡(좋아요) 눌러주시면 감사하겠습니다 :)

(구독이면 더욱 좋고, 광고도 한번씩 눌러주시면 더더욱 좋습니다 ^_^)

 


- 간토끼(DataLabbit)

- University of Seoul

- Economics & Data Science

 

728x90

+ Recent posts