728x90

안녕하십니까, 간토끼입니다.

한동안 포스팅을 미루고 미루다가 파이썬을 안한지 약 2년 반이 지나서 ... 기억도 되살릴겸 공부하는김에 파이썬을 기초부터 다뤄보고자 합니다.

728x90

 

사실 데이터 사이언스에서 프로그래밍을 할 때는 파이썬보다 R이 선호된다고 생각합니다.

왜냐하면 파이썬의 목적은 데이터 분석이나 모델링이 아니기 때문이죠.

그러나 R은 통계계산을 위해 설계된 프로그래밍 언어이기 때문에 자료구조 중 '데이터프레임'이란 형태가 기본적으로 지원이 됩니다.

그렇기에 파이썬과 R을 구별짓는 가장 큰 차이는 '데이터프레임'을 지원하냐, 지원하지 않냐로 갈린다고 생각합니다.

파이썬에서 데이터프레임을 사용하기 위해서는 Pandas라는 별도의 라이브러리를 사용해야만 데이터프레임을 사용할 수 있기 때문이죠.

 

그러나 머신러닝, 딥러닝이 각광받기 시작하면서 파이썬의 비중이 꽤나 높아졌습니다.

객체지향 프로그래밍 언어인 만큼, 다른 프로그래밍 언어에 비해 유연하게 쓰일 수 있는 부분도 많고,

유저들이 많다보니 다른 애플리케이션에도 적용할 수 있는 범용성도 매우 좋아졌으며,

Pandas, Numpy, Scikit-learn, Tensorflow 등 데이터 사이언스에서 쓸 수 있는 라이브러리도 잘 갖춰져 있기 때문에 확장성만 놓고 본다면 R에 비해 좋은 점은 분명하다고 할 수 있겠네요.

 

물론 둘 중 하나라도 잘하면야 문제 없을 거고, 어떤 언어를 사용할지는 개인의 취향 차이겠지만

요즘 기업에서의 채용 공고를 보면 사기업은 확실히 Python을 잘하는 사람을 많이 우대하는 것 같습니다.

그래서 결국 Python에 입문하는 것은 선택이 아닌 ... 필수의 영역이란 생각이 많이 듭니다.

각설하고, 파이썬을 설치하는 것부터 시작해보죠.

1. Python (Anaconda) 설치

우리는 파이썬말고 파이썬을 포함한 다양한 툴을 이용할 수 있는 ANACONDA를 설치하겠습니다.기존에 R과 RStudio를 다뤘던 것처럼, 단순히 Python만 설치할 경우 IDE를 사용하지 않고 어떠한 분석이나 모델링을 하는 것이 참 어렵기 때문에 IDE를 활용할 수 있도록 ANACONDA를 설치합니다.https://www.anaconda.com/

 

Anaconda | The World’s Most Popular Data Science Platform

Anaconda is the birthplace of Python data science. We are a movement of data scientists, data-driven enterprises, and open source communities.

www.anaconda.com

 

아나콘다 홈페이지에 접속 후 다운로드를 클릭해 설치하시면 됩니다.

 

설치하고나면 Anaconda Navigotor라는 프로그램이 생성되는데요.

다양한 IDE가 있네요.

개인적으로는 JupyterLab을 추천합니다.

 

(1) Spyder

학부 4학년 1학기 머신러닝 수업을 들으며 코딩했던 흔적이 있네요.

몇년만에 켜보는 건데... 아무튼 이 IDE는 RStudio의 개발환경이 익숙한 분들에게 추천드립니다.

인터페이스가 매우 유사하고, 데이터 사이언스에 적합한 개발환경이라고 생각합니다.

 

(2) Jupyter Notebook

보시다시피 일반적으로 우리가 아는 인터페이스와 좀 상이한데요.

Jupyter Notebook의 장점은 파이썬 코드와 마크다운(Markdown)을 혼용할 수 있다는 것입니다.

마크다운은 위 이미지에서 중간중간 있는 텍스트를 말하는데요. 웹 상에서 서식이 있는 문서 작성 가능한 문법 체계 정도로 이해하시면 될 것 같습니다.

다음 포스팅에서 문법을 정리해볼게요.

그래서 이 마크다운은 내가 쓴 코드를 타인에게 공유할 때 용이하겠죠.

각 셀마다 주석 대신 마크다운으로 코드의 설명을 구체적으로 남긴다면 협업할 때 용이하지 않을까요?

 

(3) JupyterLab

JupyterLab은 Jupyter Notebook을 더 좋게 사용할 수 있는 도구입니다.

Jupyter Notebook의 후속작이라고 할 수 있는데요.

기존 Jupyter Notebook에서 지원하지 않았던 다양한 기능을 지원하는데,

저는 대표적으로 터미널을 웹상에서 유연하게 사용할 수 있는 게 제일 큰 차이점이라고 생각합니다.

보시다시피 여러 터미널을 화면 분할하여 볼 수 있게 만들어주거든요. 좋죠?

또 여러 장점이 있겠지만... 써보시면 뭔가 유연하다는 느낌이 있습니다. 더 이상의 차이점은 잘 모르겠네요.

그냥 체감상 좋습니다...

 

다음 포스팅부터는 파이썬의 기초 문법부터 전반적으로 개론 수준의 내용을 다뤄볼게요.

 

감사합니다.

잘 읽으셨다면 게시글 하단에 ♡(좋아요) 눌러주시면 감사하겠습니다 :)

(구독이면 더욱 좋습니다 ^_^)

 


- 간토끼(DataLabbit)

- University of Seoul

- Economics & Data Science

728x90

+ Recent posts