서평

[나는 리뷰어다] 파이썬 라이브러리를 활용한 데이터 분석 (3판)

작삼심일 2023. 5. 24. 05:35
"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

파이썬 라이브러리를 활용한 데이터 분석

현대 사회에서 데이터 분석은 빼놓을 수 없다. 일상생활에서도 같은 물건을 구매하기 위해서 수많은 오픈 마켓을 돌아다니거나, 주식 차트를 보며 기영이를 찾는 과정 등 많은 활동들이 데이터 분석 과정 들이다. 물론 본격적인 데이터 분석은 눈으로 훑어보는 수준을 넘어서 아주 많은 정보들을 통해 합리적인 판단을 내릴 수 있도록 정제하고 종합하는 과정이다.

기영이 차트

간단한 데이터들은 메모장에 정리할 수 도 있지만, 복잡하거나 아주 많은 양의 데이터를 손쉽게 다루기 위해서는 도구가 필요하다. 데이터 분석을 위한 도구들은 다양하게 존재하는데 대표적으로는 프로그래밍 언어인 파이썬과 R이 많이 사용되고, 상용 프로그램으로는 엑셀 등 이 있다. 이 중에서 파이썬의 경우 공학적인 계산이나 앱, 웹, 그리고 게임 개발에도 사용되고, 딥러닝 분야에서도 핵심이 되는 언어이다.

"파이썬 라이브러리를 활용한 데이터 분석"은 파이썬에서 데이터 분석을 위한 핵심 라이브러리에 대해 알려준다. 파이썬은 다른 사람이 만들어 놓은 코드를 보다 손쉽게 가져다 쓸 수 있어 엄청 다양한 오픈소스들이 존재한다. 그중에서 데이터 분석으로 사용되는 것들이 바로 NumPy, Pandas, Matplotlib 등이 있다. 물론 이 외에도 데이터 분석에 사용할만한 다양한 라이브러리가 있지만, 가장 토대가 되고 사용자가 많은 라이브러리는 앞서 말한 세 가지이다. 각각의 라이브러리들은 아래와 같은 특징을 갖고 있다.

  • NumPy: 행렬 연산을 다루기 위한 라이브러리, 내부적으론 저수준 언어로 구현되어 있어 속도가 빠름
  • Pandas: 대용량의 데이터를 다루기 위한 라이브러리
  • Matplotlib: 데이터 시각화를 위한 라이브러리

내가 하고 있는 일이 데이터 분석을 메인으로 하지는 않지만, 아주 많은 순간에 데이터를 보고 정제하고 시각화를 해야 한다. 이를 위해서 종종 파이썬을 활용하고는 있지만 필요할 때마다 검색을 통해 알게된 얕은 지식만 있었다. 이 책을 통해서 데이터 분석의 중심이 되는 라이브러리들에 대해 핵심을 파악할 수 있었다.

데이터 분석이라는 것이 필요하지만, 본격적으로 학습하기에는 부담스러운 경우 이 책을 통해서 기초적인 활용법을 통해 데이터 분석에 입문해보는 것도 아주 좋을 것 같다.

 

728x90
반응형