데이터 분석 3

[나는리뷰어다] 어쩌다 데이터 분석 with 파이썬

"한빛미디어 활동을 위해서 책을 제공받아 작성된 서평입니다." 지금 우리는 그야말로 데이터가 넘치는 시대에 살고 있다. 핸드폰이나 태블릿, 스마트 워치와 같은 전자기기들은 우리의 정보를 실시간으로 기록하고 있고, 인터넷은 우리가 선택한 모든 것을 '로그'로 수집하고 있다. 대체로 이런 데이터들은 매우 단순한 몇 가지 정보만 담고 있어 하나의 데이터는 전혀 가치가 없어 보인다. 하지만, 이런 기록들이 쌓여가기 시작해 통계적인 의미를 갖기 시작한다면 쓸모없어 보이던 데이터 저장소는 그야말로 금광이 되어 버린다. 최신 아이폰에선 실시간으로 관측되는 데이터를 통해 차량 사고를 감지하기도 하고, 수 많은 온라인 쇼핑몰은 몇 번 클릭을 하지도 않은 것 같은데 나의 취향에 맞는 수많은 상품들을 진열해 놓기도 한다. ..

서평 2022.10.28

SQL로 시작하는 데이터 분석 리뷰

"한빛미디어 활동을 위해서 책을 제공받아 작성된 서평입니다." 이번에 한빛미디어에서 진행하는 이벤트에서 제공받은 책은 입니다. 어떤 분야이더라도 소프트웨어 엔지니어로 일 한다는 것은 보통 데이터로 시작해서 데이터로 끝나게 되는 경우가 많습니다. 시스템이 점차 복잡해짐에 따라 단순 디버깅만으로 시스템의 문제없음이나 개선 사항이 제대로 적용되었는지 확인하기 어렵습니다. 버그가 발생하지는 않는지, 의도한 개선 사항들이 잘 작동하는지 확인하기 위해서는 필수적으로 테스트 데이터를 활용하게 됩니다. 따라서 을 제공받고자 하는 도서로 이 책을 선정하게 되었습니다. 책의 구성은 데이터 분석가로서 SQL을 활용하기 위한 전반적인 방법들을 담았습니다. 사소하게 여겨질 수 있는 데이터를 분비하는 과정부터 시작해 다양한 도메..

서평 2022.08.27

KMean 군집화 연습(약간의 데이터 분석을 끼얹은)

들어가며¶기계 학습의 대표적인 방법들은 지도학습, 비지도 학습, 그리고 강화 학습 이다. 이번 포스트에서는 이 중 비지도 학습 방법 중 하나인 K-means를 활용한 군집화(clustering)기법에 대한 예제 코드이다. 이번 포스트의 jupyter notebook과 csv파일들은 모두 github에서 확인 할 수 있다. 라이브러리 불러오기¶ In [1]: import pandas as pd import numpy as np from sklearn.cluster import KMeans from sklearn.decomposition import PCA from sklearn.preprocessing import StandardScaler import matplotlib.pyplot as plt impo..

프로그래밍 2021.07.03
728x90
반응형