일상 속 공감을 공유하다.
728x90

시각화 3

Do it! 데이터 분석을 위한 판다스 입문 - 12 시계열 데이터

대망의 마지막 챕터다. 우리는 늘 흐르는 시간 속에 살고 있다. 그것을 다룬 것 시계열 데이터다. datetime은 기본적으로 날짜와 시간을 처리하기 위한 것이다. now 메소드는 밀리초단위까지 현재 시간을 구한다. 당연히 시간을 계산하기 위해 사용하며 이로 변환하기 위해서는 to_datetime 메소드를 사용하면 된다. 데이터 프레임 정보를 살펴보면 Date가 object 타입으로 들어가 있다. date_dt라는 것을 새로 만들고 Date를 타입 변경하여 내용을 채운다. 시간 형식 지정자들을 이용해 입력하면 원하는 포맷으로 출력이 가능하다. 다양한 시간 형식 지정자와 그 결과다. 필요한 부분은 꼭 메모해서 이용하도록 하자. 시계열 데이터 구분해서 추출하는 파트다. strftime 메소드와 시간 형식 지..

공부/판다스 2021.12.20

Do it! 데이터 분석을 위한 판다스 입문 - 04 그래프 그리기

이번에는 기존에 MacOS에서 작업한 Output을 활용하지 않고, Windows에서 다시 출력한 결과를 가지고 작성하겠다. 이번에는 Seaborn이라는 라이브러리를 활용한다. 기존의 Matplotlib보다 더 향상되고, 간결한 시각화 도구라 생각한다. 앤스컴 데이터셋을 불러온다. 파이 플롯을 부르고 시각화한다. 위 구문을 입력하면 각 포인트마다 점이 찍힌다. 그래프 그릴 때는 큰 틀부터 작은 세세한 구성요소로 접근하는 편이 좋다. 아래 그래프는 이 이후에 나올 설정이 다 반영된 결과다. dataset_1부터 dataset_4까지 fig에 표현한다. 해당 셀 별로 필요한 설정을 참고해서 이용하자. 이번엔 tips라는 데이터셋을 불러온다. head()를 통해 간략한 데이터 구성을 살핀다. 히스토그램은 많이..

공부/판다스 2021.07.15

Do it! 데이터 분석을 위한 판다스 입문 - 02 판다스 시작하기

사실상 첫 단추를 꿰는 단계이기 때문에 간단하게 구성 환경을 기술한다. 뭐든 잘 모르는 초보단계라면 그냥 아나콘다 패키지 설치해서 이용하길 바란다. 판다스 라이브러리 불러오고, pd는 판다스의 대표 alias다. 업계 국룰이다. 데이터 프레임에 담는다. df라는 변수에 csv를 불러와서 담는다. 뒤에 기술된 ( )

공부/판다스 2021.07.13
반응형