다음 스터디를 진행한다.
판다스를 이용하며 가장 많이 쓰일 파트이니
집중적으로 학습하도록 하자.
드디어 시리즈를 만든다.
3번째 보면 문자열로 입력해서
생성하는 과정까지 나온다.
데이터 프레임 만드는 두 가지 예시를 들고 있다.
딕셔너리 형태로 전달하는 내용을 OrderedDict를 통해 순서 보장
시리즈 메소드는 자주 쓰는 것 같다.
필요한 부분은 발췌해서 요긴하게 쓰자.
Boolean 개념은 많이 쓰이는 것 같다.
더불어 브로드캐스팅과 벡터, 스칼라의 개념도 알아두면 정말 좋다.
다시 한번 파악하고 가면 좋다. (필수!)
벡터에 다양한 연산하는 것을 보여준다.
역시 다양한 연산 방법을 보여준다.
다양한 데이터 프레임 활용방법을 보여준다.
앞으로 시계열을 다룰 때 요긴하게 쓸 수 있는
datetime으로 자료형을 변경하는 것을 보여준다.
새로운 파생변수를 만들어내서 값을 채워 넣었다.
random 함수를 임포트 하여 활용한다.
참고하기로는 빨간 에러메시지는
MacOS 환경에서 진행했기 때문에
Windows 환경에서는 출력이 안 될 수도 있다.
drop 메서드를 활용해 삭제하는 과정을 보여준다.
피클로 저장하는 내용이다.
실습할 때나 해봤지. 딱히 실전에서 써야겠다는 생각이 안 떠오른다.
다시 한번 상기시켜야겠다.
피클은 반드시 read_pickle로
메서드로 읽어야 한다고 한다.
잊지 말자!
CSV와 TSV로 데이터를 저장하는 방법을 보여준다.
이외에도 엑셀로 저장하는 방법 또한 존재한다.
따로 다루도록 하겠다.
'공부 > 판다스' 카테고리의 다른 글
Do it! 데이터 분석을 위한 판다스 입문 - 05 데이터 연결하기 (0) | 2021.07.16 |
---|---|
Do it! 데이터 분석을 위한 판다스 입문 - 04 그래프 그리기 (0) | 2021.07.15 |
Do it! 데이터 분석을 위한 판다스 입문 - 02 판다스 시작하기 (0) | 2021.07.13 |
Do it! 데이터 분석을 위한 판다스 입문 - Intro (0) | 2021.07.13 |
파이썬 - 판다스를 이용해 데이터 시트 별로 파일 분리하기 (0) | 2021.06.24 |