일상 속 공감을 공유하다.

공부/판다스

Do it! 데이터 분석을 위한 판다스 입문 - 03 판다스 데이터프레임과 시리즈

ohhw 2021. 7. 13. 17:47
728x90
반응형

03 판다스 데이터프레임과 시리즈.ipynb
0.03MB

 

다음 스터디를 진행한다.

판다스를 이용하며 가장 많이 쓰일 파트이니

집중적으로 학습하도록 하자.

 

 

 

드디어 시리즈를 만든다.

3번째 보면 문자열로 입력해서

생성하는 과정까지 나온다.

 

 

 

 

데이터 프레임 만드는 두 가지 예시를 들고 있다.

 

 

 

 

딕셔너리 형태로 전달하는 내용을 OrderedDict를 통해 순서 보장

 

 

 

 

 

 

시리즈 메소드는 자주 쓰는 것 같다.

필요한 부분은 발췌해서 요긴하게 쓰자.

 

 

 

 

 

 

Boolean 개념은 많이 쓰이는 것 같다.

더불어 브로드캐스팅과 벡터, 스칼라의 개념도 알아두면 정말 좋다.

다시 한번 파악하고 가면 좋다. (필수!)

 

 

 

 

벡터에 다양한 연산하는 것을 보여준다.

 

 

 

역시 다양한 연산 방법을 보여준다.

 

 

 

 

다양한 데이터 프레임 활용방법을 보여준다.

 

 

 

 

앞으로 시계열을 다룰 때 요긴하게 쓸 수 있는

datetime으로 자료형을 변경하는 것을 보여준다.

 

 

 

 

새로운 파생변수를 만들어내서 값을 채워 넣었다.

 

 

 

 

random 함수를 임포트 하여 활용한다.

 

참고하기로는 빨간 에러메시지는

MacOS 환경에서 진행했기 때문에

Windows 환경에서는 출력이 안 될 수도 있다.

 

 

 

 

drop 메서드를 활용해 삭제하는 과정을 보여준다.

 

 

 

 

피클로 저장하는 내용이다.

실습할 때나 해봤지. 딱히 실전에서 써야겠다는 생각이 안 떠오른다.

다시 한번 상기시켜야겠다.

 

 

 

 

피클은 반드시 read_pickle로

메서드로 읽어야 한다고 한다.

잊지 말자!

 

 

 

 

CSV와 TSV로 데이터를 저장하는 방법을 보여준다.

이외에도 엑셀로 저장하는 방법 또한 존재한다.

따로 다루도록 하겠다.

728x90