우선 Pandas는 데이터처리를 돕는 파이썬 라이브러리이다.
파이썬을 이용한 데이터 분석에는 총 3개의 라이브러리가 필수적으로 필요하다.
- Numpy
- Pandas
- Matplotlib
이번에 알아볼 Pandas는 데이터 분석에 용이하다.
Pandas는 기본적으로 파이썬 라이브러리이기 때문에 파이썬 문법을 사용한다.
하지만 파이썬과 차이점이 있는데 사용하는 데이터의 구조이다.
Pandas에서는 총 3가지의 데이터 구조가 있다.
- Series
- DataFrame
- Panel
이중에서 시리즈와 데이터프레임이 가장 많이 사용된다.
Pandas를 사용할 때 Anaconda의 jupyter를 많이 사용한다.
그런데 지금은 Collaboratory를 사용할 것이다.
Pandas를 사용하려면 import해야한다.
pd로 하는 것이 관례이다.
'Python > Pandas' 카테고리의 다른 글
[Pandas] 데이터프레임 (DataFrame) (0) | 2022.05.02 |
---|---|
[Pandas] 시리즈 2 (Series) (0) | 2022.05.01 |
[Pandas] 시리즈 (Series) (0) | 2022.04.30 |