시리즈 클래스는 1차원 배열을 형태를 띄고 있다.
list라고 생각하면 편하다.
그런데 파이썬의 list와 다른점은
파이썬 list는 번호를 통해 인덱싱을 했다.
시리즈는 각 요소(값)에 대응하는 인덱스를 부여할 수 있다는 것이다.
- Series 기초
- Series 속성
이제 시리즈를 만들어 보겠다.
- Series 기초
pd.Series()를 통해 시리즈를 생성할 수 있으며 인수로 list가 들어가야한다.
아래의 실행결과는 자동으로 나오는 것이다.
0 1 2 3 4 는 인덱스
1 2 3 4 5 는 값이다.
각각의 값마다 인덱스를 부여하였다.
index attribute에 값 리스트와 동일한 길이의 리스트를 넣어주면 자동으로 mapping된다.
이때 인덱스의 개수는 시리즈의 길이와 같아야한다. (인덱스를 모두 부여하거나 부여하지 않거나)
그리고 부여된 인덱스를 index label이라고 한다.
파이썬의 모든 데이터는 시리즈에 담을 수 있다.
- dictionary
- list
- tuple
- 딕셔너리의 key 들이 시리즈의 index가 된다.
- 리스트의 인덱스값 그대로 인덱싱 되었다.
아까 시리즈 예제를 처음봤던거랑 똑같이 생겼다. 사실 둘은 같은 리스트이다.
딕셔너리의 경우 key가 시리즈의 index, value가 시리즈의 value가 되지만
리스트의 경우 전달되는 값은 value만 있기 때문에 시리즈 자체에서 인덱스를 부여하는 것이다. (순서대로)
원한다면 이상태에서 별도의 index label을 붙여줄 수 있다.
- 결과는 시리즈와 같다.
본래 리스트와 튜플의 차이는 원소 추가, 제거, 변환에 있었지 담을 수 있는 데이터에는 차이가 없었다.
시리즈로 변환시 데이터가 옮겨오는 것이니 결과면에서 둘은 차이가 없는 것이다.
- Series 속성
시리즈에는 여러가지 속성들이 있다.
생성시 입력할 수 있는 속성:
- data은 컨테이너를 입력받는다 (ex. dictionary, list, tuple, or scalar values)
- index은 컨테이너를 입력받지만 data의 값들에 대한 index labels가 들어간다.
- dtype은 데이터타입을 입력받는다. 해당 시리즈 값에 대한 데이터타입을 강제적으로 바꾸고 싶을 때 사용한다.
- name은 하나의 string을 입력받으며 해당 시리즈에 붙이고 싶은 이름이 들어간다. (ex. id)
- copy는 불린 데이터(진릿값)를 입력받는다.
'Python > Pandas' 카테고리의 다른 글
[Pandas] 데이터프레임 (DataFrame) (0) | 2022.05.02 |
---|---|
[Pandas] 시리즈 2 (Series) (0) | 2022.05.01 |
[Pandas] 판다스 입문 (1) | 2022.04.30 |