╱╱╭╮╱╱╱╱╱╱╭━━━╮╱╱╱╭╮╱╭╮╱╱╱╱╱╱ ╱╱┃┃╱╱╱╱╱╱┃╭━╮┃╱╱╱┃┃╱┃┃╱╱╱╱╱╱ ╱╱┃┣━━┳━━╮┃┃╱┃┣━╮╱┃╰━╯┣━━┳━╮╱ ╭╮┃┃╭╮┃┃━┫┃╰━╯┃╭╮╮┃╭━╮┃╭╮┃╭╮╮ ┃╰╯┃╭╮┃┃━┫┃╭━╮┃┃┃┃┃┃╱┃┃╭╮┃┃┃┃ ╰━━┻╯╰┻━━╯╰╯╱╰┻╯╰╯╰╯╱╰┻╯╰┻╯╰╯

Python/Pandas

[Pandas] 시리즈 2 (Series)

재안안 2022. 5. 1. 01:35

시리즈에서 사용할 수 있는 attributes가 많다.

 

이번엔 시리즈의 attributes에 대해 알아볼 것이다.

 

모든 attributes에 대해 알아볼 것은 아니고 많이 사용할 거 같은 거게 대해서만 알아보겠다.

 

참고로 모든 attributes에 대해 알아볼려면 pandas document를 참고하면 된다.

 

series 생성

 

해당 상태에서 시작하겠다.

 

method가 아닌 attribute는 (중괄호)를 사용하지 않는다.

참조연산자를 통해 접근할 수 있다.

 

hasnan : nan(null)값이 있으면 true를 반환한다.

hasnan 사용 예제

우선 Nan이란 null이라고 생각하면 된다. 비어있는 값을 나타내며 numpy를 통해 나타낼 수 있다.

관계형 데이터와 비관계형 데이터의 차이 때문에 null값은 언제든지 생길 수 있다.

해당 데이터에서 null값이 있는지 확인하고 싶을 때 hasnans를 사용한다.

 

 

index : index를 반환한다.

index 사용 예제

 

실제로 매우 유용한 기술이라고 생각한다.

for문을 통해 인덱스값을 불러오지 않아도 index를 사용하면 해당 시리즈가 어떤 인덱스를 가지고 있는지 알려준다.

 

 

loc : label을 통해서 값에 접근한다.

loc 사용 예제

[대괄호 ]안에 index를 입력하면 해당 index에 대한 값을 반환한다. 이는 딕셔너리의 key값을 통해 value를 찾는 방법과 매우 유사하다.

 

그리고 실제로 나중에 데이터프레임(일단은 2차원 시리즈라고 하겠다.)에서는 시리즈의 인덱스 값들이

데이터프레임의 행열에서 열(column)값이 되는데 loc['index']를 통해 많이 접근한다.

 

결국 loc를 많이 사용한다는 말이다.

 

 

size : 원소의 개수를 반환한다.

size 사용 예제

해당 컨테이너(시리즈)가 몇개의 요소를 가지고 있는지 확인하는 방법은 컨테이너를 사용할 때 기본적으로 알아야하는 스킬이다. 유용할 수도 있고 아닐 수도 있지만 일단 무조건 알아야한다.

 

 

values : 배열의 형태로 원소의 값을 반환한다.

values 사용 예제

 

index가 인덱스를 반환한다면 values는 을 반환한다. 시리즈의 데이터를 확인하기 좋은 방법이다.

 

시리즈를 사용할 때 알고있으면 좋은 attributes에 대해 알아봤다.

시리즈에 대한 메소드도 많지만 시리즈에 대해서는

이정도만 알고 있어도 많은 도움이 될 것 같다.

 

시리즈는 결국 구조화된 데이터를 사용하기 위해 사용된다.

 

파이썬에서 다양한 방법들도 데이터를 저장할 수 있었다면 판다스에서는 하나의 구조의 데이터를 사용하는 것이다.

 

또한 시리즈에서는 인덱싱이 가능하며 인덱스를 사용한 값 접근, 수정, 삭제 모두 가능하다.

 

indexing 사용 예제

'Python > Pandas' 카테고리의 다른 글

[Pandas] 데이터프레임 (DataFrame)  (0) 2022.05.02
[Pandas] 시리즈 (Series)  (0) 2022.04.30
[Pandas] 판다스 입문  (1) 2022.04.30