👉 실제 데이터는 훨씬 방대해서 한 눈에 들어오지 않는다.
그러니 구체적인 정보들을 요약해서 확인할 줄 알아야 한다.
- 데이터 준비 (이전 차시에 저장했던 파일 활용)
DataFrame 확인
- `.describe()` : 계산 가능한 데이터에 대해 Column 별로 요약통계치를 보여줌.
- `.info()` : Column 별로 데이터의 기본 정보들을 보여줌.
- `.head()` : 데이터의 처음 부분 확인 / .tail() : 데이터의 끝 부분 확인
- `.values`, `.index`, `.columns`, `.shape` 등으로 다양한 정보를 확인할 수 있음.
Series 확인
- DataFrame을 구성하는 Series에 대해서도 다양한 정보를 확인할 수 있음.
- `.min()` : 최소값
- `.mean()` : 평균값
- `.sum()` : 총합
- `.nlargest()` : 가장 큰 값
- `.count()` : 유효한 데이터 개수
- `.unique()` : (중복을 제외한) 고유값
- `.nunique()` : 고유값 개수
*본 포스팅은 이전에 Velog(https://velog.io/@simon919)에서 작성했던 글을 Tistory로 옮긴 것입니다.
'Python > Pandas' 카테고리의 다른 글
[Pandas 기초] 7. 데이터 선택 (loc) (0) | 2025.02.05 |
---|---|
[Pandas 기초] 6. 데이터 선택 (기본) (0) | 2025.02.05 |
[Pandas 기초] 4. 파일 저장 및 열기 (0) | 2025.02.03 |
[Pandas 기초] 3. Index (0) | 2025.02.02 |
[Pandas 기초] 2. DataFrame (0) | 2025.02.02 |