[Pandas 기초] 5. 데이터 확인

2025. 2. 4. 21:25·Python/Pandas

 

 

👉 실제 데이터는 훨씬 방대해서 한 눈에 들어오지 않는다.

그러니 구체적인 정보들을 요약해서 확인할 줄 알아야 한다.

 


  • 데이터 준비 (이전 차시에 저장했던 파일 활용)

DataFrame 확인

  • `.describe()` : 계산 가능한 데이터에 대해 Column 별로 요약통계치를 보여줌.
  • `.info()` : Column 별로 데이터의 기본 정보들을 보여줌.
  • `.head()` : 데이터의 처음 부분 확인 / .tail() : 데이터의 끝 부분 확인
  • `.values`, `.index`, `.columns`, `.shape` 등으로 다양한 정보를 확인할 수 있음.

Series 확인

  • DataFrame을 구성하는 Series에 대해서도 다양한 정보를 확인할 수 있음.
  • `.min()` : 최소값
  • `.mean()` : 평균값
  • `.sum()` : 총합
  • `.nlargest()` : 가장 큰 값
  • `.count()` : 유효한 데이터 개수
  • `.unique()` : (중복을 제외한) 고유값
  • `.nunique()` : 고유값 개수

 

 

 


 

*본 포스팅은 이전에 Velog(https://velog.io/@simon919)에서 작성했던 글을 Tistory로 옮긴 것입니다.

'Python > Pandas' 카테고리의 다른 글

[Pandas 기초] 7. 데이터 선택 (loc)  (0) 2025.02.05
[Pandas 기초] 6. 데이터 선택 (기본)  (0) 2025.02.05
[Pandas 기초] 4. 파일 저장 및 열기  (0) 2025.02.03
[Pandas 기초] 3. Index  (0) 2025.02.02
[Pandas 기초] 2. DataFrame  (0) 2025.02.02
'Python/Pandas' 카테고리의 다른 글
  • [Pandas 기초] 7. 데이터 선택 (loc)
  • [Pandas 기초] 6. 데이터 선택 (기본)
  • [Pandas 기초] 4. 파일 저장 및 열기
  • [Pandas 기초] 3. Index
simon919
simon919
개인적으로 공부한 내용을 기록하고 나누는 블로그입니다. 데이터 분석, 인공지능에 관한 내용을 주로 다룹니다.
  • simon919
    문과생의 AI 생존기
    simon919
  • 전체
    오늘
    어제
    • 분류 전체보기 (84)
      • ML & DL (38)
        • 머신러닝 기초 (23)
        • 딥러닝 기초 (6)
        • 데이터마이닝 (9)
      • Data structure & Algorithm (1)
      • SQL (21)
        • BigQuery (13)
        • MySQL (8)
      • Statistics (4)
        • 교육 연구를 위한 통계 (4)
        • Linear Algebra (0)
      • Python (17)
        • Pandas (16)
        • Matplotlib (0)
        • Numpy (0)
        • Web Crawling (1)
      • Projects (0)
      • Etc. (3)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

    • 글자가 깨지면 새로고침 해주세요 :)
  • 인기 글

  • 태그

    mysql
    pytorch
    티스토리 스킨
    해커랭크
    kmooc
    pandas
    kmeans
    Functional API
    agglomerative
    블로그 스킨
    MaxPooling2D
    혼공학습단
    SQL코딩테스트
    SQL문제풀이
    데이터마이닝
    ml기초
    특성맵 시각화
    BigQuery
    최우수혼공족
    Xai
    혼공머신
    통계학 기초
    교육통계
    Conv2d
    google cloud
    SQL
    HELLO 스킨
    Bayesian Optimization
    silhouette index
    리트코드
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
simon919
[Pandas 기초] 5. 데이터 확인
상단으로

티스토리툴바