[Pandas 기초] 6. 데이터 선택 (기본)
·
Python/Pandas
👉방대한 데이터에서 필요한 부분만 선택하여 쓸 수 있다.여기서부터는 데이터 분석 시 정말 자주 사용할 기능들이니 잘 배워두자.데이터 준비 (이전과 동일)Column 선택 (by 컬럼명)Column 이름(label)으로 호출하는 건 앞에서 했었음.Column 선택 (by index)데이터가 방대해지면 Column 명을 모두 알고 있을 수 없음 ㅠㅠ⇒ 몇 번째 Column인지(정수 index)를 통해 호출해야 하는 경우가 더 많을 거임.위처럼 .columns로 label을 불러오고, 거기다가 다시 인덱싱해서 Column을 호출!슬라이싱범위를 적은 리스트 `[ ]`를 뒤에 이어붙이면 해당 부분만 잘라서 가져올 수 있음.🧐My Point❗여러 개를 한 번에 호출하고 싶을 땐 이중으로 리스트 씌우는 거 기억하..
[Pandas 기초] 5. 데이터 확인
·
Python/Pandas
👉 실제 데이터는 훨씬 방대해서 한 눈에 들어오지 않는다.그러니 구체적인 정보들을 요약해서 확인할 줄 알아야 한다. 데이터 준비 (이전 차시에 저장했던 파일 활용)DataFrame 확인`.describe()` : 계산 가능한 데이터에 대해 Column 별로 요약통계치를 보여줌.`.info()` : Column 별로 데이터의 기본 정보들을 보여줌.`.head()` : 데이터의 처음 부분 확인 / .tail() : 데이터의 끝 부분 확인`.values`, `.index`, `.columns`, `.shape` 등으로 다양한 정보를 확인할 수 있음.Series 확인DataFrame을 구성하는 Series에 대해서도 다양한 정보를 확인할 수 있음.`.min()` : 최소값`.mean()` : 평균값`.sum(..
[Pandas 기초] 4. 파일 저장 및 열기
·
Python/Pandas
👉 DataFrame 객체를 excel, csv, txt 등 형태의 파일로 저장 및 열기데이터 준비 (이전과 동일)1. 파일 저장1) csv 파일로 저장`.to_csv()` : 콤마(,)로 구분된 csv 파일로 저장함.`encoding='utf-8-sig'` : 한글이 깨지지 않도록 해주는 인코딩 설정.`index=False` : 인덱스를 빼고 저장하고 싶으면 이렇게 설정하면 됨.2) txt 파일로 저장똑같이 `.to_csv()`에서 `sep='\t'`으로 설정해주면, 텍스트 파일로 저장됨!3) excel 파일로 저장`.to_excel()` : 엑셀 파일로 저장함.2. 파일 열기1) csv 파일 불러오기`.read_csv()` : csv 형태로 저장된 파일을 불러옴.`skiprows` : 빼고 싶은 행..
[Pandas 기초] 3. Index
·
Python/Pandas
👉 Index : 데이터에 접근할 수 있는 주소값 데이터 준비 (이전과 동일)Index 제목 설정`.index` : 인덱스 값들을 호출함.`.index.name` : 인덱스의 제목을 원하는 대로 설정할 수 있음.Index 초기화`.reset_index()` : 생성했던 인덱스의 제목을 다시 지울 수 있음.column으로 다시 넣지 않고 아예 지워버리고 싶다면 `drop=True`로 설정하면 됨.❗변경사항을 실제 데이터에 바로 반영하려면 `inplace=True` 설정해줘야 함.Index 설정`.set_index()` : 지정한 column으로 index를 설정할 수 있음.Index 정렬`.sort_index()` : 인덱스를 기준으로 오름차순(ㄱㄴㄷ/123/abc) 정렬 가능함.내림차순으로 바꾸고 싶다..
[Pandas 기초] 2. DataFrame
·
Python/Pandas
👉 DataFrame : 2차원 데이터 (Series들의 모음)데이터 준비사전(dictionary) 자료구조를 통해 데이터를 생성함.DataFrame 객체 생성`pd.DataFrame()` : DataFrame 객체를 생성함.데이터 접근 (column)확인하고 싶은 열(column) 이름을 리스트 형태로 입력하면 됨.❗2개 이상의 column을 가져오려면 이중 리스트를 사용해야 함.DataFrame 객체 생성 (Index 지정)이번에도 `index` 매개변수로 임의의 index 지정할 수 있음.(❗index 개수 정확히 안 맞으면 에러 발생하니 주의)DataFrame 객체 생성 (Column 지정)`columns` : 데이터 속에서 원하는 column만 선택하거나, 순서를 변경할 수 있음.   *본 포..
[Pandas 기초] 1. Series
·
Python/Pandas
👉Pandas에서 1차원 데이터(정수, 실수, 문자열 등)에 대한 부분Series 객체 생성`pd.Series()` : 리스트 형태로 데이터를 입력하여 Series 객체를 생성함.Series 객체 (Index 지정)`index` 매개변수로 데이터 각각의 index를 지정해줄 수 있음.⇒ 내가 지정한 index로 데이터 값에 접근할 수 있음.  *본 포스팅은 이전에 Velog(https://velog.io/@simon919)에서 작성했던 글을 Tistory로 옮긴 것입니다.
[Pandas 기초] 0. 소개
·
Python/Pandas
1. Pandas파이썬에서 사용하는 핵심적인 라이브러리 중 하나로 데이터 분석에 유용한 기능들을 제공한다. (행,열로 이루어진 2차원 데이터 처리)아래와 같이 import 하여 사용할 수 있다.Jupyter Notebook으로 실습을 진행했으며, 독학했던 내용을 복습하며 기록하려 한다.(학습 내용 및 코드 전반의 출처는  님의 유튜브 강좌를 기반으로 한다.) *본 포스팅은 이전에 Velog(https://velog.io/@simon919)에서 작성했던 글을 Tistory로 옮긴 것입니다.