[Pandas 기초] 9. 데이터 선택 (조건)
·
Python/Pandas
👉원하는 조건을 지정하여 데이터를 선택할 수 있다.데이터 준비 (이전과 동일)조건에 해당하는 데이터 선택`연산자(>, 원하는 조건을 객체(`filt`)로 만들어두고, 그 조건에 맞는 데이터를 출력 가능!`~`을 붙여주면 조건을 반대로 적용할 수 있음앞에서 배운 `loc`를 활용하여 더 세부적인 데이터 선택도 가능함!!ex) 키가 185 이상인 학생들(row)의 수학 성적(column)만 조회다양한 조건을 사용할 수 있음!& (And)`&` : 여러 조건을 '모두' 만족하는 경우를 출력함. (각 조건은 괄호로 감싸주기)| (or)`|` : 여러 조건 중 '하나라도' 만족하는 경우를 출력함. (각 조건은 괄호로 감싸주기)➕str 함수문자열 관련 처리에 유용한 함수로, 자세한 옵션은 공식 링크에서 확인할 수..
[Pandas 기초] 8. 데이터 선택 (iloc)
·
Python/Pandas
👉location도 번호(정수값)를 이용하여, 원하는 행/열을 선택할 수 있다.(cf. 이전 시간에 배운 `.loc`는 행/열의 '이름'을 사용했었음)데이터 준비 (이전과 동일)int location으로 데이터 선택`.iloc[ ]` : 지정한 위치(int location)의 데이터를 출력함.사용 예시) `df . iloc [ row_sel , col_sel ]`(loc와 마찬가지로) 여러 위치를 한 번에 출력 가능하고,슬라이싱도 당연히 가능함.(❗loc 와 달리, iloc 로 선택할 때는 슬라이싱의 끝값을 포함하지 않음!!)🧐My Point❗iloc 는 정수값으로 지정하는 거니까, 슬라이싱 할 때 끝값 포함 안 한다고 생각하자!(loc는 이름이니까 끝값도 포함한 거겠지...!)   *본 포스팅은 이..
[Pandas 기초] 7. 데이터 선택 (loc)
·
Python/Pandas
👉행과 열의 이름을 이용하여, 원하는 행/열을 선택할 수 있다.데이터 준비 (이전과 동일)location으로 데이터 선택`.loc[ ]` : 지정한 위치(location)의 데이터를 출력함.사용 예시) `df . loc [ row_sel , col_sel ]`여러 개의 위치도 한 번에 출력할 수 있음. (역시나 이중 리스트 씌워주기)슬라이싱으로도 출력 가능함. (슬라이싱은 이중 리스트 필요 없음!!)     *본 포스팅은 이전에 Velog(https://velog.io/@simon919)에서 작성했던 글을 Tistory로 옮긴 것입니다.
[Pandas 기초] 6. 데이터 선택 (기본)
·
Python/Pandas
👉방대한 데이터에서 필요한 부분만 선택하여 쓸 수 있다.여기서부터는 데이터 분석 시 정말 자주 사용할 기능들이니 잘 배워두자.데이터 준비 (이전과 동일)Column 선택 (by 컬럼명)Column 이름(label)으로 호출하는 건 앞에서 했었음.Column 선택 (by index)데이터가 방대해지면 Column 명을 모두 알고 있을 수 없음 ㅠㅠ⇒ 몇 번째 Column인지(정수 index)를 통해 호출해야 하는 경우가 더 많을 거임.위처럼 .columns로 label을 불러오고, 거기다가 다시 인덱싱해서 Column을 호출!슬라이싱범위를 적은 리스트 `[ ]`를 뒤에 이어붙이면 해당 부분만 잘라서 가져올 수 있음.🧐My Point❗여러 개를 한 번에 호출하고 싶을 땐 이중으로 리스트 씌우는 거 기억하..
[Pandas 기초] 4. 파일 저장 및 열기
·
Python/Pandas
👉 DataFrame 객체를 excel, csv, txt 등 형태의 파일로 저장 및 열기데이터 준비 (이전과 동일)1. 파일 저장1) csv 파일로 저장`.to_csv()` : 콤마(,)로 구분된 csv 파일로 저장함.`encoding='utf-8-sig'` : 한글이 깨지지 않도록 해주는 인코딩 설정.`index=False` : 인덱스를 빼고 저장하고 싶으면 이렇게 설정하면 됨.2) txt 파일로 저장똑같이 `.to_csv()`에서 `sep='\t'`으로 설정해주면, 텍스트 파일로 저장됨!3) excel 파일로 저장`.to_excel()` : 엑셀 파일로 저장함.2. 파일 열기1) csv 파일 불러오기`.read_csv()` : csv 형태로 저장된 파일을 불러옴.`skiprows` : 빼고 싶은 행..
[Pandas 기초] 1. Series
·
Python/Pandas
👉Pandas에서 1차원 데이터(정수, 실수, 문자열 등)에 대한 부분Series 객체 생성`pd.Series()` : 리스트 형태로 데이터를 입력하여 Series 객체를 생성함.Series 객체 (Index 지정)`index` 매개변수로 데이터 각각의 index를 지정해줄 수 있음.⇒ 내가 지정한 index로 데이터 값에 접근할 수 있음.  *본 포스팅은 이전에 Velog(https://velog.io/@simon919)에서 작성했던 글을 Tistory로 옮긴 것입니다.
[Pandas 기초] 0. 소개
·
Python/Pandas
1. Pandas파이썬에서 사용하는 핵심적인 라이브러리 중 하나로 데이터 분석에 유용한 기능들을 제공한다. (행,열로 이루어진 2차원 데이터 처리)아래와 같이 import 하여 사용할 수 있다.Jupyter Notebook으로 실습을 진행했으며, 독학했던 내용을 복습하며 기록하려 한다.(학습 내용 및 코드 전반의 출처는  님의 유튜브 강좌를 기반으로 한다.) *본 포스팅은 이전에 Velog(https://velog.io/@simon919)에서 작성했던 글을 Tistory로 옮긴 것입니다.