[혼자 공부하는 머신러닝+딥러닝] 4-2. 확률적 경사 하강법
·
ML & DL/머신러닝 기초
Intro.럭키백 이벤트로 히트 친 한빛마켓,, 너도 나도 수산물을 공급하겠다고 아우성 ,,김 팀장🗣️"이제는 7개의 생선 말고 새로운 생선도 추가될 거고, 수산물들이 오는 족족 분류모델을 업데이트 해야 해. 모든 생선이 도착할 때까지 마냥 기다릴 순 없으니까.. 기존 데이터를 유지하면서 새로운 데이터가 올 때마다 조금씩 훈련시킬 수 있겠어?" = 점진적 학습!1. 확률적 경사 하강법확률적 경사 하강법(SGD)대표적인 '점진적 학습' 방법. (단, 선형회귀나 로지스틱처럼 ML/DL '알고리즘'이 아니라 그런 알고리즘들을 '최적화하는 방법'에 대한 거라고 보면 됨!)'경사 하강' : 가장 가파른 경사를 따라 조금씩 내려감. 목표지점 가까워질수록 더 조금씩! (한 번에 많이 내려가면 지나칠 수 있기 때문)..
[혼자 공부하는 머신러닝+딥러닝] 4-1. 로지스틱 회귀
·
ML & DL/머신러닝 기초
Intro.한빛 마켓의 새로운 이벤트인 '한빛 럭키백' 출시!그런데 고객들이 판단을 하려면 럭키백에 포함된 생선의 확률을 알려줘야겠네...그냥 분류만 하는 건 앞에서 해봤는데, 그 분류에 대한 확률도 구할 수 있는 걸까?= 럭키백에 들어가는 생선은 7종.럭키백에 들어간 생선의 크기, 무게, 길이 등이 주어졌을 때, 7개 생선에 대한 확률을 출력해야 함!1. k-최근접 이웃 분류k-최근접 이웃 모델은 가까운 이웃 중 가장 많은 것을 타깃으로 채택했었다. 그렇다면, 그 '가까운 이웃'들의 비율이 있을 것이다. → 실제로 이 분류기에서 확률 계산 기능을 제공함!데이터 준비이번에도 인터넷에서 데이터 내려받기 by Pandas`.unique()` : 중복되는 거 빼고 고유한 값들 보여주는 함수이 생선의 종류들을 ..
[혼자 공부하는 머신러닝+딥러닝] 3-3. 특성 공학과 규제
·
ML & DL/머신러닝 기초
Intro.(이전 시간에) 다항회귀 모델로 예측해봐도 여전히 남아있는 과소적합이 찜찜한데... 도와주세요ㅠ김 팀장🗣️ "뭐야, 높이랑 두께 데이터도 있으면서 왜 안 썼어? 선형회귀는 특성이 많을수록 효과가 뛰어나니까, 여러 개의 특성을 함께 적용해 봐!"1. 다중 회귀데이터 준비이번엔 길이 말고 높이랑 두께까지, 특성(독립변수)을 3개로 추가함.인터넷에서 데이터를 편하게 내려받아 쓸 수 있는 pandas 라이브러리 활용!입력 데이터`pd.read_csv()` : 외부의 csv 파일을 데이터프레임으로 받아오는 함수`.to_numpy()` : 넘파이 배열로 바꿔주는 메소드 타깃 데이터훈련/테스트 세트 분할 특성 공학(feature engineering)`PolynomialFeatures()` : 다항 특성..
[혼자 공부하는 머신러닝+딥러닝] 3-2. 선형 회귀
·
ML & DL/머신러닝 기초
Intro.농어 담당 직원이 50cm 짜리 농어를 가져와 무게를 예측해달라고 하시네.저번 시간에 만든 k-최근접 이웃 회귀 모델을 실전에 쓸 때가 왔군 ㅎㅎ"1.03kg 정도로 예측됩니다! ... 네...? 실제 무게는 1.5kg이라구요...?" ㅠㅠ1. k-최근접 이웃의 한계데이터 준비 & 모델 훈련이전 시간에 만든 그 Knn 회귀모델 다시 준비 (k=3으로 설정)문제 상황 파악50cm 농어를 넣어보니 정말 1.03kg로 예측하네 .. (≠ 정답인 1.5kg)산점도로 그려보니 문제가 보임..!예측하려는 농어(녹색 세모)가 훈련시킨 데이터들이랑 동떨어져 있음새로운 샘플이 훈련세트 범위를 벗어나면 예측을 제대로 할 수 없구나!(예컨대 막 100cm를 넣어봐도 그대로 1.03kg으로 예측함 ^^;;)"다른 ..
[혼자 공부하는 머신러닝+딥러닝] 1-3. 마켓과 머신러닝
·
ML & DL/머신러닝 기초
Intro.김 팀장🗣️ "직원이 물고기 종류 구분을 못 하네... '무게'와 '길이' 데이터를 바탕으로, 도미와 빙어를 구분하는 모델을 만들어줘!"1. 데이터 준비직접 리스트로 입력한 데이터도미 데이터길이 특성, 무게 특성 2가지 있음빙어 데이터길이 특성, 무게 특성 2가지 있음사이킷런에 맞게 데이터 구성 다듬기사이킷런이 기대하는 데이터 형태 = 리스트 속 리스트 (2차원 리스트)도미 데이터와 빙어 데이터를 합치고, 2차원 리스트로 만들어줌`zip()` : 전달받은 리스트에서 원소를 하나씩 꺼내주는 함수 정답 데이터 설정입력 데이터는 위에서 설정한 도미와 빙어.뭐가 정답인지는 알아야 알고리즘도 '학습'이란 걸 할 수 있겠죠! (정답=`1`) 2. 머신러닝 프로그램 개발알고리즘 준비`KNeighborsC..
[혼자 공부하는 머신러닝+딥러닝] 1-2. 코랩과 주피터 노트북
·
ML & DL/머신러닝 기초
Intro.머신러닝을 공부하기 위한 준비물 ... 1. 구글 코랩 (Google Colab)따로 프로그램을 설치할 필요 없이 '웹 브라우저'에서 무료로 파이썬 프로그램(머신러닝도 가능!) 을 테스트 & 저장할 수 있는 서비스.구글 계정만 있다면 누구나 코랩 에 들어가서 실습을 해볼 수 있다는...!노트북 : 코랩에서 작성한 파일을 부르는 단위 `.ipynb`셀(cell) : 코드 혹은 텍스트의 덩어리 텍스트 셀`Enter` 또는 `더블클릭`으로 편집 시작코드 셀처럼 실행되는 것이 아니니까, 자유롭게 원하는 내용 작성하면 됨.HTML과 마크다운을 혼용 가능하며, 미리보기 창을 함께 제공함.툴바에서 다양한 형태로 글을 꾸밀 수 있음.`ESC`로 편집 마치기 코드 셀`Enter` 또는 `더블클릭`으로 편집 시..
[혼자 공부하는 머신러닝+딥러닝] 1-1. 인공지능과 머신러닝, 딥러닝
·
ML & DL/머신러닝 기초
Intro.데이터사이언스를 복수전공 하는 미래의 나를 위해 머신러닝을 공부하려 한다.함께 공부하는 상황을 공유할 수 있다는 혼공학습단도 신청했다. 꾸준히 잘해보자!1. 인공지능이란? : 사람처럼 학습하고 추론할 수 있는 지능을 가진 컴퓨터 시스템을 만드는 기술. 1.1. 인공지능의 역사인공지능 태동기  - 1943. 워런 메컬러와 월터 피츠가 최초로 '뉴런' 개념 발표   - 1950. 앨런 튜링이 인공지능 여부 판별하는 '튜링 테스트' 발표  - 1956. 다트머스 AI 컨퍼런스 (긍정적 전망 多)인공지능 황금기  - 1957. 프랑코 로젠블라트의 '퍼셉트론' = 인공신경망의 기본이 되는 알고리즘  - 1959. 허블과 비셀의 고양이 시각피질 연구 (노벨상 수상)1차 AI 겨울  - 컴퓨터 성능의 한계..