전체 글

티스토리 블로그

    AITech 학습정리-[DAY 15] Generative model

    ========================= 학습내용 확률을 얻어낼 수 있는 모델을 explicit model 이라고 부름 GAN 모델이라고 해도 만들 수 있어야 하지만, 이것이 뭔지 알아야 하기때문에 구별모델도 들어가고, 귀나 꼬리같은 공통부분도 비지도학습으로 알아야 한다. p(x)는 어떻게 표시할까. 확률을 나타내는 파라미터 수 세는 법. 동전의 경우 앞면, 뒷면 두개 다 있어야 할 것 같지만 앞면이 p라면 뒷면은 1-p로 할 수 있고 카테고리의 경우로 확장해도 마찬가지. 그래서 나중에도 -1이 종종 붙는다. 그래서 mnist 학습데이터 숫자인 28*28*1 이미지로 보면, 경우의 수가 2^n 이니까 확률 파라미터는 2^n -1 이다. 근데 이건 너무 많다. 그래서 어떻게 줄일까 잔머리를 굴리는데,..

    AITech 학습정리-[DAY 14] Recurrent Neural Networks

    ==================== 학습내용 [AI Math 10강] RNN 첫걸음 sequence 데이터를 학습한다. 시계열. 독립된 데이터가 아님. 왜 이렇게 설계하는지 이해하는게 중요하다. 소리, 문자열 주가 등.. 시퀀스 데이터는 독립동등분포(i.i.d.) 가정을 잘 위배하기 때문에 순서를 바꾸거나 과거 정보에 손실이 발생하면 데이터의 확률분포도 바뀌게 된다. A와 B가 독립시행일 경우 P(A∩B) = P(A)*P(B) 앞의 조건가지고 뒤가 달라지기 때문에 조건부 확률을 사용할 수 있다. 베이즈 법칙으로 쪼갤 수 있음. (https://ko.wikipedia.org/wiki/%EB%B2%A0%EC%9D%B4%EC%A6%88_%EC%A0%95%EB%A6%AC) 과거의 모든 데이터를 쓰는건 아니고 ..

    AITech 학습정리-[DAY 13] Convolutional Neural Networks

    ========================= 학습내용 [DLBasic] CNN - Convolution은 무엇인가? 중요한건 어떤 새로운 Neural Networks(아키텍쳐)를 봤을 때 이 네트워크의 layer 별로 몇 개의 parameter로 이루어져 있고 전체 parameter의 숫자가 몇 개인지를 항상 감을 갖고있는게 중요하다. 수를 직접 손으로 계산해보는 실습.. Stride 얼마나 dense하게 찍을지. output 크기도 그에따라 줄어들겠지. dense layer 넘어가는 쪽 이해 안감. 찾아보고 물어봐야지.. 1*1*channel*(원하는 차원크기) 크기의 convolution 할 때도 있는데 차원 줄여서 파라미터 수 줄이기 위해 사용한다. 1*1*channel*1 로 하면 채널 1로 줄..

    AITech 학습정리-[DAY 12] 최적화

    ============================== 학습내용 [DLBasic] Optimization [DLBasic] Optimization Assignment [AI Math 9강] CNN 첫걸음 [AI Math 9강 퀴즈] CNN 첫걸음-1~5 시험 [DLBasic] Optimization 사실 각각의 최적화에 대해 한학기 한학기.. 로 다뤄야 할 만큼 많은데 줄이고 줄이고 줄여서 주목할만한 것들만 살펴본다고 한다. 용어들의 정확한 컨셉을 잡는게 중요 local minimum을 찾는게 목적이 된다. Generalization Under-fittingvs.over-fitting Crossvalidation Bias-variancetradeoff Bootstrapping Baggingandboost..

    AITech 학습정리-[DAY 11] 딥러닝 기초

    ========================== 학습내용 [AI Math 8강] 베이즈 통계학 맛보기 D 관찰하는 데이터. theta 관찰하는 이벤트, 파라미터, 모수. posterior 데이터를 관찰을 했을 때 이 파라미터가 성립할 확률. 데이터를 관찰한 후에 측정한 거라. 사전확률은 사건이 일어나기 전에 모델링하고자 하는 사전에 미리 가정, 모델링 하기 전에 사전에 설정하는 것. P(D) evidence의 확률, 여기선 진짜로 걸렸을 확률 오탐률(False alarm)이 오르면 테스트의 정밀도(Precision)가 떨어진다. P(theta|D) 질병에 걸렸다고 검진결과가 나왔을 때 진짜로 감염되었을 확률. 질병에 걸렸을 때 걸렸다고 확진판정이 날 확률. 정밀도. P(theta) 가 한번 계산하면 ->..

    AITech 학습정리-[DAY 10] 시각화 / 통계학

    얘는 사진이 너무 많아 잘려서 링크 남김 https://lightsg2.blogspot.com/2021/01/aitech-day-10.html =========================== 학습내용 시각화 도구 matplotlib 다양한 그래프 지원. pandas 연동 - pyplot 객체를 사용하여 데이터를 표시 - pyplot 객체에 그래프들을 쌓은 다음 flush - Matplotlib는 Figure 안에 Axes 로 구성 - Figure 위에 여러 개의 Axes를 생성 x, y 리스트 순서 잘 맞춰서 그리는거 걍 필요할 때 마다 공식홈피 보거나 검색해봐라 seaborn - 기존 matplotlib에 기본 설정을 추가 - 복잡한 그래프를 간단하게 만들 수 있는 wrapper - 간단한 코드 + ..

    AITech 학습정리-[DAY 9] Pandas II / 확률론

    ====================== 학습내용 pandas II Groupby 1 df.groupby("Team")["Points"].std() h_index = df.groupby(["Team", "Year"])["Points"].sum() Team Year Devils 2014 863 2015 673 Kings 2014 741 2016 756 2017 788 Riders 2014 876 2015 789 2016 694 2017 690 Royals 2014 701 2015 804 kings 2015 812 Name: Points, dtype: int64 h_index.index MultiIndex([('Devils', 2014), ('Devils', 2015), ( 'Kings', 2014), ( ..

    AITech 학습정리-[DAY 8] Pandas I / 딥러닝 학습방법 이해하기

    =========================== 학습내용 pandas 구조화된 데이터의 처리를 지원하는 Python 라이브러리 Python 계의 엑셀 data는 value 라고 부르기도 한다함. 기본적인걸 알아보자.. Series Series : DataFrame 중 하나의 Column에 해당하는 데이터의 모음 Object. 걍 header를 포함한 column 한줄을 뜻하는듯 DataFrame : Data Table 전체를 포함하는 Object list_data = [1,2,3,4,5] list_name = ["a", "b", "c", "d", "e"] example_obj = Series(data = list_data, index = list_name) dict_data = {"a":1, "b":2..

    AITech 학습정리-[DAY 7] 경사하강법

    =================================== 수업내용 [AI Math 3강] 경사하강법(순한맛) 내가 옛날에 배웠던 그 미분정의. import sympy as sym from sympy.abc import x print(sym.poly(x**2 + 2*x + 3)) print(sym.diff(sym.poly(x**2 + 2*x + 3))) grad_equation = sym.diff(sym.poly(x**2 + 2*x + 3)) print(grad_equation.subs(x,2)) # x에 2를 대입 Poly(x**2 + 2*x + 3, x, domain='ZZ') Poly(2*x + 2, x, domain='ZZ') 6 기울기를 알면 어느방향으로 가야 함수값이 증가하는지/감소하는지..

    AITech 학습정리-[DAY 6] Numpy / 벡터 / 행렬

    =============================== 수업내용 Numpy 이걸 다 순수 파이썬으로? 너무 힘들고 느려.. numpy Numerical Python - 일반 List에 비해 빠르고, 메모리 효율적 - 다양한 기능 제공 - 반복문 없이 데이터 배열에 대한 처리를 지원함 (파이썬 라이브러리를 활용한 데이터 분석) conda install numpy ndarray import numpy as np test_array = np.array([1,4,"5",8], float) - 하나의 데이터 타입만 가능 - dynamic typing not support numpy는 순수 python과 달리 숫자 주소값이 아니라 값 자체를 저장해서 빠르고, 공간이 정해져 있어서 효율적 print(test_arr..