용나리 2021. 12. 1. 00:28

피어세션

supervised 는 미래예측 불가능. 강화학습 슬슬 시도하는것 같아 이쪽도 공부하는게 좋을듯.
지금 주식하는건 강화학습으로 해보고 있음. 시가, 주가, 거래량, ... 기본 데이터와 기본적인 기술과. 강화학습은 최적화 목적이지 supervised 처럼 정답을 찾는게 목적이 아니라. '잘했다'라는걸 label 하는게 힘들었음. 그래서 reward 개념으로 label 없이 할 수 있다는게 좋은듯. 애초에 강화학습 자체가 markov chain. 요새 강화학습은 다 딥러닝 써서 이거 끝나고 쉽게 할 수 있을듯. 딥러닝이랑 강화학습이 결합된 DeepRL. CV랑 강화학습 결합한 쿠키런 자동으로 해주는거.

TTA는 test data에도 train data 보내줘서 평가하는 data 2개를 만들고 같이 평가.

batch_size의 배수로 num_workers 해주는게 좋은듯. 개념상.

상건 2

시간에 대한 방정식은 함수값으로 절때 안나온다. 시간에 대한 식으로 output이 안나온다는게 증명되어있음. 금융수학.
인공지능 한건 손해는 안봤다.

SW 삼성 마에스트로 지원 많이 해준다.

행동

지금 사용하는 서버 shared memory가 1GB다. 그래서 num_workers 는 2로 설정하는게 나은듯.

실험적으로 돌린 timm-regnety_120 PB 0.61나옴.

Unet은 단일분류 할때 좋지 이런 segmentation에선 별로라는 듯. 그냥 deeplabv3 쓰는게 최고.

HueSaturationValue 안좋은듯. A.Rotate(limit=30) 좋은듯.