강의내용

(10강) Nvidia GPU를 위한 TensorRT, DALI

내용이 많으니 기본적으로는 그냥 pdf를 보자.

여기선 그냥 메모만 함.

기본적으로 pytorch → ONMX → TensorRT의 과정을 거침. ONMX가 애초에 이런 목적으로 만들어진 프로젝트다.

하지만 사전 작업이 좀 필요하고 맞춰서 고쳐야 할 수도 있음.

레트론 이라는 모델 시각화 라이브러리가 있다.

특이한건 batch size도 있는데 각 환경마다 적절한 batch size를 설정해야 하기 때문인듯.

갈수록 커지는 두 하드웨어의 격차.. GPU가 CPU 대신 일하게 할 수 없을까. 지금 하는 프로젝트만 해도 CPU는 항상 100%인데 GPU는 놀고있다.

CPU에서 전부 이루어지는 preprocessing이 가능한 연산들을 GPU에서 수행

이상적인 값만큼 빨라짐.

이미 좀 구현되어 있다.

이미지 preprocessing만으론 이만큼 차이남.

그럼 모델 훈련, inference 하는거는?

약간의 노력으로 매우 효과가 나타나니 안할 이유가 없다.

그러나?

개인적 정리 (0)	2021.12.05
P-stage4 정리 (0)	2021.12.05
P-stage4 [day12] (9강) 모델최적화기법(3); Quantization 실습 (0)	2021.12.05
P-stage4 [day11] (8강) 모델 최적화 기법(3) : Quantization 이론 (0)	2021.12.05
P-stage4 [day8] (0)	2021.12.05