본문 바로가기

부스트캠프 AI Tech

(58)
[03] Model Serving Online Serving 단일 데이터를 받아 실시간을 에측을 하는 문제. ex) 기계 고장 예측 모델, 음식 배달 소요 시간 에측 직접 API 웹 서버 개발 : Flask, FastAPI 클라우드 서비스 활용 : AWS의 SageMaker, GCP의 Vertex Ai 등 Serving 라이브러리 활용 : Tensorflow Serving, Torch Serve, MLFlow, BentoML 등 바로 Serving 라이브러리를 활용해 개발하는 것보다 프로토타입, FastAPI 서버 개발을 먼저 해봐서 여러가지 방법 중 이 방법을 왜 선택하는지에 대한 인식을 키우는 것이 중요하다. 오픈소스는 계속 개발되고 있기 때문에 너무 라이브러리에 종속되지 말 것. Serving 할 때 Python 버전, 패키지 버전..
[02] MLOps 개론 MLOps 란? 머신러닝 모델을 운영하면서 반복적으로 필요한 업무를 자동화 시키는 과정 머신러닝 모델 개발(ML Dev)과 머신러닝 모델 운영(Ops)에서 사용되는 문제, 반복을 최소화하고 비즈니스 가치를 창출하는 것이 목표 빠른 시간 내에 가장 적은 위험을 부담하며 아이디어 단계부터 Production 단계까지 ML 프로젝트를 진행할 수 있도록 기술적 마찰을 줄이는 것 Research와 Production 차이 MLOps 학습 방법 -> 문제를 해결하기 위한 방법으로 어떤 방식을 활용 할 지.. 모든 것을 학습하는 것은 ㄴㄴ MLOps Component - Infra 클라우드 : AWS, GCP, Azure, NCP .. 온 프레미스 : 회사나 대학원의 전산실에 서버를 직접 설치 MLOps Compon..
[01] Product Serving 개론 라이브러리가 왜? 만들어졌는지 집중하기 Special Misson 모두 진행하는 것을 추천 강의는 1회만 수강하고 전체적인 흐름파악, 키워드 필기하면서 수강하기 강의 자룔를 통해 복습
[00] 피어세션 정리 21.12.06 16:00 피어 세션 요약 회의사항 project serving - app으로 구현 공부해보고 잘 안되면 web 으로 다음 주 강의 참고 하면 될 것 같다. 분업 modeling : 정승균, 김원석 serving : 정효찬, 조준희, 한태호 21.12.07 16:00 피어 세션 요약 회의사항 Voila 설치 오류 해결 방법 공유 torch lighting 써보면 좋을 것 같다. 최종프로젝트 - 웹 기반 앱개발 고려 Special Mission 해결 공유 → 금요일 피어세션
[03] 좋은 모델과 파라미터 찾기 : AutoML 이론 모델 구조, 하이퍼 파라미터 train & eval 과정 -> End-to-end AutoML 일반적인 AutoML pipeline Bayesian Optimization Hyperparameter Optimization manual search 직관에 의해서 hyperparameter를 바꿔가며 대입하는 방식이다. grid search 가능한 hyperparameter 경우의 수를 일정구간으로 나눠서 구간별로 균일하게 대입해보는 방식이다. random search 가능한 hyperparameter 조합을 random하게 선택해서 대입해보는 방식이다. 더보기 보통 grid search나 random search가 주로 쓰이는데, 이 둘의 문제는 다음 hyperparameter 후보를 찾는 과정에서 이제까..
[02] 대회 및 데이터셋 소개 경량화의 다양한 관점 : 포커스를 어디에 둘까 ? 모델크기(=파라미터 수) 속도 연산횟수 (FLOPs) MACs (Multiply-accumulate operations) 합, 곱 연산의 횟수 MACs ~= 0.5 FLOPs 속도를 측정하기 어려운 상황에서의 대한 속도에 영향을 주는 요소에 대한 insight ( ShuffleNetv2 논문 ) FLOPs 이외의 Memory Access Cost 관점에서 속도에 영향을 주는 요소를 고려 입 출력의 채널 크기가 동일 o 큰 Group convolution x 여러 분기의 path가 나오는 구조는 병렬화에 악영향 Element-wise operation은 무시하지 못할 비중을 가짐 https://arxiv.org/abs/1807.11164v1 ShuffleN..
[01] 모델 경량화 개요 경량화의 목적 On device AI Power usage RAM Memory usage Storage Computing power AI on cloud Latency ( 요청 처리 시간) Throughput ( 단위 시간 당 처리 가능 요청 수 ) 경량화, 최적화 종류 네트워크 구조 관점 Efficient Architecture Design(+AutoML; Nerual Architecture Search(NAS)) Network Pruning : 찾은 모델 줄이기 ( 일반화하여 적용하기 아직 까진 어렵다 ) 중요도가 낮은 파라미터를 제거하는 것 좋은 중요도 ? -> loss gradient크면 등등 Structured Pruning : 파라미터를 그룹 단위 ( channel / filter, layer..
[00] 피어세션 / 학습 회고 / 수행 과정 / 결과물 중간 정리 21.11.23 16:00 피어 세션 요약 회의사항 경량화 대회 관련 토의 model: squeezenet, mobilenet, mux net ( https://github.com/human-analysis/MUXConv ) 등 baseline model train 걸리는 시간: 약 2시간 100 epoch 관련 자료1: https://paperswithcode.com/sota/image-classification-on-imagenet 관련 자료2: https://hongl.tistory.com/253 Temporal Convolutional Network (TCN) Transformer 모델이 등장하기 전에는 자연어처리, 시계열 데이터 처리 등에는 RNN의 LSTM/GRU 모델이 압도적으로 많이 사용되..
[10] Bag of Tricks 합성 데이터 SynthText ( Depth Estimation -> 적절한 위치에만, 표면 모양에 맞춰서 글자를 합성 ) SynthText3D ( 3D 가상 세계를 이용한 텍스트 이미지 합성 ) UnrealText (3D, 개선된 Viewfinding) Data Augmentation Geometric Transfoemation 할때 성능 감소 -> 개체 잘림 방지, 최소 1개 개체 포함 Rule loss 가 크게 발생하는 영역들을 분석해서 Rule 업데이트하는 피드백 필요 Multi-Scale Training & Inferance Naive Multi-Scale Training -> 원래 작은 글자가 작아지거나, 원래 큰 글자가 너무 커지는 경우 발생 SNIP - Scale Normalization ..
[9] Advanced Text Detection Models DBnet 글자영역 경계부분에서만 높은 임계치 ! 나머지 영역은 낮은 임계치 ! 글자영역은 경계부분을 제외한 영역으로 정의 ( PSNet ) 임계치 맵 미분 가능, Back propagation 가능하게 이진화에 가까운 함수 정의 MOST TFAM ( Text Feature Aligned Module ) Position-Aware NWS -> 실제 경계에서 가까운 곳 가중치를 줘서 merge 시 정확도 향상 TextFuseNet 글자하나 Instance segmentation 기반 방법의 단점 : 글자가 끊기거나 가려져 있는 경우 -> 보완 이미지 전체에서 글자 영역을 추출하는 Global Level Feature