- 합성 데이터
- SynthText ( Depth Estimation -> 적절한 위치에만, 표면 모양에 맞춰서 글자를 합성 )
- SynthText3D ( 3D 가상 세계를 이용한 텍스트 이미지 합성 )
- UnrealText (3D, 개선된 Viewfinding)
- Data Augmentation
- Geometric Transfoemation 할때 성능 감소 -> 개체 잘림 방지, 최소 1개 개체 포함 Rule
- loss 가 크게 발생하는 영역들을 분석해서 Rule 업데이트하는 피드백 필요
- Multi-Scale Training & Inferance
- Naive Multi-Scale Training -> 원래 작은 글자가 작아지거나, 원래 큰 글자가 너무 커지는 경우 발생
- SNIP - Scale Normalization for Image Pyramid -> 크기가 적정 범위 벗어난 개체 학습 제외
- Naive Multi-Scale Inference -> 계산량 많아져 비효율
- Adaptive Scaling
- Downsizing 으로 축소된 버전의 이미지를 만든다.
- 축소된 이미지를 모델에 입력해서 scale mask와 seg mask를 예측
- 이미지를 재구성해서 "Canonical KnapSack"을 만든다.
- Canonical KnapSack을 모델에 입력해 글자 검출 수행
'부스트캠프 AI Tech > 데이터 제작' 카테고리의 다른 글
[9] Advanced Text Detection Models (0) | 2021.11.24 |
---|---|
[8] Annotation 도구 소개 (0) | 2021.11.18 |
[7] 성능 평가 방식 (0) | 2021.11.17 |
[6] Annotation Guide (0) | 2021.11.16 |
[5] 데이터 소개 (0) | 2021.11.16 |