본문 바로가기

부스트캠프 AI Tech/데이터 제작

[10] Bag of Tricks

  • 합성 데이터
    • SynthText ( Depth Estimation -> 적절한 위치에만, 표면 모양에 맞춰서 글자를 합성 )
    • SynthText3D ( 3D 가상 세계를 이용한 텍스트 이미지 합성 )
    • UnrealText (3D, 개선된 Viewfinding)

  • Data Augmentation
    • Geometric Transfoemation 할때 성능 감소 -> 개체 잘림 방지, 최소 1개 개체 포함 Rule
    • loss 가 크게 발생하는 영역들을 분석해서 Rule 업데이트하는 피드백 필요
  • Multi-Scale Training & Inferance
    • Naive Multi-Scale Training -> 원래 작은 글자가 작아지거나, 원래 큰 글자가 너무 커지는 경우 발생
    • SNIP - Scale Normalization for Image Pyramid -> 크기가 적정 범위 벗어난 개체 학습 제외
    • Naive Multi-Scale Inference -> 계산량 많아져 비효율
    • Adaptive Scaling
      • Downsizing 으로 축소된 버전의 이미지를 만든다.
      • 축소된 이미지를 모델에 입력해서 scale mask와 seg mask를 예측
      • 이미지를 재구성해서 "Canonical KnapSack"을 만든다.
      • Canonical KnapSack을 모델에 입력해 글자 검출 수행

'부스트캠프 AI Tech > 데이터 제작' 카테고리의 다른 글

[9] Advanced Text Detection Models  (0) 2021.11.24
[8] Annotation 도구 소개  (0) 2021.11.18
[7] 성능 평가 방식  (0) 2021.11.17
[6] Annotation Guide  (0) 2021.11.16
[5] 데이터 소개  (0) 2021.11.16