- OCR 학습 및 평가 데이터
- Public Dataset
- Kaggle
- RRC (2년마다 열리는 OCR 전문 대회)
- 논문 Arixv (ai 논문), icdar (ocr)
- Datatang(데이터 유료 구매)
- OCR 데이터에 포함되는 것들
- don't care의 transciption ### 로 표시
- 다양한 annotation format 존재 (json, xml, csv) -> 통합 UFO(Upstage Format for OCR)
'부스트캠프 AI Tech > 데이터 제작' 카테고리의 다른 글
[7] 성능 평가 방식 (0) | 2021.11.17 |
---|---|
[6] Annotation Guide (0) | 2021.11.16 |
[4] Text Detection (0) | 2021.11.15 |
[3] OCR Technology and Services (0) | 2021.11.15 |
[2] 데이터 제작의 중요성 Ⅱ (0) | 2021.11.15 |