- OCR ( Optical Character Recognition ) 글자 인식
- 글자 검출과 객체 검출과의 차이점
- 영역의 종횡비
- 객체 밀도
- 글자 검출은 class가 text 하나 !
- OCR 전체적인 구조
- Detector
- 이미지 입력에 글자 영역 위치가 출력인 모델
- Recognizer
- CV와 NLP 교집합 영역 ( CNN / RNN )
- 글자 인식
- Serializer
- OCR의 결과값을 자연어 처리하기 편하게 일렬로 정렬하는 모듈
- EX) 단락을 어떻게 묶을지, 정렬할지
- Serializer 의 결과값을 입력으로 받는 자연어 처리 모듈을 뒤에 붙여서 사용 가능
- Parser
- 기 정의된 key 들에 대한 value 추출
- ex) 신분증, 계산서, 카드 등 인식
- OCR 적용 기술들
- Google photo, 수기 입력 대체 등..
'부스트캠프 AI Tech > 데이터 제작' 카테고리의 다른 글
[6] Annotation Guide (0) | 2021.11.16 |
---|---|
[5] 데이터 소개 (0) | 2021.11.16 |
[4] Text Detection (0) | 2021.11.15 |
[2] 데이터 제작의 중요성 Ⅱ (0) | 2021.11.15 |
[1] 데이터 제작의 중요성 Ⅰ (0) | 2021.11.15 |