본문 바로가기

부스트캠프 AI Tech/데이터 제작

[3] OCR Technology and Services

  • OCR ( Optical Character Recognition ) 글자 인식
  • 글자 검출과 객체 검출과의 차이점
    • 영역의 종횡비
    • 객체 밀도
    • 글자 검출은 class가 text 하나 !
  • OCR 전체적인 구조

 

  • Detector
    • 이미지 입력에 글자 영역 위치가 출력인 모델
  • Recognizer
    • CV와 NLP 교집합 영역 ( CNN / RNN )
    • 글자 인식
  • Serializer
    • OCR의 결과값을 자연어 처리하기 편하게 일렬로 정렬하는 모듈
    • EX) 단락을 어떻게 묶을지, 정렬할지
    • Serializer 의 결과값을 입력으로 받는 자연어 처리 모듈을 뒤에 붙여서 사용 가능
  • Parser
    • 기 정의된 key 들에 대한 value 추출
    • ex) 신분증, 계산서, 카드 등 인식
  • OCR 적용 기술들
    • Google photo, 수기 입력 대체 등..

'부스트캠프 AI Tech > 데이터 제작' 카테고리의 다른 글

[6] Annotation Guide  (0) 2021.11.16
[5] 데이터 소개  (0) 2021.11.16
[4] Text Detection  (0) 2021.11.15
[2] 데이터 제작의 중요성 Ⅱ  (0) 2021.11.15
[1] 데이터 제작의 중요성 Ⅰ  (0) 2021.11.15