아하 로고
검색 이미지
전기·전자 이미지
전기·전자학문
전기·전자 이미지
전기·전자학문
까칠한호저172
까칠한호저17223.02.10

ocr기술의 원리는 무엇인가요?

글자를 자동으로 읽어서 옮겨주는 ocr기술이 점점 많이 사용되고있고 활용영역이 굉장히 넓은 것 같습니다. 그렇다면 ocr기술은 어떻게 글자를 읽는 것인가요?

  • 탈퇴한 사용자
    탈퇴한 사용자23.02.10

    안녕하세요. 과학전문가입니다.

    OCR 엔진 또는 OCR 소프트웨어는 다음 단계를 사용하여 작동합니다.

    1. 이미지 획득:스캐너를 통해 문서를 읽어들여 이진 데이터로 변환합니다.

    2. 전처리:OCR 소프트웨어는 먼저 이미지를 정리하고 오류를 제거하여 읽을 수 있도록 준비

    3. 텍스트 인식:패턴 매칭 및 특징 추출

    4. 패턴 매칭:패턴 매칭은 글리프라고 하는 문자 이미지를 격리해서 유사하게 저장된 글리프와 비교하여 작동

    5. 특징 추출:특징 추출은 글리프를 선, 닫힌 고리, 선 방향 및 선 교차와 같은 특징으로 나누거나 분해

    6. 후처리:분석이 끝나면 시스템은 추출된 텍스트 데이터를 컴퓨터 파일로 변환