아핫뉴스실시간 인기검색어
아핫뉴스 화산 이미지
아하

취미·여가활동

책·독서

은근히희망적인삼겹살
은근히희망적인삼겹살

OCR 에 대해서 질문드립니다. 이거 어떻게 쓰는거에요?

OCR이 대충 종이로 인쇄된거 pdf로 스캔떠서 그 글자를 인식한다는건 이해 했는데... 정확히 어떤 분야에서 쓰이는건지....요즘 ai 딥러닝 기술이 발전하면서 OCR이 편해 졌다던데 이건 또 무슨소리인지, 정확도가 높은 OCR할려면 어떤 프로그램을 써야하는건지, OCR은 한국어 인식이 잘 안된다고 하던데 뭐땜에 그런건지, OCR로 그래프 같은것 도 인식 시킬수 있는지 궁금합니다!

55글자 더 채워주세요.
2개의 답변이 있어요!
  • 안녕핑핑아
    안녕핑핑아

    OCR은 다양한산업과 일상에서 사용됩니다

    행정/기업: 종이 문서를 디지털화해서 검색 가능하게 만듦 (예: 주민등록등본, 계약서).

    금융/보험: 통장 사본, 청구서, 영수증에서 정보 추출.

    의료: 진단서, 처방전 정보 추출.

    교육/연구: 논문 스캔본을 텍스트로 변환해서 분석.

    모바일 앱: 명함 스캔, 문자인식 번역기, 영수증 정리 등

    딥러닝기술의 발전으로 인한 변화

    예전에는 단순한 규칙 기반 OCR이 대부분이라 글꼴, 배경, 기울기에민감했습니다

    지금은 CNN, Transformer 같은 딥러닝 기반 모델 덕분에:

    손글씨, 다양한 글꼴, 기울어진 텍스트도 잘 인식 배경 노이즈나 이미지 품질이 낮아도 비교적 정확히 인식

    한국어, 일본어 같은 비영어권 언어도 더 잘 인식가능해졋습니다

    정확도높은 OCR프로그램

    ABBYY FineReader

    Google Cloud Vision API

    한국어OCR이 어려운이유

    문자 수가 많고 조합이 복잡함 (초성-중성-종성 조합)

    띄어쓰기 오류 등으로 문맥 파악이 어려움

    OCR로 그래프도 인식할수있는가

    그래프를 인식하려면 Chart/Graph Recognition이라는 별도 기술이 필요

    요즘은 그래프 이미지에서 데이터를 추출하는 AI 도구들도 나왔습니다

    PlotDigitizer, WebPlotDigitizer

  • OCR은 종이 문서나 사진 속 글자를 컴퓨터가 읽을 수 있는 텍스트로 바꿔주는 기술이에요. 은행에서 신분증이나 통장 정보를 자동으로 입력할 때, 병원에서 진료 기록을 전산화할 때, 회사에서 계약서나 영수증을 정리할 때, 또 학교에서 책이나 논문을 검색할 수 있게 만들 때 등 정말 다양한 곳에서 쓰입니다. 요즘은 AI랑 딥러닝 기술이 좋아져서 흐릿한 글씨나 손글씨, 복잡한 표도 예전보다 훨씬 잘 인식해요.

    한글은 자음과 모음이 따로 떨어져 있거나, 글자 모양이 비슷해서 인식이 어려운 경우가 있었는데, 최근에는 네이버 클로바 OCR이나 ABBYY 같은 프로그램들이 한글도 꽤 정확하게 읽어내요. 그래프나 표 같은 건 완벽하게 텍스트로 바꾸긴 어렵지만, 표 구조까지 어느 정도 인식해주는 프로그램도 점점 늘고 있어요. OCR 결과가 마음에 안 들 때는, 인식된 텍스트를 한 번 더 확인하고 수정해주는 게 좋습니다.