brainage.egloos.com

포토로그



구글 문서도구의 OCR기능 - 그림을 한글파일로 by 천하귀남

구글 문서도구에 파일을 업로드할때 옵션으로 이미지의 경우에 문자인식을 걸수 있습니다. 방금 테스트 해보니 그럭저럭이군요.

스마트폰 카메라로 찍어서 인식시켜보니 이정도로 큼직하게만 찍으면 잘 인식하는군요. 

추가적인 실험을 좀더 해보기는 해야겠습니다. DSLR이나 일본어 영어등에 대한 소스가 필요할듯 하군요.
스마트폰 결과로 보건데 좀더 고해상도의 촬영 결과를 적절한 이미지 프로세싱을 거쳐 올린다면 상당한 수준의 인식결과를 볼수 있을듯 합니다. 특히나 일본어나 영어쪽에 대한 기대가 크군요. ^^

덧글

  • 애쉬 2011/04/09 10:30 # 답글

    음성 검색에 이어...구글은 놀라운 것만 만드는군요 +_+)/

    저게 맛폰에 표준 탑재가 되면... 스트리트 셀카 찍으면서 안내문이나 표지판 번역 받아 해외여행하는 일도 꿈이 아니겠군요
    음성인식도 얼른 번역기랑 연동되었으면 좋겠어요
  • 애쉬 2011/04/09 10:33 #

    잠깐 그렇다면....
    시험기간 중앙도서관에서 맛폰으로 원서를 찍어서 번역해대는 통에 열람실이 셔터음으로 시끄럽다던지;;;;
    공부할 때 시끄럽다고 셔터음 없애달라는 요구가 생길지 모르겠군요

    그래서 구글은 사생활침해샷과 번역공부샷을 기술적으로 분별해낼수 있는 솔루션을 연구하게되는데...(어이 어이 아침부터 너무 길잖나 망상이...)
  • 차원야옹자 2011/04/09 10:34 #

    도서관에는 스케너라는 좋은 장비가 있습니다.

    그렇다면 시험기간에 스케너에 사람들이 줄지어서 원서를 스캔하는 통에 컴퓨터실이 스캔소리로 시끄럽다던지
    00자료 스캔뜬거 공유욬 하면서 학교 자유게시판에 올리는 요구가 생길지 모르겠군요.
    (...죄송합니다. 저도 어제 늦잠을 잤더니 머리가 어지럽네요)
  • 천하귀남 2011/04/09 10:57 #

    실제로 제대로 쓰기 위해서는 디카가 있다면 될듯합니다. 특히나 문서촬영기능을 가진 디카라면 장난아닌 결과를 보여줄겁니다.
    여기에 고화소 디카라면 페이지당 들어가는 글자수도 많이 늘릴수 있습니다. 또 손떨림 보정기능이 있으니 아무래도 이쪽이 유리하지요.

    다만 도서관에서 스캐닝은 불법입니다. 법률조항은 도서관에서 디지털 복제 불가입니다. 다만 필요한 내용일부를 사진찍는 정도는 봐주는듯 합니다.
  • 톨바인 2011/04/11 09:39 #

    http://bikblog.egloos.com/3525786

    아직 스페인어 => 영어 뿐이긴 한데... 솔직히 좀 무섭습니다... =_=
    이제 캠코더을 앞에 두고 사람이 말하면 자동으로 번역되서 상대방 화면에 말풍선이 뜨는 날이
    머지 않은듯 ???
  • 천하귀남 2011/04/11 10:11 #

    구글 고글스가 그런것인데 해보니 이건 아직 인식률이 좀 애매 하더군요 ^^;
  • 차원야옹자 2011/04/09 10:33 # 답글

    네이버 ocr을 써보려고 하니 이것저것 따지던게 너무 많더군요.(대비가 안맞아서...으허헝.)
    스캔만 떠두고 안쓴 책들이 많은데 한번 해봐야겠습니다
  • 차원야옹자 2011/04/09 10:40 #

    죄송한데. 한가지 여쭙겠습니다. 문서도구상에서 '이미지'에서 이미지를 올려야 저렇게 되는건가요?아니면 '문서'에 이미지를 올려야 저렇게 되나요?
  • 천하귀남 2011/04/09 10:58 #

    네이버 OCR에 비하면 정말 수준이냐 용량이 만족스럽습니다.
    문서도구상에서 업로드로 이미지를 올릴때 아래부분에 체크옵션이 있습니다. ^^
  • 차원야옹자 2011/04/09 10:59 #

    아...'이미지'에서 해매고 있었는데...혹시나 한게 맞았군요. 감사합니다
  • farewell 2011/04/09 11:14 # 답글

    다만 한자는 인식을 못하네요... 영어나 일본어는 인식률이 좋겠지만 한글은 그다지 좋아보이지 않네요.
  • 천하귀남 2011/04/09 11:20 #

    아무래도 한글은 크기가 좀 걸립니다. 한자의 경우 중국어 간체만 지원하는데 우리가 사용하는건 번체입니다. 이건 인식률이 개판이긴 합니다.
    좀더 추가적인 실험이 필요합니다.
  • 계란소년 2011/04/09 12:40 # 답글

    PDF를 한번 해보려 했으나...용량 제한이 아직 심하더군요.
  • 천하귀남 2011/04/09 12:47 #

    그게 되준다면 정말 좋을듯 한데 여러사람 밥줄에 문제가 될듯하니 뭔가 제한을 걸긴 할겁니다. ^^;
  • 보리차 2011/04/09 16:38 # 답글

    원문의 주 내용과는 무관계하지만, 병법을 논함에 있어 度를 좇으로 바꿔버린 부분에 살짝 웃었습니다. ^^ OCR 인식기는 물론이거니와 한자를 처음 본 사람의 눈에도 度는 좇같이 보일 수 있으리라는 생각이 듭니다...
  • 천하귀남 2011/04/09 17:33 #

    아무래도 구글이 서양쪽이다 보니 한문서안에 다양한 문제를 표시하는 경우에 대한 고려가 부족한듯 합니다. ^^
    동아시아의 한중일이면 아무래도 문서안에 한자나 영어단어가 많이 끼어들기도 하는데...
댓글 입력 영역
* 비로그인 덧글의 IP 전체보기를 설정한 이글루입니다.

구글 애널리틱스

통계 위젯 (화이트)

150154
1484
5937291

이 이글루를 링크한 사람 (화이트)

409

당부드리는 말

블로그 사진을 포함한 전체가 아닌 일부의 내용은 얼마든지 사용하셔도 상관없습니다.

상대방을 존중하는 생각이 있다면 욕설과 과도한 비아냥은 자제를 부탁드립니다. 정도가 심하거나 비로그인의 글은 임의 삭제 가능함을 알려드립니다.

A타입 클린 캠페인 위젯

방문자

Map