brainage.egloos.com

포토로그



구글을 이용한 OCR - 정말 잘 됩니다. by 천하귀남

구글 드라이브에 이미지를 올리고 해당 이미지를 오른쪽 클릭해 구글 문서로 전환하면 이미지에 OCR을 걸어 텍스트를 추출하는 기능이 있습니다. 예전에는 좀 문제가 있었는데 2~3년 지난 지금은 어떤가 해서 다시 한번 해봅니다.

과거에는 일본어 세로쓰기 인식이 안되거나 스캐너로 긁은 문서는 몰라도 스마트폰 이미지는 인식이 불량한 경우도 있고 한자는 난이도가 높아 여러모로 불편했습니다. 헌데 최근에 구글 번역앱의 사진 인식 쪽은 매우 잘 되길래 기계학습 이용해 개선했나 싶더군요. 당연히 이 기술이 구글문서로 전환하는 OCR에도 적용 되었을 거라 봤습니다.

일단 동네 도서관에서 일본어 페이지를 하나 찍어 왔습니다. 테스트에는 가로 2000픽셀 넘는 원본으로 올려봤는데 잘 되더군요.  

오자 없이 거의 완전하게 뽑히는군요. 이제 저 내용을 구글 번역으로 복사해 붙이면 번역이 나올 겁니다. 구글 번역의 일본어 품질은 오래전부터 나름 잘 되는 편이니 이건 따로 테스트 안 했습니다.
여하간 기술 발전은 참 좋습니다. 

이런 제대로된 책 말고 이미지 위에 올린 글자라던가 하는 부분도 테스트해 보긴 해야 겠군요. 짧은 단문의 경우 번역앱쪽이 더 편리하긴 합니다. 요즘은 모니터 상에 나오는 글자도 번역앱의 사진 번역으로 보는 경우도 있습니다.

덧글

댓글 입력 영역
* 비로그인 덧글의 IP 전체보기를 설정한 이글루입니다.

구글 애널리틱스

통계 위젯 (화이트)

1401622
8355
5886191

이 이글루를 링크한 사람 (화이트)

409

당부드리는 말

블로그 사진을 포함한 전체가 아닌 일부의 내용은 얼마든지 사용하셔도 상관없습니다.

상대방을 존중하는 생각이 있다면 욕설과 과도한 비아냥은 자제를 부탁드립니다. 정도가 심하거나 비로그인의 글은 임의 삭제 가능함을 알려드립니다.

A타입 클린 캠페인 위젯

방문자

Map