상세 컨텐츠

본문 제목

이미지 텍스트 추출 얼마나 잘되는지 테스트해봤어요. 영어,일어,한문,수식?

소중한 오늘

by better루시아 2022. 10. 6. 16:16

본문

어제 스마트폰으로 촬영한 사진 이미지에서 텍스트를 추출하고, 번역하고, 또 사진 이미지 안의 사물을 쇼핑링크까지 안내하는 기능을 보고 신기해하며 글을 올렸습니다. 오늘, 몇가지 더 궁금한 것들이 생겨서 텍스트 추출이 얼마나 잘되는지 테스트해봤어요. 

 

[추가링크] 먼저 올렸던 사진갤러리 기능들입니다. 

https://lucia.tistory.com/187

 

사진갤러리에서 이런게 되네! [1탄] 텍스트추출/번역,이미지검색

나의 오래된 갤럭시야. 그 동안 사진찍고, 화면캡춰나 하면서 사용해서 정말 미안하구나. 이렇게나 재주꾼인것을 이제야 알아서 부끄러운데, 혹여 아직 안써본 분들 계실까하여 공유해야겠다.

lucia.tistory.com

 

https://lucia.tistory.com/188

 

사진갤러리에서 이런게 되네! [2탄] 사진 속 물건 쇼핑

사진이 많아서, 앞글에 이어서 작성합니다. 이전 글에서는 텍스트 추출, 번역, 유사 이미지 검색 등을 살펴봤어요. 다음 링크를 참고하세요.  https://lucia.tistory.com/187 사진갤러리에서 이런게 되네

lucia.tistory.com

 

 

 테스트 1 : 한글+영어

예상했던 것처럼, 아주 잘됩니다. 특수기호도 괜찮고, 영문 오타도 몇자 안되지만 없습니다. 다만, 선택영역을 문장 끝까지로 설정했었는데 뒷부분이 잘려서 나왔습니다. 이렇게 추출한 텍스트는 네이버메모에 붙여봤습니다. 편하신 어플로 옮겨 편집하시면 되겠습니다. PC로 옮기는 것이라면 카톡이 제일 편하지 않을까 싶습니다. 

 

 

"~ 떨쳐 버리도록 했다." 여기까지 선택했는데, 뒷부분이 잘려 나왔습니다. 어떤 경우는 줄바꿈을 위로 올려서 추출하고 또 어떤 경우는 원문과 똑같이 줄바꿈을 하는데, 이건 어떤 설정이 별도로 있는 것인지 확인 못했습니다. 

 

 

 

 

 테스트 2 : 한글+한문

점자봉사를 할때도 한문이 참 손이 많이 갔었는데, 다음 예시에서도 한문이 많지 않은데도 생략된 글자가 나왔습니다. 

 

 

빨간 체크표시는 한자 오류 부분입니다. 한글자가 특수문자 괄호와 함께 빠졌습니다. 흐린 체크 표시는 띄어쓰기 오류 부분입니다. 이 부분은 모두 원래 원문에서는 줄바꿈이 있었던 부분인데 윗줄로 당겨 편집되면서 한칸씩 다 띄어쓰기가 되버렸습니다. 이런 경우, 오히려 띄어쓴 부분 찾기가 어려워서 차라리 위에서처럼 본문과 같게 줄바꿈 해주는 것이 나을 것 같습니다. 

 

 

 

 

 테스트 3 : 일본어

일본어부분입니다. 일본어표기 오류는 없었는데, 편집시 붙은 1,2,3,4 번호가 잘못들어갔습니다. 한번 교정은 봐줘야하지만, 이 정도만 해줘도 일이 훨씬 쉬워지겠습니다. 

 

 

 

● 테스트 4 : 설마.....수식도 되나?

안될꺼라 생각하면서도 혹시 되면 정말 좋겠다는 맘으로 해봤습니다. 네, 안됩니다. ㅠㅠ

그래도, 그래도, 될지도 몰라 하면서. 네이버메모서 실패하고 오피스워드에도 붙여봅니다. 

네, 다 안됩니다. 수식은 수식편집기 써서 다 입력해줘야 하나 봅니다. 혹시 필기체 인식으로 되려나 궁금해집니다.

 

 

네이버메모 > 깨집니다. 

 

오피스 워드 > 깨집니다. ㅠㅠ

반응형

관련글 더보기