HOME자료실역대 수상작

역대 수상작

The World Embedded software Contest 2024

[2009년] 장려상 - 실사 촬영 영상에서의 문자 추출 및 인식 기술

분류명
정부 시상
훈격
KESIC회장상
- 팀명 : Compilot
- 소속 : 비트교육센터
- 참가부문 : 자유 공모
- 개요
OCR(Optical Character Recognition)은 인쇄되거나 손으로 쓴 글씨들을 컴퓨터로 인식하는 기술이다. OCR 기술에 관한 연구는 1920 년대 후반부터 현재까지 오랫동안 연구되어 왔으며, 타이핑된 라틴계열 인쇄물을 스캔하여 얻은 이미지의 경우 문자 인식률이 99%가 넘을 정도로 인식률이 높고 신뢰성이 뛰어나다. 그러나 보통 OCR 처리를 위해서는 스캐너나 바코드 판독기와 같은 광학식 스캔장치를 필요로 하고, 장치에서 얻은 이미지 포맷을 텍스트로 변환하기 위한 별도의 PC 와 OCR 응용프로그램이 설치되어 있어야 하기 때문에 다음과 같은 불편함이 수반된다.
1. 제한된 대상 - 스캔 장치는 인쇄물에 적힌 글자만 인식 가능하다.
2. 접촉 식의 번거로움 – 사용자가 장치의 수평을 맞추어 인쇄물을 스캔해야 한다.
3. 대상의 크기가 한정됨 – 대상이 너무 크거나 작은 것은 인식이 어렵다.
4. 한정된 공간에서의 작업 - PC 에 OCR 관련 소프트웨어가 설치되어 있어야 한다.
모바일기기에 부착된 카메라는 소형화가 가능해 휴대성이 뛰어나고, 비접촉 방식으로 이미지를 얻을 수 있는 장점이 있다. 카메라로부터 얻은 영상에서 문자 추출이 가능하도록 하여 위에 제시한 불편함을 해소하는 것이 이번 프로젝트의 컨셉이다.
우리가 제작한 문자 인식 소프트웨어는 카메라가 부착된 터치폰을 타깃으로 개발하였다. 임베디드 플랫폼에 OCR 엔진을 탑재하고 캠으로부터 얻은 영상에서 글자가 있는 영역을 추출하여 문자변환을 수행한다. 이를 통해 얻을 수 있는 이점은 크게 두 가지이다. 첫째는 ‘인쇄물’은 물론 ‘간판이나 공연포스터 책 표지’등 문서가 아닌 대상에 존재하는 글자에 대해서도 적용함으로써 ‘인식 가능한 대상을 확장시켰다는 것’과 둘째는 변환된 텍스트를 저장만 하는 것이 아니라 터치 입력을 통하여 원하는 단어를 검색 키워드로 사용하도록 함으로써 ‘사용자로부터 입력에 대한 편의를 제공하는 것이다’.
top
주최

주관