• Skip to navigation
  • Skip to content

logo

  • 회사소개

    기술과 서비스로
    세상의 모든 가능성을 연결합니다

    • 소개
    • 주요 계열사
    • 주요 연혁
    • 브랜드 리소스
    • 제휴 제안
    • Contact
    NAVER 사옥
  • 서비스

    검색에서 탐색으로 진화
    On-Service AI

    • 네이버 주요 서비스
    • 포털
    • 도구
    • 검색
    • 광고
    • 커머스
    • 클라우드
    • 핀테크
    • 1784
    • 콘텐츠
    • 데이터센터 각
    • 커뮤니티
    • 전체 서비스
    • 지도
    NAVER 서비스
  • 기술

    혁신의 기술을 일상의 서비스로
    Everyday Tech

    • 네이버 주요 기술
    • HyperCLOVA X
    • 공간지능
    • 로보틱스
    • 이머시브 미디어
    NAVER 기술
  • 지속가능성

    네이버의 연결로 만드는
    더 나은 변화

    • 네이버 지속가능성
    • 지속가능경영
    • Social
    • Tech for People
    • Environment
    • Principle
    • ESG 자료실
    NAVER 지속가능성
  • 투자정보

    투자정보

    • IR 뉴스
    • 기업지배구조
    • IR 일정
    • 재무정보
    • 재무정보
    • IR 자료실
    NAVER 투자정보
  • 미디어

    미디어

    • 보도자료
    • 미디어 행사
    • 네이버 리포트
    NAVER 뉴스룸
  • 스토리

    네이버 스토리

    스토리 전체 보기
  • 채용
통합검색 입력 폼
  • 한눈에 보는 네이버 전체 서비스 소개

    한눈에 보는 네이버
    전체 서비스 소개

  • 네이버 로고 아이덴티티 브랜드 리소스

    네이버 로고 아이덴티티
    브랜드 리소스

  • 5,400만+ 유저를 고객으로 네이버 광고 검색 상품

    5,400만+ 유저를 고객으로
    네이버 광고 검색 상품

  • NAVER Auunal Report ESG Library

    한눈에 보는 네이버
    전체 서비스 소개

  • NAVER Brand Resource Logo and color

    네이버 로고 아이덴티티
    브랜드 리소스

  • NAVER MAP Connecting online and offline

    5,400만+ 유저를 고객으로
    네이버 광고 검색 상품

logo
logo
  • 회사소개
    • 소개
    • 주요 계열사
    • 주요 연혁
    • 브랜드 리소스
    • 제휴 제안
    • Contact
  • 서비스
    • 네이버 주요 서비스
    • 포털
    • 도구
    • 검색
    • 광고
    • 커머스
    • 클라우드
    • 핀테크
    • 1784
    • 콘텐츠
    • 데이터센터 각
    • 커뮤니티
    • 전체 서비스
    • 지도
  • 기술
    • 네이버 주요 기술
    • HyperCLOVA X
    • 공간지능
    • 로보틱스
    • 이머시브 미디어
  • 지속가능성
    • 네이버 지속가능성
    • 지속가능경영
    • Social
    • Tech for People
    • Environment
    • Principle
    • ESG 자료실
  • 투자정보
    • IR 뉴스
    • 기업지배구조
    • IR 일정
    • 재무정보
    • 재무정보
    • IR 자료실
  • 미디어
    • 보도자료
    • 미디어 행사
    • 네이버 리포트
  • 스토리
  • 채용
보도자료

네이버가 연구한 문자 인식 기술(OCR), 국제 경진 대회에서 가장 높은 점수 기록하며 글로벌 기술 경쟁력 입증

2018.07.12
공유하기

네이버가 연구한 문자 인식 기술(OCR), 국제 경진 대회에서 가장 높은 점수 기록하며 글로벌 기술 경쟁력 입증

공유하기

네이버가 연구한 문자 인식 기술(OCR), 국제 경진 대회에서 가장 높은 점수 기록하며 글로벌 기술 경쟁력 입증

- OCR 분야에서 가장 권위있는 국제 경진 대회인 ‘ICDAR Robust Reading Competition’의 세 가지 과제에서 1위…알리바바, 텐센트, 센스타임 대비 높은 점수 기록

- 특히, 이미지에서 한국어, 영어, 일본어, 중국어 등 7개의 문자 종류를 검출하는 기술에서 가장 높은 점수 기록

- ‘파파고’ 등 실제 서비스에도 적용하며 사용자들이 기술을 쉽게 체감할 수 있도록 지원해 나갈 예정

 

2018-07-10

 

네이버 인공지능 플랫폼 클로바(Clova)와 인공지능 통번역 서비스 파파고(Papago)의 공동 ​​OCR 연구 팀이 글로벌 업체들과의 경쟁에서 높은 성과를 기록하며 기술력을 입증했다.

 

네이버는 국제패턴인식협회인 ‘IAPR’이 시작한 국제 경진 대회인 ‘ICDAR Robust Reading Competition’을 통해 올해만 세 가지 과제에서 1위를 기록했다고 밝혔다. ICDAR Robust Reading Competition은 디지털 이미지와 비디오 상에서 텍스트를 감지/인식하는 기술인 Robust Reading 분야에서 가장 권위있는 국제경진 대회이다.

* 국제패턴인식협회인 IAPR이 시작했으며, ICDAR Robust Reading Competition 2017은 컴퓨터 비전 분야 비영리 연구 기관 CVC(Centre de Visio per Computador)가 조직하고 스페인의 과학혁신부가 서포터로 참여했다.

 

OCR(Optical Character Recognition)은 크게 이미지에서 ▲문자의 위치를 찾는 ‘검출 기술’과 ▲문자가 무엇인지 알아내는 ‘인식 기술’로 나뉘는데, 특히 네이버의 문자 검출 기술이 알리바바, 텐센트, 센스타임 등 글로벌 업계와의 경쟁에서 가장 높은 점수를 기록했다.

 

먼저, 10일 <해당 사이트>에 따르면 2017년에 공개된 다국어 데이터를 기반으로 한 문자 영역 검출에 대한 과제 ‘Multi-Lingual scene Text(MLT) –Localization’에서 네이버가 73.68%를 기록하며 1위를 차지했다. 해당 기술은 영어를 포함한 라틴 계열의 문자뿐만 아니라, 한국어, 일본어, 중국어, 아랍어, 뱅골어 , 특수 기호 등 총 7개의 문자 영역을 검출하는 기술로, 단일 언어를 검출하는 것 보다 훨씬 고도화된 기술력이 요구된다.

 

또한, 역시 2017년 다국어 데이터 기반의 문자 종류 구분에 대한 과제​ ‘Multi-Lingual scene Text (MLT) - Script Identification‘에서도 네이버 클로바 팀에서 인턴으로 재직하고 있는 정성효 학생(고려대 주재걸 교수 연구실 소속)이 주도로 연구한 방식이 89.01%를 기록, 1위를 차지했다. ​문자 종류 구분 기술은 다국어 문자 검출 기술과 연관된 기술로, 검출된 영역에 해당하는 총 7개의 문자 종류 중 하나의 문자 종류로 분류하는 기술이다.

 

한편, 지난 6월에는 2013년에 공개된 근접 촬영 데이터에 대한 문자 영역 검출 과제​ ‘Focused Scene Text – Localization’에서도 네이버의 문자 검출 기술이 타 글로벌 AI 기업 대비 가장 높은 점수인 94.02%를 기록한바 있다.

​

  [참고 표]네이버가 1위를 차지한 과제와 해당 점수

​ 과제

점수

 Multi-Lingual scene Text (MLT) - Localization​

 73.68%

 Multi-Lingual scene Text (MLT) - Script Identification​

 89.01%

 Focused Scene Text - Localization​

 94.02%

​

해당 연구를 진행한 네이버 클로바 VISION팀의 이활석 연구자는 “OCR 분야의 공신력 있는 세계 경진 대회에서 네이버가 좋은 성과를 기록하며 글로벌 업체들 사이에서 경쟁력을 갖춰 나가고 있다”며, “OCR 기술을 지속적으로 고도화해, 네이버의 컴퓨터 비전 기술이 더욱 다양한 분야에서 활발히 활용될 수 있도록 연구를 이어갈 것”이라고 밝혔다.

 

향후, 네이버는 연구하고 있는 OCR 기술을 파파고 등 실제 서비스에도 적용하며 AI 기술을 실제 사용자들이 쉽게 체감할 수 있도록 지원한다는 방침이다.

 

 

[참고] ICDAR Robust Reading Competition

-       2017년에 6회차를 맞이한 ICDAR Robust Reading Competition은 디지털 이미지와 비디오 상에서 텍스트를 감지/인식하는 기술인 Robust Reading분야 가장 권위있는 경진대회이다

-       COCO-dataset을 비롯한 여러 데이터 속 문자 감지/인식 능력을 평가하며 2011년 대회 기록을 기점으로 누적하여 순위를 매긴다

-       다양한 분야의 데이터 속 문자 감지/인식 능력을 평가하겠다는 취지에 맞게 데이터 종류가 추가되는 경우가 있다

-       국제패턴인식협회인 IAPR이 시작했으며, ICDAR Robust Reading Competition 2017은 컴퓨터 비전 분야 비영리 연구 기관 CVC(Centre de Visio per Computador)가 조직하고 스페인의 과학혁신부가 서포터로 참여했다

 

※IAPR(International Association for Pattern Recognition): 1978년 설립된 패턴인식, 컴퓨터비전, 이미지 처리 분야를 다루는 비영리 단체이며 패턴인식의 발전과 적용을 촉진시키는데 그 목적이 있음

※COCO-dataset: 일상 생활 속 다양한 모습을 담아낸 사진들의 집합을 뜻함

목록보기
We the Navigators
  • 파트너 지원
    • 네이버 광고주센터 새창 열림
    • 스마트스토어센터 새창 열림
    • 스마트플레이스 새창 열림
    • 비즈니스 스쿨 새창 열림
    • 네이버 임팩트 새창 열림
    • SME 풀케어 새창 열림
  • 개발자 지원
    • 네이버 개발자 센터 새창 열림
    • 오픈 API 새창 열림
    • 오픈소스 새창 열림
    • 네이버 D2 새창 열림
    • 네이버 D2SF 새창 열림
  • 자료실
    • IR 자료실
    • ESG 자료실
    • 네이버 리포트
    • 브랜드 리소스
  • 주요 계열사
    • 네이버클라우드
    • 스노우
    • 네이버랩스
    • 네이버웹툰
    • 네이버파이낸셜
  • blog link
  • naverTV link
  • instagram link
  • youtube link
  • ffinicial link
  • Contact
  • 제휴 제안
  • 고객센터
  • 기업윤리 상담센터 기업윤리 상담센터
  • 개인정보 처리방침
  • 이용약관
  • 운영정책
  • Contact
  • 제휴 제안
  • 기업윤리 상담센터

©NAVER CORP.