• Skip to navigation
  • Skip to content

logo

  • 회사소개

    기술과 서비스로
    세상의 모든 가능성을 연결합니다

    • 소개
    • 주요 계열사
    • 주요 연혁
    • 브랜드 리소스
    • 제휴 제안
    • Contact
    NAVER 사옥
  • 서비스

    검색에서 탐색으로 진화
    On-Service AI

    • 네이버 주요 서비스
    • 포털
    • 도구
    • 검색
    • 광고
    • 커머스
    • 클라우드
    • 핀테크
    • 1784
    • 콘텐츠
    • 데이터센터 각
    • 커뮤니티
    • 전체 서비스
    • 지도
    NAVER 서비스
  • 기술

    혁신의 기술을 일상의 서비스로
    Everyday Tech

    • 네이버 주요 기술
    • HyperCLOVA X
    • 공간지능
    • 로보틱스
    • 이머시브 미디어
    NAVER 기술
  • 지속가능성

    네이버의 연결로 만드는
    더 나은 변화

    • 네이버 지속가능성
    • 지속가능경영
    • Social
    • Tech for People
    • Environment
    • Principle
    • ESG 자료실
    NAVER 지속가능성
  • 투자정보

    투자정보

    • IR 뉴스
    • 기업지배구조
    • IR 일정
    • 재무정보
    • 재무정보
    • IR 자료실
    NAVER 투자정보
  • 미디어

    미디어

    • 보도자료
    • 미디어 행사
    • 네이버 리포트
    NAVER 뉴스룸
  • 스토리

    네이버 스토리

    스토리 전체 보기
  • 채용
통합검색 입력 폼
  • 한눈에 보는 네이버 전체 서비스 소개

    한눈에 보는 네이버
    전체 서비스 소개

  • 네이버 로고 아이덴티티 브랜드 리소스

    네이버 로고 아이덴티티
    브랜드 리소스

  • 5,400만+ 유저를 고객으로 네이버 광고 검색 상품

    5,400만+ 유저를 고객으로
    네이버 광고 검색 상품

  • NAVER Auunal Report ESG Library

    한눈에 보는 네이버
    전체 서비스 소개

  • NAVER Brand Resource Logo and color

    네이버 로고 아이덴티티
    브랜드 리소스

  • NAVER MAP Connecting online and offline

    5,400만+ 유저를 고객으로
    네이버 광고 검색 상품

logo
logo
  • 회사소개
    • 소개
    • 주요 계열사
    • 주요 연혁
    • 브랜드 리소스
    • 제휴 제안
    • Contact
  • 서비스
    • 네이버 주요 서비스
    • 포털
    • 도구
    • 검색
    • 광고
    • 커머스
    • 클라우드
    • 핀테크
    • 1784
    • 콘텐츠
    • 데이터센터 각
    • 커뮤니티
    • 전체 서비스
    • 지도
  • 기술
    • 네이버 주요 기술
    • HyperCLOVA X
    • 공간지능
    • 로보틱스
    • 이머시브 미디어
  • 지속가능성
    • 네이버 지속가능성
    • 지속가능경영
    • Social
    • Tech for People
    • Environment
    • Principle
    • ESG 자료실
  • 투자정보
    • IR 뉴스
    • 기업지배구조
    • IR 일정
    • 재무정보
    • 재무정보
    • IR 자료실
  • 미디어
    • 보도자료
    • 미디어 행사
    • 네이버 리포트
  • 스토리
  • 채용
NAVER

​​​​​​​네이버, ‘인터스피치 2021’에 9개 논문 발표… “글로벌 AI 연구혁신 생태계 성과”

2021.09.06
공유하기

​​​​​​​네이버, ‘인터스피치 2021’에 9개 논문 발표… “글로벌 AI 연구혁신 생태계 성과”

공유하기

네이버, ‘인터스피치 2021’에 9개 논문 발표… “글로벌 AI 연구혁신 생태계 성과”

- 국내 기업 중 가장 많은 논문 채택…라인 발표 논문 합하면 14개 달해

- 일부 논문은 클로바더빙, 클로바노트 등 실제 네이버 서비스에 적용돼 사용자 편의성 강화

- KAIST, 카네기멜론대, 유레컴(EURECOM) 등 연구진과의 협력 논문도 다수…글로벌 AI R&D 생태계 결실

2021-09-06

 

네이버를 중심으로 확장되어가고 있는 글로벌 AI 연구혁신 생태계가 우수한 AI 연구 결과들을 만들어내며 성과를 거두고 있다.

 

네이버㈜(대표이사 한성숙)는 지난 8월 30일부터 9월 3일까지 진행된 세계 최대 음성 및 신호처리 학회 ‘인터스피치(INTERSPEECH) 2021’에서 국내 기업 중 가장 많은 9개의 논문을 발표했다. 네이버의 글로벌 AI R&D 생태계를 함께 이루고 있는 네이버 일본 관계사 ‘라인’이 발표한 논문을 합하면 총 14개에 달한다. 이와 같은 성과를 기반으로, 네이버는 글로벌 AI 리더십 확보에 적극적으로 나설 계획이다.

 

올해 22회를 맞은 ‘인터스피치’는 구글, 페이스북, 아마존, 알리바바 등 글로벌 기업의 음성인식 관련 최신 기술이 공유되는 자리로, ICASSP와 함께 세계 최대 음성 및 신호처리 학회로 인정받고 있다. 네이버와 라인은 올해 6월 개최된 ‘ICASSP 2021’에서도 14건의 논문을 발표했다.

 

‘인터스피치 2021’에서 채택된 네이버의 연구 논문은 음성인식, 음성합성, 데이터셋 제작 등 음성 및 신호와 관련된 다양한 분야를 포괄한다. 일부 논문은 네이버의 실제 서비스에 적용되며 사용자에게 더욱 편리한 서비스 경험을 제공하고 있다. 음성 합성 품질 향상 기술 연구는 ‘클로바더빙’, ‘클로바 스마트 스피커’, ‘네이버 AiCALL’ 등 네이버 클로바에서 제공하는 다양한 음성 합성 서비스에 적용됐다. 여러 화자가 동시에 말하는 상황에서 ‘화자 분할(Speaker Diarisation)’을 위해 각 발화자의 특징을 더욱 정확하게 학습하는 기법에 대한 연구는 ‘클로바노트’ 서비스 개선 등에 활용되고 있다.

 

또한 네이버가 발표한 9건의 논문 중 5건은 컴퓨터 과학 및 정보 시스템 분야에서 선두주자로 꼽히는 프랑스 연구 기관 유레컴(EURECOM)을 비롯해, 카네기멜론대학교, KAIST, 연세대학교, 라인 등 AI 기술을 이끄는 국내외 기업 및 연구 기관들과 협력 연구로 수행됐다. 네이버는 글로벌 AI 연구혁신 생태계 구축을 위한 노력이 가시적인 성과로 드러나고 있다고 덧붙였다.

 

네이버는 이번 성과를 기반으로 글로벌 AI R&D 생태계를 지속적으로 확장해가겠다는 계획이다. 현재 라인과의 연계를 중심으로 한 일본을 넘어, 베트남에서는 HUST, PTIT와 공동연구센터를 설립했으며, 유럽에서는 프랑스의 네이버랩스유럽과 연구협력을 이어가고 있다. 지난 7월에는 인공신경망과 로봇공학 분야에서 세계 최고 수준을 자랑하는 독일의 튀빙겐대학교와 공동연구센터 설립에 합의하기도 했다.

 

정석근 네이버 클로바 CIC 대표는 “R&D에 대한 적극적인 투자를 바탕으로 네이버의 AI 연구혁신 생태계는 그 규모를 더욱 키워가고 있다.”며 “인터스피치 2021에서 네이버와 라인, 그리고 글로벌 AI 연구진이 뛰어난 성과를 거둔 것처럼, 앞으로 네이버를 중심으로 구축될 더욱 다양한 AI R&D 생태계에서 새로운 성과가 나올 수 있을 것으로 기대한다.”고 말했다. </이상>

 

[참고] 네이버 INTERSPEECH 2021 채택 논문 리스트
 
1. High-fidelity Parallel WaveGAN with Multi-band Harmonic-plus-Noise Model
- 황민제, Ryuichi Yamamoto (LINE), 송은우, 김재민
- 음성 모델링 기법중 하나인 multi-band harmonic-plus-noise 모델을 Parallel WaveGAN 에 적용해 보코더의 품질과 안정성을 향상.
 
2. LiteTTS: A Decoder-free Light-weight Text-to-wave Synthesizer Based on Generative Adversarial Networks
- Kim Nguyen (연세대), 정기혁 (연세대), 엄세연 (연세대), 황민제, 송은우, 강홍구 (연세대)
- Text-to-feature 와 feature-to-wave 로 분리되어있는 TTS 파이프라인을 하나로 묶는 text-to-wave 모델을 제안.
 
3. Label Embedding for Chinese Grapheme-to-Phoneme Conversion
- 최은비 (KAIST), 김화연, 김종환, 김재민
- Chinese polyphone conversion problem을 위한 label embedding approach를 제안.
 
4. Look Who’s Talking: Active Speaker Detection in the Wild
- 김유진, 허희수, 최소연, 정수환, 권유환, 이봉진, 권영기, 정준선
- 멀티모달 Active Speaker Detection 데이터셋 제작 공개
 
5. Adapting Speaker Embeddings for Speaker Diarisation
- 권영기, 정지원, 허희수, 김유진, 이봉진, 정준선
- Speaker Diarization 성능 개선을 위한 Speaker Embedding 강화 방법 연구
 
6. Three-class Overlapped Speech Detection using a Convolutional Recurrent Neural Network
- 정지원, 허희수, 권영기, 정준선, 이봉진
- 3개 클래스+CRNN을 이용한 Overlapped Speech Detection 기법 제안
 
7. Graph Attention Networks for Anti-Spoofing
- Hemlata Tak (EURECOM), 정지원, Jose Patino (EURECOM), Massimiliano Todisco (EURECOM), Nicholas Evans (EURECOM)
- GNN을 이용한 audio spoofing detection 연구
 
8. DEMUCS-Mobile : On-device lightweight speech enhancement
- 이루카스, 지유나, 이민재, 최민석
- CNN 딥러닝 기반 잡음 제거 모델의 경량화 기법을 제안하여 모바일 on-device에서 실시간으로 동작가능한 잡음제거 모델 구현
 
9. Layer Pruning on Demand with Intermediate CTC
- 이재송, 강진구, Shinji Watanabe (CMU)
- Transformer+CTC 모델을 fine-tuning 없이 pruning하기 위한 학습 방법론
목록보기
We the Navigators
  • 파트너 지원
    • 네이버 광고주센터 새창 열림
    • 스마트스토어센터 새창 열림
    • 스마트플레이스 새창 열림
    • 비즈니스 스쿨 새창 열림
    • 네이버 임팩트 새창 열림
    • SME 풀케어 새창 열림
  • 개발자 지원
    • 네이버 개발자 센터 새창 열림
    • 오픈 API 새창 열림
    • 오픈소스 새창 열림
    • 네이버 D2 새창 열림
    • 네이버 D2SF 새창 열림
  • 자료실
    • IR 자료실
    • ESG 자료실
    • 네이버 리포트
    • 브랜드 리소스
  • 주요 계열사
    • 네이버클라우드
    • 스노우
    • 네이버랩스
    • 네이버웹툰
    • 네이버파이낸셜
  • blog link
  • naverTV link
  • instagram link
  • youtube link
  • ffinicial link
  • Contact
  • 제휴 제안
  • 고객센터
  • 기업윤리 상담센터 기업윤리 상담센터
  • 개인정보 처리방침
  • 이용약관
  • 운영정책
  • Contact
  • 제휴 제안
  • 기업윤리 상담센터

©NAVER CORP.