• Skip to navigation
  • Skip to content

logo

  • 회사소개

    기술과 서비스로
    세상의 모든 가능성을 연결합니다

    • 소개
    • 주요 계열사
    • 주요 연혁
    • 브랜드 리소스
    • 제휴 제안
    • Contact
    NAVER 사옥
  • 서비스

    검색에서 탐색으로 진화
    On-Service AI

    • 네이버 주요 서비스
    • 포털
    • 도구
    • 검색
    • 광고
    • 커머스
    • 클라우드
    • 핀테크
    • 1784
    • 콘텐츠
    • 데이터센터 각
    • 커뮤니티
    • 전체 서비스
    • 지도
    NAVER 서비스
  • 기술

    혁신의 기술을 일상의 서비스로
    Everyday Tech

    • 네이버 주요 기술
    • HyperCLOVA X
    • 공간지능
    • 로보틱스
    • 이머시브 미디어
    NAVER 기술
  • 지속가능성

    네이버의 연결로 만드는
    더 나은 변화

    • 네이버 지속가능성
    • 지속가능경영
    • Social
    • Tech for People
    • Environment
    • Principle
    • ESG 자료실
    NAVER 지속가능성
  • 투자정보

    투자정보

    • IR 뉴스
    • 기업지배구조
    • IR 일정
    • 재무정보
    • 재무정보
    • IR 자료실
    NAVER 투자정보
  • 미디어

    미디어

    • 보도자료
    • 미디어 행사
    • 네이버 리포트
    NAVER 뉴스룸
  • 스토리

    네이버 스토리

    스토리 전체 보기
  • 채용
통합검색 입력 폼
  • 한눈에 보는 네이버 전체 서비스 소개

    한눈에 보는 네이버
    전체 서비스 소개

  • 네이버 로고 아이덴티티 브랜드 리소스

    네이버 로고 아이덴티티
    브랜드 리소스

  • 5,400만+ 유저를 고객으로 네이버 광고 검색 상품

    5,400만+ 유저를 고객으로
    네이버 광고 검색 상품

  • NAVER Auunal Report ESG Library

    한눈에 보는 네이버
    전체 서비스 소개

  • NAVER Brand Resource Logo and color

    네이버 로고 아이덴티티
    브랜드 리소스

  • NAVER MAP Connecting online and offline

    5,400만+ 유저를 고객으로
    네이버 광고 검색 상품

logo
logo
  • 회사소개
    • 소개
    • 주요 계열사
    • 주요 연혁
    • 브랜드 리소스
    • 제휴 제안
    • Contact
  • 서비스
    • 네이버 주요 서비스
    • 포털
    • 도구
    • 검색
    • 광고
    • 커머스
    • 클라우드
    • 핀테크
    • 1784
    • 콘텐츠
    • 데이터센터 각
    • 커뮤니티
    • 전체 서비스
    • 지도
  • 기술
    • 네이버 주요 기술
    • HyperCLOVA X
    • 공간지능
    • 로보틱스
    • 이머시브 미디어
  • 지속가능성
    • 네이버 지속가능성
    • 지속가능경영
    • Social
    • Tech for People
    • Environment
    • Principle
    • ESG 자료실
  • 투자정보
    • IR 뉴스
    • 기업지배구조
    • IR 일정
    • 재무정보
    • 재무정보
    • IR 자료실
  • 미디어
    • 보도자료
    • 미디어 행사
    • 네이버 리포트
  • 스토리
  • 채용
Tech

하이퍼클로바X, 한국판 AI 능력 평가에서 글로벌 최고 수준 AI 넘어서…소버린 AI 성능 경쟁력 입증

2024.02.27
공유하기

하이퍼클로바X, 한국판 AI 능력 평가에서 글로벌 최고 수준 AI 넘어서…소버린 AI 성능 경쟁력 입증

공유하기

하이퍼클로바X, 한국판 AI 능력 평가에서 글로벌 최고 수준 AI 넘어서…소버린 AI 성능 경쟁력 입증

​

- 45개 분야 35,030개 전문가 수준 문항으로 구성…보편 지식과 한국 특화 지식 종합적 측정

- 하이퍼클로바X, GPT-3.5-Turbo와 Gemini-Pro보다 높은 평균 점수 기록…한국 특화 지식에서는 GPT-4도 앞서

- 네이버클라우드, 보안과 성능 모두 갖춘 하이퍼클로바X 솔루션으로 국내 AI 생태계 확장…“한국에서 확인한 소버린 AI 경쟁력으로 글로벌 진출 가속화”

​

2024-02-27

네이버클라우드(대표 김유원)는 하이퍼클로바X(HyperCLOVA X)가 한국판 AI 성능 평가 체계 ‘KMMLU(Measuring Massive Multitask Language Understanding in Korean)’*에서 오픈AI, 구글의 생성형 AI보다 높은 점수를 기록하며 소버린 AI로서 우수한 성능 경쟁력을 확인할 수 있었다고 27일 밝혔다.

* KMMLU: Measuring Massive Multitask Language Understanding in Korean (https://arxiv.org/abs/2402.11548)

KMMLU는 국내의 대표적인 오픈소스 언어모델 연구팀인 ‘해례(HAE-RAE)’가 이끈 AI 성능 평가 지표 구축 프로젝트다. 인문학, 사회학, 과학∙기술 등 45개 분야에서 전문가 수준의 지식을 묻는 35,030개 문항으로 구성되어 있다. 수학적 추론 능력과 같이 전세계 공통적으로 적용 가능한 광범위한 지식을 묻는 문항 비중이 약 80%, 한반도 지리, 국내법 등 한국 특화 문제 해결 능력을 평가하기 위한 문항은 20%로, AI의 보편적 능력과 로컬 지식을 고르게 측정해 한국 사용자에게 유용한 AI를 종합적으로 판단할 수 있다.

또한 오픈AI, 구글 등 북미 테크 기업들이 자사 AI 성능을 확인하기 위해 주로 사용하는 지표인 ‘MMLU’를 한국어로 번역하는 경우, 문항의 부정확한 번역과 여러 문제에 내재된 영어권 국가만의 문화적 맥락 때문에 AI 모델의 한국어 능력을 제대로 가늠하기 어려운 한계가 있었다. KMMLU는 한국어 원본의 시험 문제들로 구성되어, 국내∙외 AI의 한국어 이해 역량도 보다 정확하게 평가할 수 있다.

KMMLU 연구 논문에 따르면 하이퍼클로바X는 오픈AI의 GPT-3.5-Turbo와 구글의 Gemini-Pro보다 높은 점수를 기록하며, 일반 지식(General Knowledge)과 한국 특화 지식(Korea-Specific Knowledge)을 종합한 전반적인 성능이 글로벌 빅테크의 AI와 경쟁할 수 있는 수준임이 확인됐다. 한국 특화 지식 기준으로는 오픈AI의 GPT-4보다도 높은 점수를 기록해, 교육, 법률 등 로컬 정보의 중요성이 큰 산업 분야에서는 하이퍼클로바X가 가장 유용할 수 있음을 보였다.

네이버클라우드는 KMMLU를 통해 입증된 하이퍼클로바X의 성능 경쟁력을 바탕으로, 하이퍼클로바X를 보안과 성능을 모두 갖춘 ‘소버린(Sovereign) AI’ 솔루션으로 발전시켜나가겠다는 계획이다. 지난해 10월에 고객사가 폐쇄된 사내망에서 하이퍼클로바X를 사용하며 데이터 유출을 방지할 수 있는 하이브리드 클라우드 서비스 ‘뉴로클라우드 포 하이퍼클로바X(Neurocloud for HyperCLOVA X)’를 출시했고, 향후 다양한 기업용 솔루션도 선보일 계획이다.

성낙호 네이버클라우드 하이퍼스케일(Hyperscale) AI 기술 총괄은 “하이퍼클로바X는 세계 공통의 보편 지식에 한국 특화 문제 해결 능력을 더한 소버린 AI로, 우수한 성능, 강력한 보안을 갖춘 솔루션과 함께 국내 산업계 전반에서 도입이 이뤄지고 있다.”며 “자국어 중심 AI에 대한 전세계적 수요가 관찰되는 만큼, 한국에서 확인한 소버린 AI의 경쟁력을 바탕으로 향후 글로벌 시장 진출에도 속도를 낼 것”이라고 말했다.

한편, 네이버클라우드는 KMMLU를 설계하는 과정에도 참여하며, AI 모델들의 한국어 이해 능력을 보다 객관적으로 평가해 더욱 우수한 성능의 AI가 한국에서 만들어질 수 있는 환경을 조성하는 데에도 적극적으로 기여하고 있다. 뿐만 아니라 2021년에는 30여 곳 기업과 대학의 자연어처리 전문가들과 함께 한국어 자연어 이해 벤치마크 ‘KLUE(Korean Language Understanding Evaluation)’를 구축했으며, 지난해에는 사회과학, 법학 등 여러 학문 분야와의 협력 연구를 통해 국내 초대규모 언어모델의 신뢰성 향상을 위한 한국어 데이터셋*을 공개하기도 했다. </이상>

* SQuARe: A Large-Scale Dataset of Sensitive Questions and Acceptable Responses Created Through Human-Machine Collaboration (https://arxiv.org/abs/2305.17696), KoSBi: A Dataset for Mitigating Social Bias Risks Towards Safer Large Language Model Application (https://arxiv.org/abs/2305.17701)

KMMLU네이버클라우드소버린 AI하이퍼클로바X
목록보기

연관 콘텐츠

  • 보도자료 2026.05.12
    네이버클라우드, 완전관리형 서버리스 데이터베이스 서비스 출시 "이용 패턴에 따라 자동으로 스펙과 용량 최적화"
    네이버클라우드서버리스오토스케일링
  • Service 2026.05.07
    네이버클라우드, 인증서 자동 관리 기능 ‘ACME’ 출시… “중단 없는 비즈니스 환경 구현”
    ACME네이버클라우드인증서 자동 관리 기능
  • NAVER 2026.04.30
    보안은 지키고, 업무 장벽은 없애고... 네이버웍스로 공무원 모바일 업무시대 연다
    네이버웍스네이버클라우드행정 혁신
  • 보도자료 2026.04.29
    네이버클라우드, 국가 AI 민관 협력체 'K-AI 파트너십' 공동의장 맡아 AI 생태계 확장 이끈다
    AI생태계K-AI 파트너십네이버클라우드
  • 보도자료 2026.04.27
    주요 부처 검증 마친 '행정 AI'… 네이버클라우드, 공공 AX '속도·신뢰' 동시에 잡는다
    공공AX네이버클라우드행정AI
  • 보도자료 2026.04.24
    사우디 디지털 인프라 수요 잡는다... 네이버클라우드-한미글로벌, 사우디 데이터센터 사업 연합
    MOU네이버클라우드한미글로벌
이전 슬라이드
다음 슬라이드
We the Navigators
  • 파트너 지원
    • 네이버 광고주센터 새창 열림
    • 스마트스토어센터 새창 열림
    • 스마트플레이스 새창 열림
    • 비즈니스 스쿨 새창 열림
    • 네이버 임팩트 새창 열림
    • SME 풀케어 새창 열림
  • 개발자 지원
    • 네이버 개발자 센터 새창 열림
    • 오픈 API 새창 열림
    • 오픈소스 새창 열림
    • 네이버 D2 새창 열림
    • 네이버 D2SF 새창 열림
  • 자료실
    • IR 자료실
    • ESG 자료실
    • 네이버 리포트
    • 브랜드 리소스
  • 주요 계열사
    • 네이버클라우드
    • 스노우
    • 네이버랩스
    • 네이버웹툰
    • 네이버파이낸셜
  • blog link
  • naverTV link
  • instagram link
  • youtube link
  • ffinicial link
  • Contact
  • 제휴 제안
  • 고객센터
  • 기업윤리 상담센터 기업윤리 상담센터
  • 개인정보 처리방침
  • 이용약관
  • 운영정책
  • Contact
  • 제휴 제안
  • 기업윤리 상담센터

©NAVER CORP.