• Skip to navigation
  • Skip to content

logo

  • 회사소개

    기술과 서비스로
    세상의 모든 가능성을 연결합니다

    • 소개
    • 주요 계열사
    • 주요 연혁
    • 브랜드 리소스
    • 제휴 제안
    • Contact
    NAVER 사옥
  • 서비스

    검색에서 탐색으로 진화
    On-Service AI

    • 네이버 주요 서비스
    • 포털
    • 도구
    • 검색
    • 광고
    • 커머스
    • 클라우드
    • 핀테크
    • 1784
    • 콘텐츠
    • 데이터센터 각
    • 커뮤니티
    • 전체 서비스
    • 지도
    NAVER 서비스
  • 기술

    혁신의 기술을 일상의 서비스로
    Everyday Tech

    • 네이버 주요 기술
    • HyperCLOVA X
    • 공간지능
    • 로보틱스
    • 이머시브 미디어
    NAVER 기술
  • 지속가능성

    네이버의 연결로 만드는
    더 나은 변화

    • 네이버 지속가능성
    • 지속가능경영
    • Social
    • Tech for People
    • Environment
    • Principle
    • ESG 자료실
    NAVER 지속가능성
  • 투자정보

    투자정보

    • IR 뉴스
    • 기업지배구조
    • IR 일정
    • 재무정보
    • 재무정보
    • IR 자료실
    NAVER 투자정보
  • 미디어

    미디어

    • 보도자료
    • 미디어 행사
    • 네이버 리포트
    • AI in NAVER
    NAVER 뉴스룸
  • 스토리

    네이버 스토리

    스토리 전체 보기
  • 채용
통합검색 입력 폼
  • 한눈에 보는 네이버 전체 서비스 소개

    한눈에 보는 네이버
    전체 서비스 소개

  • 네이버 로고 아이덴티티 브랜드 리소스

    네이버 로고 아이덴티티
    브랜드 리소스

  • 5,400만+ 유저를 고객으로 네이버 광고 검색 상품

    5,400만+ 유저를 고객으로
    네이버 광고 검색 상품

  • NAVER Auunal Report ESG Library

    한눈에 보는 네이버
    전체 서비스 소개

  • NAVER Brand Resource Logo and color

    네이버 로고 아이덴티티
    브랜드 리소스

  • NAVER MAP Connecting online and offline

    5,400만+ 유저를 고객으로
    네이버 광고 검색 상품

logo
logo
  • 회사소개
    • 소개
    • 주요 계열사
    • 주요 연혁
    • 브랜드 리소스
    • 제휴 제안
    • Contact
  • 서비스
    • 네이버 주요 서비스
    • 포털
    • 도구
    • 검색
    • 광고
    • 커머스
    • 클라우드
    • 핀테크
    • 1784
    • 콘텐츠
    • 데이터센터 각
    • 커뮤니티
    • 전체 서비스
    • 지도
  • 기술
    • 네이버 주요 기술
    • HyperCLOVA X
    • 공간지능
    • 로보틱스
    • 이머시브 미디어
  • 지속가능성
    • 네이버 지속가능성
    • 지속가능경영
    • Social
    • Tech for People
    • Environment
    • Principle
    • ESG 자료실
  • 투자정보
    • IR 뉴스
    • 기업지배구조
    • IR 일정
    • 재무정보
    • 재무정보
    • IR 자료실
  • 미디어
    • 보도자료
    • 미디어 행사
    • 네이버 리포트
    • AI in NAVER
  • 스토리
  • 채용
Tech

HyperCLOVA X Outperforms Global AI Leaders in KMMLU Assessment, Highlighting Sovereign AI’s Competitive Edge

2024.02.27
공유하기

HyperCLOVA X Outperforms Global AI Leaders in KMMLU Assessment, Highlighting Sovereign AI’s Competitive Edge

공유하기

HyperCLOVA X Outperforms Global AI Leaders in KMMLU Assessment, Highlighting Sovereign AI’s Competitive Edge

- Consisting of 35,030 expert-level questions across 45 fields, KMMLU provides a thorough assessment of both general and Korea-specific knowledge

- HyperCLOVA X achieves higher average scores compared to GPT-3.5-Turbo and Gemini-Pro, and even surpasses GPT-4 in Korea-specific knowledge

- NAVER CLOUD is enhancing the domestic AI ecosystem with the HyperCLOVA X solution, known for its security and performance capabilities, thereby accelerating global expansion by leveraging the proven competitiveness of sovereign AI in Korea

​

February 27, 2024

NAVER CLOUD (CEO Kim Yu-won) announced on February 27 that HyperCLOVA X has outperformed generative AIs from OpenAI and Google in the Measuring Massive Multitask Language Understanding in Korean (KMMLU*) assessment, showcasing its superior capabilities as a sovereign AI.

* KMMLU: Measuring Massive Multitask Language Understanding in Korean (https://arxiv.org/abs/2402.11548)

Led by the distinguished Korean open-source language model research team, “HAE-RAE,” KMMLU is an initiative aimed at creating AI performance evaluation metrics. It includes 35,030 questions to test expert-level knowledge across 45 domains, such as humanities, sociology, science, and technology. Approximately 80% of the questions are designed to evaluate universally relevant knowledge areas, including mathematical reasoning, while the remaining 20% are focused on assessing the ability to solve Korea-specific issues, such as the geography of the Korean Peninsula and Korean laws. This approach ensures a comprehensive and balanced evaluation of AI systems, measuring their global capabilities as well as their relevance to Korean users.

Previously, adapting the translated “MMLU,” a benchmark utilized by North American tech giants like OpenAI and Google for AI performance evaluation, for Korea posed challenges because of translation inaccuracies and cultural differences implied in numerous questions. KMMLU, comprising original questions in Korean, provides a more precise assessment of the Korean language comprehension of both local and international AI systems.

Research on KMMLU has shown that HyperCLOVA X outshines OpenAI’s GPT-3.5-Turbo and Google’s Gemini-Pro, demonstrating its superior performance in both General Knowledge and Korea-Specific Knowledge compared to leading global AI technologies. Moreover, it exceeds OpenAI’s GPT-4 in understanding Korea-specific knowledge, indicating HyperCLOVA X’s exceptional applicability in fields requiring local insights, such as education and legal information.

NAVER CLOUD is committed to evolving HyperCLOVA X into a secure and high-performing “Sovereign AI” solution, drawing on its validated strengths as showcased in the KMMLU evaluation. In October, they launched “Neurocloud for HyperCLOVA X,” a hybrid cloud service enabling clients to deploy HyperCLOVA X within private networks, thus bolstering data security. Furthermore, NAVER CLOUD is set to introduce a suite of corporate solutions in the future.

Sung Nako, the Head of Hyperscale AI at NAVER CLOUD, stated, “HyperCLOVA X represents a sovereign AI that melds Korea-specific problem-solving abilities with extensive knowledge. As it offers high-performance and secure solutions, it is becoming increasingly popular in local industries. With the growing global interest in AI that caters to native languages, we are well-positioned to expedite our entrance into the global market, leveraging the proven advantages of sovereign AI in Korea.”

NAVER CLOUD has played a crucial role in advancing Korea’s AI technology scene, notably by taking part in the development of the KMMLU for impartial assessments of AI models’ proficiency in the Korean language. In 2021, it unveiled the Korean Language Understanding Evaluation (KLUE) benchmark, collaborating with experts from approximately 30 companies and universities. Furthermore, last year, NAVER CLOUD released Korean datasets* designed to enhance the accuracy of hyperscale language models in Korea, which stems from interdisciplinary research collaborations spanning social sciences and law.

* SQuARe: A Large-Scale Dataset of Sensitive Questions and Acceptable Responses Created Through Human-Machine Collaboration (https://arxiv.org/abs/2305.17696), KoSBi: A Dataset for Mitigating Social Bias Risks Towards Safer Large Language Model Application (https://arxiv.org/abs/2305.17701)

HyperCLOVA XKMMLUSovereign AIoutperform
목록보기

연관 콘텐츠

  • Tech 2025.06.30
    네이버, 최상급 언어 능력 갖춘 추론모델 ‘HyperCLOVA X THINK’ 공개
    KoBALT-700추론모델테크니컬 리포트하이퍼클로바X 씽크
  • Tech 2024.02.27
    하이퍼클로바X, 한국판 AI 능력 평가에서 글로벌 최고 수준 AI 넘어서…소버린 AI 성능 경쟁력 입증
    KMMLU네이버클라우드소버린 AI하이퍼클로바X
  • NAVER 2023.07.21
    초대규모 AI 생태계 확장 본격화하는 네이버, 하이퍼클로바X 기반 서비스 라인업 공개
이전 슬라이드
다음 슬라이드
We the Navigators
  • 파트너 지원
    • 네이버 광고주센터 새창 열림
    • 스마트스토어센터 새창 열림
    • 스마트플레이스 새창 열림
    • 비즈니스 스쿨 새창 열림
    • 네이버 임팩트 새창 열림
    • SME 풀케어 새창 열림
  • 개발자 지원
    • 네이버 개발자 센터 새창 열림
    • 오픈 API 새창 열림
    • 오픈소스 새창 열림
    • 네이버 D2 새창 열림
    • 네이버 D2SF 새창 열림
  • 자료실
    • IR 자료실
    • ESG 자료실
    • 네이버 리포트
    • 브랜드 리소스
  • 주요 계열사
    • 네이버클라우드
    • 스노우
    • 네이버랩스
    • 네이버웹툰
    • 네이버파이낸셜
  • blog link
  • naverTV link
  • instagram link
  • youtube link
  • ffinicial link
  • Contact
  • 제휴 제안
  • 고객센터
  • 기업윤리 상담센터 기업윤리 상담센터
  • 개인정보 처리방침
  • 이용약관
  • 운영정책
  • Contact
  • 제휴 제안
  • 기업윤리 상담센터

©NAVER CORP.