KT, 한국형 AI ‘믿:음 2.0’ 오픈소스 공개… SKT는 한국어 특화 LLM ‘A.X 4.0’ 내놔

  • 동아일보
  • 입력 2025년 7월 4일 03시 00분


코멘트

KT “데이터 윤리성-신뢰성 제고”
SKT “GPT-4o보다 효율 33% 높아”

KT 기술혁신부문 연구원들이 서울 서초구 KT 우면연구센터에서 믿:음 2.0을 테스트하고 있는 모습. KT 제공
KT 기술혁신부문 연구원들이 서울 서초구 KT 우면연구센터에서 믿:음 2.0을 테스트하고 있는 모습. KT 제공
KT가 자체 개발한 한국형 인공지능(AI) 모델 ‘믿:음 2.0’을 오픈소스로 공개하며 이번 정부의 ‘소버린(sovereign·주권) AI’ 추진에 힘을 실었다. SK텔레콤도 한국어 특화 거대언어모델(LLM)인 A.X(에이닷엑스) 4.0을 오픈소스로 공개한다고 밝혔다.

3일 KT는 온라인 브리핑을 통해 ‘한국적 AI’라는 철학을 담아 믿:음 2.0을 새롭게 선보이고 오픈소스를 AI 개발자 플랫폼 허깅페이스를 통해 공개한다고 밝혔다. KT가 한국어의 고유한 특성을 학습시켜 한국에 가장 잘 맞게끔 만든 AI 모델을 기업과 개인, 공공 등 누구나 상업적으로 활용할 수 있도록 개방하는 것이다.

이번 모델의 종류는 △믿:음 2.0 베이스(Base) △믿:음 2.0 미니(Mini) 등 크게 두 가지다. 전자는 115억 파라미터(매개변수), 후자는 23억 파라미터 규모로 구축해 사용자의 목적에 따라 이용할 수 있도록 했다.

KT에 따르면 믿:음 2.0의 학습에는 국내 교육용 도서와 문학 작품 등의 발간물부터 법률 및 특허 문서, 각종 사전까지 산업, 공공, 문화 영역에 걸친 방대한 한국 특화 데이터가 활용됐다. KT 관계자는 “저작권 이슈가 있는 데이터는 모두 제거하는 한편 국내외 정책과 가이드라인을 기반으로 전문가들과 함께 만든 ‘AI 영향 평가 체계’를 적용해 윤리성과 신뢰성을 높였다”고 밝혔다.

믿:음 모델은 KT와 고려대가 공동 개발한 한국어 AI 역량 평가 지표인 ‘코-소버린(Ko-Sovereign)’ 벤치마크에서 유사 규모의 국내 모델 및 글로벌 최고 수준의 오픈소스 모델을 능가하는 점수를 기록했다. 한국 관련 전문 지식의 이해도를 측정하는 벤치마크 ‘KMMLU’와 한국어 언어모델 평가 지표인 ‘해례(HAERAE)’에서도 국내외 주요 오픈소스 모델보다 더 우수한 성능을 보인 것으로 나타났다.

한편 이날 SK텔레콤도 한국어 특화 LLM인 ‘A.X(에이닷엑스) 4.0’의 표준 모델(720억 파라미터)과 경량 모델(70억 파라미터)을 허깅페이스에 오픈소스로 공개했다고 밝혔다. 에이닷엑스 4.0은 알리바바 클라우드의 오픈소스 모델인 ‘큐원(Qwen) 2.5’에 한국어 데이터를 추가로 학습시켜 구현했다. SK텔레콤에 따르면 에이닷엑스 4.0은 자체 테스트 결과 같은 한국어 문장을 입력했을 때 GPT-4o보다 33%가량 높은 효율을 기록했다. SK텔레콤 관계자는 “이번 모델은 기업 내부 서버에 직접 설치해 사용할 수 있는 ‘온프레미스(On-premises) 방식’으로 제공해 기업들이 데이터 보안에 대한 걱정을 덜 수 있도록 서비스할 계획”이라고 밝혔다.

#한국형 AI#오픈소스#믿:음 2.0#데이터 보안#KT#SK텔레콤
© dongA.com All rights reserved. 무단 전재, 재배포 및 AI학습 이용 금지
  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0

댓글 0

지금 뜨는 뉴스