올 초 중국 딥시크가 인공지능(AI) 시장에 파장을 일으킨 데 이어, 문샷 AI가 개발한 ‘키미 K2(Kimi K2)’도 높은 성능을 보였다고 중국 신화통신이 보도했다. 중국 AI 스타트업들이 거대 언어모델(LLM) 분야에서 높은 수준의 기술을 개발했다는 것이다.
19일 신화통신에 따르면 국제학술지 네이처는 최근 키미 K2 성능이 탁월하다며 ‘딥시크급 충격’이라고 소개했다. 서방권 유료 AI 모델과 대등하거나 그 이상 수준의 성능을 보였는데, 특히 코딩, 작문 분야에서 두각을 나타내며 기술적 완성도가 돋보인다는 평가다. 키미 K2는 프로그래밍 성능을 평가하는 다양한 지표에서 GPT-4나 R1 최신 버전을 뛰어넘는 정확도를 기록했다. SWE-벤치(SWE-bench) 정답률은 약 66%, 라이브코드벤치(LiveCodeBench) 정답률은 54%에 달했다 이는 공개된 모델 중 최고 수준이다. 수학 문제 풀이를 평가하는 매쓰-500(MATH-500)에서도 97.4%의 높은 정확도를 보였다.
작문 능력 역시 AI 모델 중 최상위권으로 평가받고 있다. 자연스러움과 창의성, 감성지능 등을 평가하는 항목(Creative Writing v3, EQ-bench 3)에서도 모두 최고 점수를 받았다. 다만 키미 K2가 모든 분야에서 완벽한 것은 아니다. 연구 아이디어 예측 능력을 평가 벤치마크(SciMuse)는 구글의 제미나이(Gemini)나 오픈AI의 챗GPT에 다소 뒤처진 것으로 나타났다. 고도의 추론을 요구하는 문제에서는 아직 발전 여지가 남아 있다는 분석이다.
키미 K2는 총 1조 개의 파라미터를 갖추고 있지만, 혼합 전문가(Mixture of Experts, MoE) 구조를 활용해 실제 연산 시에는 약 320억 개의 파라미터만을 활성화한다. 이 덕분에 상대적으로 낮은 연산 자원으로도 높은 성능을 낼 수 있어, GPU 비용을 크게 줄이면서도 고효율을 실현한 모델로 평가된다.
문샷 AI는 2023년 3월 설립된 베이징 소재 스타트업이다. 초기 버전인 키미는 2023년 11월 기준으로 중국에서 가장 널리 사용되는 챗봇 중 세 번째에 올랐다. 특히 20만자 이상의 장문 입력 처리가 가능한 모델을 최초로 선보이며 기술적 도약을 알렸다.
회사의 공식 명칭은 ‘베이징 달의 어두운 면 과학기술 유한회사’(北京月之暗面科技有限公司)다.로, 창업자인 양즈린(楊植麟)이 핑크 플로이드의 명반 ‘더 다크 사이드 오브 더 문’(The Dark Side of the Moon)에서 영감을 받아 지은 이름이다.
양즈린은 광둥성 출신으로, 칭화대 수석 졸업 후 카네기멜런대에서 박사학위를 받은 인물이다. 페이스북 AI 리서치, 구글 브레인 등에서 경험을 쌓았고, 현재는 칭화대 조교수로 재직 중이다. 중국 현지에서는 ‘90허우(90後)’ 세대의 기술 부호 후보로도 주목받고 있다.
댓글 0