올해 초 미국 실리콘밸리의 한 콘퍼런스에서 훈민정음 서문과 세종대왕의 얼굴이 무대 화면을 채우며 ‘한글은 인공지능(AI)이 가장 빨리 숙달할 수 있었던 언어’라고 소개된 순간을 잊지 못한다. 실제로 오픈AI와 구글의 대규모언어모델(LLM)은 2TB 용량의 한국어 데이터를 학습해 한글을 완벽히 마스터했다. 600년 만에 한글의 우수성이 객관적 지표로 증명된 것이지만, 한국인보다 유창하게 한국어를 쓰는 AI가 존재하는 상황은 다른 고민을 던진다.
일부에서는 해외 LLM의 동해 표기 논쟁이나 한복·한식의 왜곡 문제를 막겠다며 K-LLM을 만들어야 한다고 주장한다. 반대로 한국형 AI는 의미 없다고 폄하하는 이들도 있다. 그러나 이런 논쟁은 ‘소버린(sovereign·주권) AI’에 대한 잘못된 이해에서 비롯됐다. 즉, 모델의 유창성과 데이터 주권을 구별해서 봐야 하는 것이다. 예컨대 구글 제미나이가 학습하고 있는 구글 데이터세트에서 ‘Japan History’를 찾으면 일본 정부가 관리한 방대한 역사 데이터가 쏟아지지만 ‘Korea History’는 거의 찾아지지 않는다. AI의 한국 문화·역사 왜곡을 막으려면 LLM을 직접 만드는 것과는 별개로 국가 차원의 데이터 관리가 필요하다.
에릭 슈밋 전 구글 최고경영자(CEO)는 최근 ‘출산율 0.7명인 한 아시아 국가는 AI로 국내총생산(GDP)을 유지해야 할 것’이라고 말했다. 한국이 ‘AI 3대 강국’이 돼야 하는 이유도 결국 생존하기 위해서다. 이 목표를 이루려면 지금 각지에 짓고 있는 지역 데이터센터보다 더 큰 구상이 필요하다. 글로벌 빅테크들의 초대형 데이터센터를 유치하는 것이 한 방안이다.
그래픽처리장치(GPU)는 ‘물에서 건지면 금세 썩는 생선’에 비유될 만큼 수명이 2∼4년으로 짧다. 실제로 정부 운영의 광주 AI 데이터센터도 3000장의 GPU 중 절반만 가동 중이다. 수요도 없이 수만 장의 GPU를 사서 데이터센터를 짓고 서비스를 제공하겠다는 발상은 이미 실패로 증명됐다.
그렇다면 확실한 수요를 가진, 초거대 슈퍼 데이터센터를 두는 게 필요하다. 이 밖에 한반도에 한 번에 수십만 장의 GPU를 확보할 다른 길은 없다. 이를 위해선 빅테크들의 조건인 해저 케이블 육양국 위치, 안정적 전력과 냉각수 공급, 항만·공항 인프라, 풍부한 인재와 제조업 기반 등에서 아시아 최고의 해답인 부산의 강점을 어필해야 한다. 슈퍼 데이터센터를 넘겨줘 왔던 싱가포르, 호주 시드니, 일본 도쿄와 이제는 경쟁에서 이겨야 한다.
슈퍼 데이터센터는 AI 3대 강국으로 도약하기 위한 교두보다. 이를 통해 버티컬(Vertical) AI 인프라 확충, 우수 인재 리쇼어링, 정예화된 AI 투자 허브 조성 등의 효과를 기대할 수 있다.
미국 핵심 투자기관의 리포트에 따르면 이미 LLM을 넘어 초고해상도 산업용 AI 전쟁이 벌어지고 있다. 한국은 어떻게 대비하고 있을까? 다행히 세종대왕 덕에 굳이 K-LLM을 만들 필요는 없다. 게다가 우리에겐 세계적 수준의 제조업 생태계까지 모든 조건이 완벽하다. 세종대왕이라면 이런 조건을 지닌 후손들의 어떤 결단과 노력을 응원하고 계실까?
댓글 0