멘사 회원급 AI의 등장… 시험 대비 문제풀이로는 따라잡을 수 없다[맹성현의 AI시대 생존 가이드]

  • 동아일보
  • 입력 2025년 7월 15일 23시 00분


코멘트

AI 지능은 어디까지 왔나
AI ‘o3’, IQ 테스트서 135∼136점… 수학-과학-프로그래밍도 전문가급
“몇 년 내 64배 강력한 AI” 전망도… AI 고도화하면 사용료 증가될 것
필요 역량 달라져 교육 혁신 필요… 앞으로 3년, 공존 방안 준비할 때

맹성현 태재대 부총장·KAIST 명예교수
맹성현 태재대 부총장·KAIST 명예교수
《지난해 12월, 인공지능(AI) 업계에 충격적인 소식이 전해졌다. 오픈AI의 새 모델 ‘o3’가 세계 수재들의 모임 멘사의 지능지수(IQ) 테스트에서 135∼136점을 기록했는 것이다. 이는 인간 평균(90∼110점)을 훨씬 웃돌며, 멘사 회원 자격(상위 2% IQ로 약 132점)을 얻을 수 있는 수준이다. 이제 우리는 묻지 않을 수 없다. AI의 지능이 정말로 인간을 넘어선 것일까?》

o3의 성취는 IQ 점수에만 그치지 않는다. 특히 주목할 만한 것은 새로 등장한 문제 해결 능력 테스트 ‘아크 범용인공지능-1(ARC-AGI-1)’에서의 진전이다. 이 테스트는 AI가 이전에 본 적 없는 문제를 얼마나 잘 해결하는지를 측정한다. 놀랍게도 o3는 이 테스트에서 75%라는 성과를 냈다. 그러나 이보다 난도가 있는 ‘ARC-AGI-2’에서는 다시 4% 수준에 그쳐 도전 과제가 여전히 남아 있음을 보여줬다.

수학, 과학, 프로그래밍 분야에서도 놀라운 성과를 보였다. 2024년 미국 수학 올림피아드 예선(AIME)에서 80% 이상의 정확도를 보였고, 박사급 과학 문제에서도 해당 분야 박사 평균을 웃도는 성적을 거뒀다. 코딩 테스트에서도 고급 프로그래머 수준의 실력을 보여줬다. 이외에도 연구자들은 다양한 벤치마크(성능평가)를 통해 AI의 지능을 계속 평가하며 그 능력을 높여가고 있다. 예컨대, 종합지식 테스트인 ‘MMLU’는 57개 분야의 1만6000개 문제로 전반적인 지식 수준을 평가한다. 대학원 수준의 생물학, 물리학, 화학 문제들로 구성된 ‘GPQA’는 검색으로도 답하기 어렵다.

이들 평가 도구는 AI의 능력을 다양한 분야에서 정량화하는 유용한 수단이지만 AI의 총체적 능력을 설명하지는 못한다. IQ 테스트나 수능시험이 인간의 복합적 지능을 담아내지 못하는 것과 같다. 특히 창의성, 윤리적 판단, 사회적 지능, 메타인지 같은 영역은 여전히 측정하기 어렵다. 이런 점수들이 실제 유용성과 직결되지도 않는다. o3는 간단한 상식 문제에서 실수를 하고, 여전히 사실이 아닌 내용을 그럴듯하게 말하는 ‘환각’ 현상을 보인다.

그렇다면 앞으로 AI의 지능은 얼마나 더 발전할 수 있을까. AI의 발전 속도를 예측하려면 ‘스케일링 법칙’을 이해해야 한다. 이는 AI 모델의 성능이 컴퓨팅 파워, 데이터양, 모델 크기 등에 비례해 향상된다는 법칙이다. 현재 AI 훈련에 사용되는 컴퓨팅 파워는 연간 2.5∼4배씩 증가하고 있다. 만약 연간 4배 성장이 지속된다면, 3년 후인 2028년경에는 현재보다 64배 강력한 AI가 등장할 수 있다는 계산도 나온다. 미국 비영리 AI 연구기관인 ‘에포크AI’는 2030년이 되면 현재보다 1만 배 큰 컴퓨팅 파워로 AI를 훈련하는 것이 기술적으로 가능하다고 전망한다. 이는 인간이 지능을 키우기 위해 뇌의 용적을 늘리는 것과 같다.

하지만 이런 컴퓨팅 파워에 의존하는 성장에는 현실적 한계가 있다. 첫째, 그래픽처리장치(GPU)와 같은 하드웨어 비용과 전력 소모의 문제다. 고성능 AI 모델 운영은 막대한 전력과 비용을 요구한다. 둘째, 대용량 모델을 훈련시킬 고품질 훈련 데이터의 한계다. 연구에 따르면 인터넷상의 고품질 텍스트 데이터는 2026년경 고갈될 것으로 예상된다.

최근에는 ‘테스트 타임 스케일링’이라는 새로운 접근법이 주목 받는다. 이는 더 큰 모델을 만들어 지능을 키우기보다, 추론을 통해 숙고하게 해 고난도 문제 해결 능력을 부여하는 것이다. 문제를 받았을 때 답을 즉시 내놓지 않고 여러 가능성을 검토하며 단계적으로 추론하는 시간을 늘리는 식이다. 실제로 o3가 테스트에서 높은 성과를 낸 것도 이런 ‘천천히 깊게 생각하기’ 방식 덕분이라는 분석이 많다.

AI 발전의 이면에는 천문학적 비용이 숨어 있다. o3의 고성능 모드는 문제 하나당 수백 달러의 컴퓨팅 비용이 든다. AI 모델 전체 훈련 비용은 더하다. 다리오 아모데이 앤트로픽 최고경영자(CEO)는 올해 AI 모델 훈련 비용이 100억 달러에 이를 것으로 추산했다. 이후로는 1000억 달러까지 치솟을 수 있다고 한다. 비용 문제는 새로운 수익 모델을 요구한다. 오픈AI는 이미 고급 요금제를 운영 중이다. AI가 똑똑해질수록 사용료도 비례해서 오르는 셈이다.

IQ 135인 AI는 사회 전반에 끼칠 파급효과가 매우 크다. AI는 이미 코딩, 글쓰기 등 콘텐츠 생성, 분석 및 통합 업무에서 인간과 경쟁하고 있다. 3년 후 더 똑똑해진 AI는 의료 진단, 법률 상담, 금융 분석 같은 고숙련 업무에 본격 투입될 것이다. 교육 시스템도 근본적인 재검토가 필요하다. AI가 표준화된 시험에서 인간을 능가한다면, 그래서 그런 능력을 요구하는 일자리를 AI가 대체한다면, 문제풀이 중심 교육은 의미를 잃는다. 그 대신 창의성, 비판적 사고, 인간적 소통 능력 등이 더욱 중요해질 것이다.

우려만 있는 것은 아니다. AI는 개인 맞춤형 교육 등 교육의 혁신을 가능하게 하고, 연구개발(R&D)을 가속화한다. ‘알파폴드 3’처럼 신약 개발 과정을 혁신하고, 기후변화 해결책을 찾는 데도 활용될 수 있다. 휴머노이드 로봇은 위험하고 반복적인 작업을 대신할 것이다.

IQ 135 AI의 등장은 단순한 기술적 성취가 아니라 인류 역사의 전환점으로 봐야 한다. AI로 인한 여파가 이제 구체적 현실로 다가왔다. 앞으로의 3년이 핵심이다. 이 기간에 우리는 AI와 어떻게 공존할지 결정해야 한다. 정부는 규제 방안을, 기업은 윤리적 활용 원칙을, 학교는 교육 혁신을, 개인은 새로운 역량을 준비해야 한다.

#인공지능#IQ 테스트#ARC-AGI#수학 올림피아드#컴퓨팅 파워#교육 혁신
© dongA.com All rights reserved. 무단 전재, 재배포 및 AI학습 이용 금지
  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0

댓글 0

지금 뜨는 뉴스