오픈AI가 공개한 비디오·오디오 생성 모델 ‘소라2’를 만든 영상들. 물리 엔진 개선으로 사실감을 높였으며, 구글 ‘비오3’와 비교해 경쟁력도 주목된다. 오픈AI 제공
챗GPT 제작사 오픈AI가 차세대 비디오·오디오 생성 모델 ‘소라2(Sora 2)’를 공개했다. 현실감을 강화한 시뮬레이션 기능과 대규모 물리 엔진 개선으로, “이전에는 불가능했던 동작까지 구현할 수 있다”는 평가가 나온다.
● 세계관 생성부터 구현까지 가능해졌다
오픈AI는 지난달 30일(현지시간) 자사 홈페이지를 통해 소라2와 신규 소셜네트워크서비스(SNS) ‘소라’를 출시했다고 밝혔다.
소라2로 구현한 머리에 고양이를 얹고 트리플 악셀을 하는 피겨 선수. 오픈AI 제공
소라2로 구현한 물에 다이빙하는 남성. 오픈AI 제공소라2는 지난해 2월 첫 공개된 비디오 생성 AI 모델의 후속작이다. 기존 모델은 영상이 왜곡되거나 ‘불쾌한 골짜기’ 현상이 나타난다는 지적이 많았지만, 이번 버전은 어색함을 크게 줄였다. 개발팀은 “복잡한 명령어를 수행하면서도 세계관을 유지할 수 있다”며 시연 영상을 공개했다.
공개된 영상에는 ‘고양이를 머리에 얹은 채 트리플 악셀을 도는 피겨 선수’, 1990년대 서부영화 풍으로 말을 타고 선 남성, 일본 애니메이션 스타일 장면 등이 사실감 있게 구현됐다.
● 물리 엔진 대규모 개선…”실수까지 표현해”
소라2로 구현한 스케이트 보드를 타는 남성. 부딪혔다 떨어지는 모습이 현실의 물리 법칙에 맞추어 구현돼 있다. 오픈AI 제공소라2는 물리 엔진을 대폭 강화했다. 이전에는 농구 슛 장면처럼 단순 동작에서도 공이 순간이동하는 오류가 있었지만, 이번 모델은 백보드에 맞고 튀어 오르는 ‘실수’까지 표현한다.
소라2를 공개하는 샘 올트먼 오픈AI CEO. 오픈AI 홈페이지 캡처개발팀은 “세계관 시뮬레이션에는 성공뿐 아니라 실패도 모델링해야 한다”며 “완벽하진 않지만 물리 법칙을 훨씬 잘 따른다”고 설명했다. 실제 인물이 범하는 작은 실수조차 자연스럽게 구현된다는 점에서 전작과 차별화된다. ● 구글 ‘비오3’와 비교해 경쟁력은?
현재 비디오·오디오 AI 분야의 강자는 구글의 ‘비오3(Veo 3)’다. 그러나 소라2가 물리 법칙 구현 성능과 다양한 영상 스타일 적용 면에서 뛰어나 경쟁 모델을 앞선다는 후기가 나온다. 특히 세부 묘사가 풍부해 짧은 영상에 더욱 강하다는 평가가 주를 이뤘다.
소라2 개발팀은 “사실적, 영화적, 애니메이션 스타일 모두 구현할 수 있는 성능을 갖췄다”고 강조하며 “동영상 생성 AI 모델의 발전으로 우리 사회가 근본적으로 바뀔 것이다. 소라는 세계에 기쁨, 창의성, 그리고 연결을 가져다 줄 것”이라 밝혔다.
댓글 0