RWA 뷰스 / 77.1% 추론 성능·1,000만 달러(약 145억 500만 원) 보안 지원… 구글·오픈AI, 온체인 ‘추론

구글은 ‘제미나이 3.1 프로’의 ARC-AGI-2 추론 점수가 77.1%로 이전 세대 대비 두 배 이상 개선됐다고 밝혔다.

오픈AI는 패러다임과 함께 스마트 콘트랙트 취약점 평가용 ‘EVM벤치’를 공개하고 총 1,000만 달러(약 145억 500만 원) API 크레딧을 보안 연구에 지원한다고 전했다.

77.1% 추론 성능·1,000만 달러(약 145억 500만 원) 보안 지원… 구글·오픈AI, 온체인 ‘추론+보안’ 경쟁 본격화 / TokenPost.ai

리딩 AI 기업인 구글과 오픈AI가 나란히 ‘추론 성능’과 ‘보안 검증’에 초점을 맞춘 신형 도구를 내놓으며, 암호화폐와 온체인 생태계를 겨냥한 경쟁에 속도를 내고 있다. 복잡한 문제 해결 능력을 강화한 구글의 ‘제미나이(Gemini) 3.1 프로(Pro)’와, 스마트 콘트랙트 취약점을 겨냥한 오픈AI의 ‘EVM벤치(EVMbench)’는 모두 암호화폐 시장의 보안·인프라 수준을 한 단계 끌어올릴 수 있는 기반 기술로 평가된다.

구글, 복잡한 추론 강화한 ‘제미나이 3.1 프로’ 공개

구글은 대표 모델을 업그레이드한 ‘제미나이 3.1 프로’를 공개하며, 소비자용 서비스부터 기업용, 개발자 도구까지 전 제품군에 걸쳐 적용을 예고했다. 이번 버전은 특히 ‘추론(reasoning)’과 ‘복잡한 문제 해결’ 성능을 강화했다는 점을 전면에 내세운다.

구글에 따르면 제미나이 3.1 프로는 이전 세대인 ‘제미나이 3 프로’가 기록한 ARC-AGI-2 벤치마크 점수를 두 배 이상 끌어올려, 검증된 77.1% 성능을 달성했다. ARC-AGI-2는 완전히 새로운 유형의 논리 패턴을 얼마나 잘 풀어내는지를 평가하는 척도로, 단순 질의응답이 아닌 다단계 추론과 문제 해결 능력을 보는 시험에 가깝다. 구글은 이 점수를 근거로, 제미나이 3.1 프로가 ‘여러 단계의 판단이 필요한 워크플로’에 적합해졌다고 강조한다.

추천 기사