프론티어 AI 에버그린 해설 · 중립 데이터, 의견 없음
추상추론 점수 (ARC-AGI)
현재 검증값
88%
무엇을 재는가
ARC-AGI-1 점수 — 사람에겐 쉽지만(~85%) AI엔 오래 어려웠던 퍼즐. 2024년 12월 OpenAI o3가 76~88%에 도달해, 이 시험에서 암기를 넘어선 첫 AI가 됐습니다. ARC-AGI-2는 더 어려운 후속으로 프론티어 모델도 아직 낮은 점수입니다. (제3자 벤치마크이며 우리 점수가 아닙니다.)
지표 사전 →추이
주체별
목표 / 기준선
현재88%
목표~85% (human)
기준선GPT-3 시기 (~0%)
ARC-AGI-1에서의 평균 인간 성능 — AI가 2024년 말 넘어선 기준선.