에버그린 해설 · 중립 데이터, 의견 없음

추상추론 점수 (ARC-AGI)

현재 검증값

88%

OpenAI o3 · ARC-AGI-1, 고연산 (2024-12)

보도자료 · 2024-12 사람 검증 완료

무엇을 재는가

ARC-AGI-1 점수 — 사람에겐 쉽지만(~85%) AI엔 오래 어려웠던 퍼즐. 2024년 12월 OpenAI o3가 76~88%에 도달해, 이 시험에서 암기를 넘어선 첫 AI가 됐습니다. ARC-AGI-2는 더 어려운 후속으로 프론티어 모델도 아직 낮은 점수입니다. (제3자 벤치마크이며 우리 점수가 아닙니다.)

지표 사전 →

추이

주체별

OpenAIo3, 고연산 (2024)88%

목표 / 기준선

현재88%

목표~85% (human)

기준선GPT-3 시기 (~0%)

ARC-AGI-1에서의 평균 인간 성능 — AI가 2024년 말 넘어선 기준선.

무엇을 재는가

추이

주체별

목표 / 기준선

관련 읽을거리