오픈 추론 모델, 일부 비용으로 프런티어에 필적
2025-01DeepSeek (R1)
공개된 RL 추론 모델 DeepSeek-R1이 수학·코딩에서 선두 폐쇄 모델에 필적 — AI 자본지출에 대한 시장의 재평가를 촉발.
중국 오픈웨이트 모델 개발사; 적은 컴퓨트로 프론티어급 성능을 내 주목받음.
우리가 공개 출처로 작성한 프로필입니다.
현황·마일스톤은 프로필 관리 주체와 무관하게 항상 우리가 1차 출처로 검증합니다.
공개된 RL 추론 모델 DeepSeek-R1이 수학·코딩에서 선두 폐쇄 모델에 필적 — AI 자본지출에 대한 시장의 재평가를 촉발.
DeepSeek 1.6조 파라미터 V4가 화웨이 Ascend(950PR)에서 구동되고, 화웨이 주도 팀이 Ascend 910C 약 1,000장으로 전체 파라미터 사후학습 완료 — 컴퓨트 주권의 이정표. 단 사전학습 하드웨어는 미공개라 "엔비디아 없이 학습"은 입증되지 않음.