‘O4-mini’ 버금가는 성능으로 오픈 모델로 공개

중국 AI 기업 딥시크(DeepSeek)가 추론 AI 모델 ‘DeepSeek R1을 마이너 업데이트해 ’DeepSeek-R1-0528’을 출시했다고 기술과학매체 기가진이 중국 SNS 위챗을 인용해 보도했다.

보도에 따르면, Hugging Face 저장소에는 모델 설명이 포함돼 있지 않고 모델의 동작을 이끄는 내부 컴포넌트인 설정 파일과 가중치만 포함돼 있다.

마이너 업데이트된 ‘DeepSeek-R1-0528’은 파라미터 수 6850억으로 다소 무게가 실렸다. 업데이트 내용은 주로 추론 능력의 향상으로, ‘구글e 모델과 같이 깊게 추론하게 됐다’, ‘코드 생성 과제의 개선’, ‘빠를 뿐만 아니라 사려 깊고, 독특한 추론 스타일’, ‘태스크 당 최대 30~60분이라고 하는 장시간의 사고 세션’이 특징이라고 한다.

코드의 생성이나 복구, 코드 실행, 출력 예측 등 광범위한 코딩으로 벤치마크를 실시하는 LiveCodeBench에서는 이미 DeepSeek-R1-0528이 랭킹에 게재돼 있다.

DeepSeek-R1-0528의 순위(2024년 8월 1일~2025년 5월 1일)는 현재 4위로 오픈AI의 o4-mini(medium)와 거의 어깨를 나란히 하는 성능을 나타내는 점수를 기록했다.

저작권자 © 테크튜브 무단전재 및 재배포 금지