비드래프트, GPU 재학습 없는 LLM 프레임워크 ‘Darwin Family’ 기술 공개

수정 2026-05-19 17:02
입력 2026-05-19 16:53
GPU 추가 학습 없이 글로벌 AI 추론 성능 3위 달성
비드래프트 로고 (출처: 비드래프트)


국내 인공지능(AI) 스타트업 비드래프트(VIDraft Inc.·대표 김민식)가 추가 GPU 학습 과정을 거치지 않고도 최상위권 추론 성능을 도출하는 대형언어모델(LLM) 프레임워크 기술을 공개했다.

비드래프트는 자사가 개발한 ‘Darwin Family’ 계열 모델의 핵심 기술을 담은 연구 논문을 공개하고, 관련 핵심 기술 3건에 대한 국내 특허를 출원했다고 밝혔다.


이번에 등록된 논문은 「Darwin Family: MRI Trust Weighted Evolutionary Merging for Training Free Scaling of Language Model Reasoning」으로, 현재 Hugging Face Papers와 오픈소스 아카이브 arXiv(등록번호 2605.14386)에 게재된 상태다. 본 연구에는 비드래프트 소속 연구원 7명이 공동 저자로 참여 명단을 올렸다.

Darwin Family는 기존 AI 개발 과정에서 필수로 여겨졌던 추가 학습(Post training) 없이 모델 병합만으로 고성능 추론 능력을 구현하는 새로운 방식의 AI 모델 프레임워크다. 핵심 기술은 MRI Trust Fusion, 14차원 적응형 병합 게놈(Merge Genome), 아키텍처 매퍼(Architecture Mapper) 등 세 가지로 구성된다.

MRI Trust Fusion은 모델 각 레이어의 기능적 중요도를 분석한 뒤 신뢰 파라미터를 기반으로 동적 융합을 수행하는 기술이다. 이를 통해 GPQA 정확도를 기존 방식 대비 2.5%포인트 향상시켰다는 설명이다.



또한 14차원 병합 게놈 기술은 어텐션과 FFN, 임베딩 등 모델 내부 구성 요소를 세밀하게 제어하며 경사하강법 없이 진화 탐색만으로 최적 병합 전략을 자동 탐색한다. 아키텍처 매퍼는 Transformer와 Mamba 등 서로 다른 AI 구조 간 결합을 가능하게 하는 기술로, 추가 재학습 없이 이종 모델 교배를 구현한다.

Darwin Family는 Hugging Face가 주관하는 AI 성능 벤치마크인 ‘GPQA Diamond(Graduate Level Google Proof Q&A)’ 평가에서 글로벌 3위를 기록했다. 해당 지표는 박사 학위 소지자 수준의 과학적 추론 능력을 평가하는 대표적 기술 지표다.

비드래프트는 별도의 파인튜닝이나 사후 학습을 거치지 않고도 수백억 파라미터 규모의 Fully Trained 모델들의 성능 데이터 수준을 상회했으며, 최소 4B부터 최대 35B 규모에 이르기까지 다양한 모델 세그먼트 구간에서 부모 모델 대비 실질적 성능 향상 수치를 검증했다고 밝혔다.

국내 정량 평가 지표에서도 상위 순위를 점유하고 있다. 과학기술정보통신부와 한국지능정보사회진흥원(NIA)이 주관·운영하는 ‘K-AI 리더보드’에서는 Darwin 기반 모델들이 2위, 3위, 4위, 5위, 7위, 8위를 동시에 기록 중인 것으로 집계됐다. 특히 현재 1위 모델과의 데이터 점수 격차는 0.001점 범위 내에 있는 것으로 확인됐다.

비드래프트에 따르면 공식 모델 공개 이후 45일 만에 파생·양자화 레포지터리 88개와 개별 모델 파일 473개가 생성됐다. GGUF 양자화 분야 개발자 bartowski와 mradermacher 등 글로벌 오픈소스 커뮤니티 개발자들도 Darwin 모델군 배포와 최적화 작업에 참여하고 있다.

현재 Darwin 모델은 Windows·Linux·Mac 환경의 GGUF 포맷을 비롯해 Apple MLX, AWQ, NVIDIA Blackwell 전용 NVfp4 등 다양한 플랫폼을 지원한다.

김민식 비드래프트 대표는 “Darwin 생태계의 확산 속도와 규모는 국내 AI 모델 역사에서도 보기 드문 수준”이라며 “세계 최상위권 양자화 개발자들의 자발적 참여와 폭넓은 플랫폼 지원 체계를 기반으로 글로벌 AI 표준 생태계로 진입하고 있다”고 밝혔다.

한편, 이번 연구는 과학기술정보통신부 재원으로 수행된 ‘AI컴퓨팅자원활용기반강화(GPU 임차 지원) 사용자 지원사업’의 지원을 받아 진행됐다.

양승현 리포터
에디터 추천 인기 기사
많이 본 뉴스