메모리시장 충격 준 터보퀀트…“AI 반도체 수요 고도화”

장진복 기자
수정 2026-03-27 15:57
입력 2026-03-27 15:57
AI의 메모리 사용량 6분의 1로 줄여
“효율 중심 AI 시대…핵심 기반기술 될 것”
구글이 인공지능(AI) 운영의 최대 걸림돌로 꼽히는 ‘메모리 병목 현상’을 소프트웨어 혁신으로 해결할 수 있는 차세대 압축 기술을 공개해 메모리 반도체 시장에 충격을 주고 있다.
26일(현지시간) 구글 등에 따르면 터보퀀트는 AI 모델의 메모리 사용량을 줄여주는 기술이다. 정확도 저하 없이 모델의 크기를 극단적으로 축소하는 압축 기법을 이용해 AI의 메모리 사용량을 6분의 1로 줄였다.
챗봇을 비롯한 AI 모델은 추론하고 답변을 생성하는 데 사용자와의 이전 대화와 검색 결과 등 주요 맥락 정보가 필요하다. 대화가 오래 계속되면 메모리에 저장되는 맥락 데이터도 늘어나게 되고, 메모리 사용량도 그만큼 늘어나게 마련이다.
구글은 터보퀀트에서 이와 같은 맥락 데이터의 크기를 줄이는 ‘극좌표양자화’(폴라퀀트)와, 오차를 줄이는 ‘QJL’(양자화 존슨-린덴스트라우스 변환) 기술을 바탕으로 이러한 성과를 거뒀다.
폴라퀀트 기술은 AI가 다루는 데이터의 구조를 직교좌표계에서 극좌표계로 바꾸는 방식으로 크기를 줄인다. 압축 과정에서 발생할 수 있는 미세한 오차는 QJL 기술을 이용해 바로잡는다. 단 1비트만을 소모하는 이 기술은 메모리를 거의 사용하지 않고도 일종의 ‘수학적 오류 검사기’ 역할을 하게 된다.
터보퀀트 연구에는 카이스트(한국과학기술원)의 한인수 전기·전자공학부 교수도 참여해 눈길을 끈다.
한 교수는 27일 카이스트를 통해 “AI가 고용량 중심에서 고효율 중심으로 전환되면서, AI는 더 저렴해지고 빠르게 확산하는 동시에 반도체 수요 역시 질적으로 고도화될 전망”이라고 밝혔다. 그는 “이번 연구는 AI 메모리 사용량 증가 병목을 효과적으로 줄이면서도 정확도를 유지할 수 있는 새로운 방향을 제시했다”며 “대규모 AI 모델을 더욱 효율적으로 운영할 수 있는 핵심 기반 기술로 활용될 것으로 기대한다”고 강조했다.
업계에선 이 기술이 메모리 사용량을 극단적으로 줄이는 만큼, 데이터센터 등을 운영하는 거대 기술기업들의 메모리 칩 수요가 줄어들 것이라는 우려가 나오고 있다. 그러나 장기적으로는 오히려 메모리 시장에 긍정적인 영향을 미칠 것이라는 게 시장 분석가들의 설명이라고 블룸버그 통신은 전했다.
숀 김 모건스탠리 분석가는 “모델이 성능 저하 없이 메모리 요구량을 낮춰 실행할 수 있다면 비용이 크게 감소해 AI 도입의 수익성이 높아질 것”이라며 “비용이 낮아지면 제품 채택 수요도 증가해 장기적으로 메모리 제조사에도 이익이 될 것”이라고 내다봤다.
장진복 기자
에디터 추천 인기 기사
많이 본 뉴스