기술/연구

“GPT-4o보다 99배 빠르다고?” 게임용 GPU로 AI 시장 판도 바꿀까?

댓글 0 · 저장 0 2025.05.11 22:02

기사 3줄 요약

1 파스티노, 특정 작업 특화 AI 'TLM' 공개
2 GPT-4o보다 빠르고 저렴한 GPU로 구동
3 월 정액제와 무료 API로 시장 공략

AI 업계에 GPT-4o의 아성에 도전하는 새로운 주자가 등장했습니다. AI 스타트업 파스티노가 특정 작업에 최적화된 'TLM' 모델을 선보이며, 기존 거대 AI보다 빠르고 정확하며 운영비도 저렴하다고 주장해 화제입니다.

만능 AI는 이제 그만! '특정 임무 전문 AI'가 온다고?

TLM은 특정 임무에 맞춰 설계된 소형 언어 모델(sLM)입니다. 챗GPT 같은 만능 LLM과 달리, TLM은 글 요약, 정보 추출, 개인정보 보호, 욕설 필터링 등 특정 작업에 특화된 전문가와 같습니다. 파스티노는 이 '정밀 타격' 방식이 훨씬 효율적이라고 강조합니다. 특정 수술은 해당 전문의가 더 능숙한 것과 같은 이치입니다.

비싼 장비 없이 게임용 GPU로? 이게 가능해?

더욱 놀라운 점은 TLM이 고가의 전문가용 장비가 아닌, 일반 게임용 그래픽 카드(GPU)나 CPU에서도 잘 작동한다는 것입니다. 파스티노는 10만 달러(약 1억 3천만 원) 미만 비용으로 게임용 GPU만 사용해 TLM을 훈련시켰다고 밝혔습니다. AI 모델 운영 비용을 크게 줄일 수 있는 혁신으로, 작업 특화 설계를 통해 효율을 높인 덕분입니다. 군살 뺀 스포츠카처럼 연비와 속도를 모두 잡은 셈입니다.

그래서, GPT-4o보다 얼마나 더 똑똑하고 빠른 건데?

파스티노의 주장에 따르면, TLM은 특정 작업에서 GPT-4o보다 최대 99.67배 빠르고, 정확도는 17% 이상 높다고 합니다. 예를 들어, 복잡한 글에서 정보를 추출하거나 욕설을 찾아내는 작업에서 뛰어난 성능을 보였다는 것입니다. 이는 파스티노 측의 자체 테스트 결과로 추가 검증이 필요하지만, 사실이라면 기업의 AI 도입 비용 부담을 크게 덜어줄 수 있습니다.

요금은 얼마? 우리 회사에서도 쓸 수 있을까?

파스티노는 사용량 기반 과금 대신 '월 정액 요금제'를 도입했고, 업계 최초로 월 1만 건까지 무료 API를 제공합니다. 개발자나 소규모 기업도 부담 없이 AI를 써볼 수 있게 한 것입니다. 또한, 기업 내부 서버(온프레미스)나 현장 장비(엣지)에 직접 설치 가능해, 민감한 데이터 유출 걱정 없이 AI를 활용할 수 있어 금융, 의료 분야에 매력적입니다.

구분	TLM	GPT-4o
아키텍처	트랜스포머 기반, 작업 특화 단계 도입	트랜스포머 기반
하드웨어	CPU, 일반 소비자용 GPU	고성능 GPU
훈련 비용	10만 달러 이하	미공개 (훨씬 높을 것으로 예상)
가격 모델	월 정액 요금제, 월 1만 건까지 무료	토큰당 과금
배포 옵션	온프레미스, 엣지	클라우드
특화 작업	요약, 함수 호출, 텍스트-JSON 변환 등	범용
추론 속도	GPT-4o 대비 최대 99.67배 빠름 (특정 작업)	-
정확도	GPT-4o 대비 최대 17% 높음 (특정 작업)	-

투자는 얼마나 받았길래 이렇게 자신만만해?

파스티노는 최근 유명 투자사 코슬라 벤처스 등으로부터 총 2,500만 달러(약 350억 원)의 투자를 유치했습니다. 마이크로소프트 투자 부문도 초기 투자자로 참여했습니다. 이는 파스티노의 기술력과 성장 가능성을 업계가 높이 평가한다는 신호입니다. 과연 TLM이 기업용 AI 시장의 판도를 바꿀 수 있을지 그 귀추가 주목됩니다.