OpenAI 긴장? 무료 AI 목소리 ‘Dia’ 도전장
댓글 0
·
저장 0
·
편집: 이도윤 기자
발행: 2025.04.23 04:04

기사 3줄 요약
- 1 무료 AI 음성 합성 'Dia' 공개, 업계 주목
- 2 오픈소스로 개발, OpenAI 등에 도전장 내밀어
- 3 품질 불안정, 영어만 지원 한계 지적
AI가 글자를 읽어주는 음성 합성(TTS) 분야에 새로운 강자가 나타났습니다. 바로 ‘Dia’라는 이름의 오픈소스 모델입니다. 누구나 무료로 사용할 수 있다는 점을 내세워, 이미 시장을 장악한 일레븐랩스(ElevenLabs)나 OpenAI 같은 유료 서비스에 도전장을 내밀었습니다.
Dia는 나리 랩스(Nari Labs)가 개발한 16억개 매개변수(파라미터) 규모의 모델입니다. 개발사는 Dia가 실제 사람처럼 자연스러운 대화, 웃음이나 기침 같은 비언어적 표현, 심지어 목소리 복제까지 가능하다고 설명합니다. 마치 대본만 주면 AI가 연기를 하는 셈이죠. 기존 강자들과 비슷한 기능을 제공하는데, 과연 성능도 비슷할까요?
그래서 Dia가 뭔데?
Dia는 텍스트만 입력하면 바로 목소리를 만들어내는 AI 기술입니다. 특히 대화 형식의 글을 주면, 단순히 글자를 읽는 것을 넘어 실제 대화처럼 자연스러운 타이밍과 억양을 구현하는 데 강점이 있다고 합니다. 예를 들어 대본에 ‘(웃음)’이라고 적혀 있으면, 진짜 웃음소리를 내주는 식이죠. 목소리 톤이나 감정도 조절할 수 있습니다. 핵심은 ‘오픈소스’라는 점입니다. 설계도가 공개되어 있어 누구나 자유롭게 가져다 쓰고 개선할 수 있습니다. 비싼 사용료를 내야 하는 기존 서비스들과 달리 완전 무료라는 강력한 무기를 가진 셈입니다.OpenAI랑 비교하면 어때?
기존 서비스들과 비교하면 Dia는 장단점이 뚜렷합니다. 아래 표로 간단히 비교해 보겠습니다.구분 | Dia TTS | ElevenLabs | OpenAI TTS |
---|---|---|---|
품질 | 괜찮지만 불안정. 가끔 잡음, 이상한 소리 발생. 비언어적 표현 지시 시 오류. 말이 빨라지기도 함. | 매우 자연스러움. 사람 목소리에 가까움. | 품질 좋으나 다소 로봇 느낌. |
속도 | 정확한 수치 미공개. 단번에 대화 생성 가능해 효율적일 것으로 추정. | 매우 빠름. 짧은 텍스트 기준 OpenAI보다 4배 빠르다는 보고 있음. | ElevenLabs보다 느림. |
가격 | 무료 (오픈소스) | 구독형 유료. 사용량 많으면 비쌈 (100만 글자당 약 22만원) | 사용량 기반 유료. ElevenLabs보다 저렴 (100만 글자당 약 2만원) |
언어 지원 | 영어만 가능 | 다국어 지원 | 다국어 지원 |
비언어적 표현 | 웃음, 기침 등 실제 소리 구현 | 'haha' 같은 텍스트로 대체 | 지원 안 함 |
소스 공개 여부 | 오픈소스 (공개) | 독점 (비공개) | 독점 (비공개) |
공짜인데, 단점은 없어?
물론 Dia에도 단점은 있습니다. 가장 큰 문제는 아직 품질이 불안정하다는 점입니다. 사용 후기를 보면 가끔 이상한 소음이 섞이거나, ‘(멈춤)’ 같은 지시어를 넣으면 아예 이상한 소리를 내뱉는 경우가 있다고 합니다. 특정 목소리를 꾸준히 유지하는 능력도 부족하고, 문장 끝이 잘리는 현상도 보고됩니다. 결정적으로 현재는 영어만 지원합니다. 한국어 등 다른 언어를 사용하려면 아직 Dia는 선택지가 될 수 없습니다. 또한, 제대로 사용하려면 꽤 성능 좋은 그래픽 카드(GPU)가 필요하다는 점도 개인 사용자에게는 부담이 될 수 있습니다.오픈소스, 뭐가 좋은 거야?
이런 단점에도 불구하고 Dia가 주목받는 이유는 오픈소스이기 때문입니다. 누구나 코드를 보고 수정할 수 있어 특정 분야(의학 용어 등)에 맞게 성능을 개선하거나, 원하는 목소리 톤을 학습시키는 등 자유로운 맞춤 설정이 가능합니다. 전 세계 개발자들이 함께 문제를 해결하고 새로운 기능을 추가하기 때문에 발전 속도도 빠를 수 있습니다. 특정 회사에 종속되지 않고 자유롭게 기술을 활용할 수 있다는 점도 큰 장점입니다. 유튜브 영상 더빙, 개인용 오디오북 제작, 게임 캐릭터 목소리 생성 등 콘텐츠 제작 분야나, 저렴한 비용으로 접근성 기술(화면 읽기 등)을 개발하는 데 활용될 수 있습니다.그래서 결론은?
Dia TTS는 AI 음성 합성 기술을 누구나 쉽게 사용하도록 문턱을 낮추려는 시도입니다. 무료 오픈소스라는 강력한 무기로 기존 유료 서비스 시장에 변화를 가져올 잠재력을 보여줍니다. 하지만 아직 품질이 불안정하고 기능적 한계가 있어 당장 유료 서비스를 대체하기는 어려워 보입니다. 오픈소스 기술은 악용의 위험성도 함께 가지고 있습니다. 누구나 기술에 접근할 수 있는 만큼, 가짜 뉴스 제작이나 보이스 피싱 등 범죄에 사용될 가능성도 배제할 수 없습니다. 기술 발전과 함께 책임감 있는 활용 방안에 대한 고민이 필요한 시점입니다. Dia의 등장은 AI 기술 민주화의 가능성과 함께 풀어야 할 숙제도 던져주고 있습니다.
편집자:
이도윤 기자
제보·문의:
aipick@aipick.kr

부키와 모키의 티격태격
찬/반 투표
총 투표수: 0무료 AI 음성 기술, 상용화 가능할까?
가능하다
0%
0명이 투표했어요
불가능하다
0%
0명이 투표했어요
댓글 0개
관련 기사
최신 기사



