부키
2025년 06월 24일
3D
구글
음악
이미지
제미나이
조회수 149
제미나이, 귀여운 나르왈 음성 생성으로 AI 이미지+음성 기술 보여줬네
구글의 AI 모델 제미나이가 사진뿐 아니라 음성까지 결합한 기능을 선보였어. 사실적인 나르왈(바다 코끼리) 이미지를 생성하고 여기에 친근한 목소리까지 입혔다는 거지. 영상에서 나르왈이 실제로 말하는 것처럼 입까지 움직이네?
트윗 작성자는 '10/10 would generate again'이라며 완전 만족한 듯. 이건 구글이 텍스트에서 이미지를 만드는 수준을 넘어 음성과 움직임까지 결합한 멀티모달 AI 기술을 과시하는 거야.
제미나이가 오픈AI의 ChatGPT와 경쟁하면서 이런 차별화된 기능으로 승부수를 던진 것 같은데, 점점 AI들이 단순 텍스트 응답이 아닌 완전한 멀티미디어 경험을 제공하는 방향으로 가고 있어. 미디어 합성 기술이 얼마나 발전했는지 보여주는 좋은 사례인 것 같음 🦉
첨부 미디어
2025년 06월 24일
10/10 would generate again. Sound on 🔊
Prompts in thread 🧵 https://t.co/qXAiZNk0h7
Prompts
NARWHAL: A photo realistic narwhal in the arctic ocean, the narwhal swims up and pokes its head above the water and looks at camera, the narwhal speaks to us with a friendly voice, we see its mouth move as it says: "Someone opened up Gemini today and said I wanna see a
로그인하면 맞춤 뉴스 물어다 줄게🦉
-
관심사 기반 맞춤 뉴스 추천
-
왕초보를 위한 AI 입문 가이드북 제공
-
부키가 물어다 주는 뉴스레터 구독
-
회원 전용 인사이트 칼럼 열람
-
둥지 커뮤니티 게시판 이용
또는 회원가입 하기
지금 핫한 소식🚀
- 1. simile_ai, 행동 예측 분야의 LLM 한계 뛰어넘는다더라 대박인데
- 2. 플럭스, AI로 포메라니안이 스노보드 타는 초현실적 영상 만들었어
- 3. 기업 정보보안, 2026년 2월 기준 생성AI 6대 서비스 비교해봤어
- 4. LOBBI, 로비에서 영감 받은 AI 투자 플랫폼 나왔네? 이거 어떤 코인인지 궁금해지는데
- 5. NebulaAI, 15분 걸리던 데이터 분석을 1분으로 단축시켰네?
- 6. 제미나이, 일본 학교에서 선생님들 업무 혁신 시작한대! 우리나라는 언제?
- 7. 그록, 챗GPT 비교하는 논란에 일침 놓았어! AI 진영 간 경쟁 그만하자는 목소리 나와
- 8. 구글, 제미나이 3 딥 씽크로 코딩 대회 세계 8위 기록 달성했네
- 9. Stack Overflow, 개발자 평가에 코드만으론 부족하다고 경고하네
- 10. 일레븐랩스, 'ALS' 환자 목소리 되찾아 줬네... 천 명 앞 감동 무대까지 펼쳐
부키가 물어다 주는 뉴스레터🦉
미리보기구독하면 이메일로 AI 소식과 팁들을 보내줄게!
아직 댓글이 없어. 1번째로 댓글 작성해 볼래?