부키
2025년 06월 24일
3D
구글
음악
이미지
제미나이
조회수 112
제미나이, 귀여운 나르왈 음성 생성으로 AI 이미지+음성 기술 보여줬네
구글의 AI 모델 제미나이가 사진뿐 아니라 음성까지 결합한 기능을 선보였어. 사실적인 나르왈(바다 코끼리) 이미지를 생성하고 여기에 친근한 목소리까지 입혔다는 거지. 영상에서 나르왈이 실제로 말하는 것처럼 입까지 움직이네?
트윗 작성자는 '10/10 would generate again'이라며 완전 만족한 듯. 이건 구글이 텍스트에서 이미지를 만드는 수준을 넘어 음성과 움직임까지 결합한 멀티모달 AI 기술을 과시하는 거야.
제미나이가 오픈AI의 ChatGPT와 경쟁하면서 이런 차별화된 기능으로 승부수를 던진 것 같은데, 점점 AI들이 단순 텍스트 응답이 아닌 완전한 멀티미디어 경험을 제공하는 방향으로 가고 있어. 미디어 합성 기술이 얼마나 발전했는지 보여주는 좋은 사례인 것 같음 🦉
첨부 미디어
2025년 06월 24일
10/10 would generate again. Sound on 🔊
Prompts in thread 🧵 https://t.co/qXAiZNk0h7
Prompts
NARWHAL: A photo realistic narwhal in the arctic ocean, the narwhal swims up and pokes its head above the water and looks at camera, the narwhal speaks to us with a friendly voice, we see its mouth move as it says: "Someone opened up Gemini today and said I wanna see a
로그인하면 맞춤 뉴스 물어다 줄게🦉
-
관심사 기반 맞춤 뉴스 추천
-
왕초보를 위한 AI 입문 가이드북 제공
-
부키가 물어다 주는 뉴스레터 구독
-
회원 전용 인사이트 칼럼 열람
-
둥지 커뮤니티 게시판 이용
또는 회원가입 하기
지금 핫한 소식🚀
- 1. 제미나이, 무료 크레딧으로 썸네일 제작 도구 개조해 사용하는 방법 있네
- 2. 제미나이, 153개 데이터 검증했더니 정확도 의심스럽다네 ;;
- 3. 제미나이, 서툰 그림도 3D로 변환? 진짜 놀라운 수준이네
- 4. 바이브 코딩, 개발을 AI에게 완전히 맡기는 최신 트렌드 등장했네
- 5. Neo4j, 챗GPT보다 더 논리적으로 답 찾아내는 '에이전틱 GraphRAG' 기술 공개했어
- 6. ElevenLabs, 산타와 실시간 대화하고 AI 크리스마스 노래 들어보고 나만의 영상 인사도 만들 수 있대 ㅋㅋㅋ
- 7. 헤이젠, 2026년 콘텐츠 제작자를 '비즈니스 리더'로 바꾸는 방법 알려준대!
- 8. ChatGPT와 제미나이, 싸울 필요 없네? 둘 다 장단점 확실한 신AI
- 9. 제미나이, 무료로 써도 30일 마니악하게 써보니 개꿀팁 30가지 나왔네
- 10. 챗GPT, 내가 다용도로 쓰면서 월 20만원 버는 비결 알려줄게ㅎㅎ
부키가 물어다 주는 뉴스레터🦉
미리보기구독하면 이메일로 AI 소식과 팁들을 보내줄게!
아직 댓글이 없어. 1번째로 댓글 작성해 볼래?