영상 / 음성 / DID 관련 + a

1. 영상 생성 ai

어떤 변화가 있었나?
Video preview
 
2023년 AI로 만든 버거킹 광고를 보면 알다시피 매우 어색하죠. 하지만 불과 몇달후 OpenAI가 sora를 발표합니다.
Video preview
 
OpenAI의 sora
최근 OpenAI가 Sora라는 AI 영상 모델을 공개하면서 사람들의 관심이 쏠리고 있습니다.
아직 출시는 안했지만 이제 할리우드도 끝장났다는 이야기도 나오고 있습니다.
아쉽게도 저희는 아직 Sora를 사용해볼 수는 없습니다. 대신 Sora가 아닌 다른 서비스를 함께 사용해봅시다.
 
Wonder Dynamics
wonder dynamics는 영상을 제작할 때 필요한 VFX(Visual Effects)를 AI를 이용해 대체하겠다는 비전을 가지고 움직이고 있습니다.
영상을 보면 알겠지만 인물 주변에 조금의 왜곡이 생기긴 하지만 상당히 자연스럽다는 것을 알 수 있죠.
 
Video preview
 
Video preview
Video preview
Runway ML
Video preview
 
Runway ML 이라는 서비스 역시 video를 생성하는데에 있어 꽤나 많은 관심을 받아왔습니다. 이미지, 텍스트에서 영상을 만들어낼 수 있죠.
그리고 매월 무료 크레딧도 준답니다.
 
 
PIKA
Video preview
Video preview
 
notion image
Pika가 처음 나왔을 때엔 엄청나게 많은 관심을 만들어냈어요. 얼마나 대단한 서비스인지 직접 한번 사용해봅시다.
 
 

2. 오디오 생성 ai

오디오 생성 시장
오디오 생성은 없던 음성을 만들어내거나(Diff-SVC) 기존 음성 데이터를 변조(RVC)하는 방식으로 나뉘어진다고 보면 됩니다.
 
그리고 우리는 음성 AI를 흔히 접하고 있어요. 유투브에 ‘AI 커버’만 검색해도 많은 결과가 나오죠.
 
‘딥보이스’라고 검색하면 정말 실제같은 음성을 들어볼 수도 있고요.
OpenAI의 whisper
OpenAI는 whisper라는 오디오 AI를 만들었어요. ChatGPT에서 한번 사용해볼까요?
notion image
 
ChatGPT 앱에서도 사용할 수 있어요.
notion image
 
노래: Laive
Laive는 음악을 생성하고 거기에 AI 가수가 노래까지 부를 수 있도록 도와주는 AI 서비스에요.
한글 노래도 만들어볼 수 있답니다. 근데 한글 노래에서는 키워드가 잘 반영되는 것 같지는 않아요.
노래: musicfy
musicfy에서는 이미 있는 노래나 음성을 변조할 수 있답니다. 물론 노래도 생성할 수 있고요.
노래: suno ai
여기서도 입력한 키워드에 맞는 음악을 생성해볼 수 있어요.
그 키워드에 맞는 가사도 써주는데 엄청 괜찮네요!
노래: Splash
splash에서는 원하는 음악을 생성하고 거기에 원하는 가사를 입힐 수도 있어요
노래: Aiva
음성: elevenlabs
여기에서는 음성을 생성할 수 있어요. 내 목소리를 학습시키면 그에 맞는 음성을 뽑아낼 수도 있죠.
음성: clova
네이버 클로바에서 만든 AI Voice도 꽤나 훌륭해요.
 
 
 

3. Digital Twin (DID)

Digital Twin이란?
한때 메타버스라는 키워드가 떠오르며 Digital Twin 이라는 단어가 떠올랐어요.
디지털 트윈은 실제 대상(제품, 시스템, 프로세스, 건물, 도시 등)을 가상 세계에 복제하여 동일하게 재현하는 기술인데요. 쉽게 말하면 복제 대상과 완전히 똑같은 가상의 쌍둥이를 만드는 것이라고 생각하면 됩니다.
이게 가능하기 위해서는 음성, 영상, 이미지 모든 AI 기술이 동원되어야겠죠?
heygen
우리는 ‘Photo Avatar’를 이용해 우리의 digital twin을 만들어봅시다.
studio did
 
 

4. 이런 것들도 있어요!