깨끗한 음성을 향한 가우디오랩의 끊임없는 도전 - Just Voice Lite 출시
너의 목소리를 더 잘 듣고 싶어
Bam! Bang! Tat tat tat tat I’m out, I need another ??? ??? anybody ??? ???
안녕하세요, Just Voice Lite의 제품 책임자 하워드입니다.
전쟁 영화 속 한 장면에서 폭탄이 터지는 소리로 가득 찬 상황을 상상해 보세요.
화면 속 주인공들이 대화를 나누지만, 폭탄과 총성, 그리고 너무 큰 배경음악으로 인해 거의 들리지 않기도 합니다. 이런 상황에서 우리는 배우들의 목소리를 더욱 잘 듣고 싶어 합니다. 현장감을 높이기 위해 음향 감독이 추가한 효과음과 배경음악이 정작 중요한 배우들의 목소리를 덮어버려, 이야기의 중요한 부분을 놓치곤 하죠.
이때 대사를 더 잘 듣기 위해 오디오 볼륨을 키운다면 어떤 일이 발생할까요?
전체적인 음량이 더욱 커져서 당신의 고막(eardrum)이 찢어질 듯 고통받을 수 있습니다. 특히 당신이 이어폰이나 헤드폰을 착용 중인 상황이라면요. 이미 볼륨이 너무 커서 대사를 위해 소리를 더 키우지도 못하고, 그렇다고 소리를 줄이자니 대사가 거의 들리지 않게 되기 대문에 아이러니한 상황에 놓이게 됩니다. 결국 한국어 영화도 자막에 의존하여 시청하는 경우가 생기게 되죠.
내가 원한 건 이런 게 아닌데…
이와 같은 상황에서 배우의 목소리만 콕 집어내어 더욱 명료하게 들을 수 있는 아름다운 기술이 있다면 얼마나 좋을까요?
아니, 애초에 콘텐츠가 대사 명료도의 관점에서 더욱 잘 제작되었다면 이러한 고민도 할 필요가 없었을 텐데 말이죠. 콘텐츠의 본질을 담아내고자 하는 예술가와 대사를 잘 듣고 싶어 하는 현실 관객의 입장은 언제나 다르기 마련입니다.
비단 영화뿐일까요?
우리는 종종 좋지 않은 환경에서 녹음된 콘서트 실황이나 시끄러운 환경에서 녹화된 여행 유튜버 영상, 자전거/자동차 동호회 주행 영상 등을 볼 때에 화자의 목소리를 더 잘 듣기 위해 모든 신경을 곤두세우곤 합니다. 파도가 밀려오는 경치 좋은 바닷가나 야외 커피숍에서 여자/남자 친구에게 화상통화로 기타를 치며 노래를 부르는 상황이라면 어떨까요?
소음이나 잡음 때문에 우리가 좋아하는 사람의 목소리를 듣기가 어려울 때,
그 공간에 있는 상대의 목소리를 조금 더 잘 듣고 싶을 때,
우리는 더 나은 청취 경험을 위한 해결책을 찾게 됩니다.
이런 갈증을 해소하기 위해 등장한 것이 바로 목소리 강화 어플리케이션 Just Voice 입니다. 🤓
On-device AI를 활용한 실시간 처리
아주 조금만 기술적인 이야기를 해볼게요.
그렇다면 도대체 이 문제를 어떻게 해결할 수 있을까요?
혹자는 말하겠죠. 리모컨에 볼륨업 버튼을 추가해서 목소리만 키워주면 되지 않을까요? 웃기고 있으시네!
그게 어디 말처럼 쉬운 가요? 기술적으로 본다면 이러한 동작은 수 밀리 초(millisecond, 1000분의 1초) 안에 처리되어야 합니다. 내가 보는 영상에서 실시간으로 처리해야 하기 때문이죠. 즉, 소리가 나오는 족족 목소리만 분리해서 잘 들리게 처리한 후 다시 여러분에게 내보냈을 때, 영상과 소리의 싱크가 그대로 정확히 맞아야한다는 의미입니다.
하지만 가우디오랩 연구진이 출동한다면 어떨까요?
약 2년 동안의 길고 긴 연구 끝에 이 어려운 기술을 가우디오랩에서 완성했어요!
세계최고 수준의 음성 분리 기술 GSEP(Gaudio Source Separation) 기술과 On-device AI 기술을 활용하여 실시간으로 음성 명료도를 향상하는 엔진, Low Delay GSEP을 탄생시킨 것이죠.(보다 정확히 말하자면 30ms 이내로 처리합니다.) 이 기술은 주변 소음을 제거하고, 원하는 목소리를 강조하여 목소리만 듣기 쉽게 만들어 줍니다. 아 물론, 실시간으로 처리하기 위해서 비실시간 음성 분리 기술인 GSEP 대비 약간의, 아주 약간의 성능저하를 감수하긴 하였습니다.
이 기술을 활용하면, 당신이 소비하는 모든 동영상 콘텐츠 내에 있는 환경음이나 배경음악에 방해받지 않고 목소리를 더욱 또렷하게 들을 수 있습니다. 그리고 저희는 이것이 콘텐츠를 내가 원하는대로 즐기고자 하는 모든 이들에게 보다 나은 청취 경험을 제공할 것으로 믿습니다.
macOS용 Just Voice Lite를 경험해보세요
Just Voice Lite를 사용해 보세요!
Low Delay GSEP을 활용한 Just Voice 앱 시리즈 중 첫 번째, 실시간 목소리 강화 앱 Just Voice Lite를 출시했습니다.
macOS 이용자라면 Just Voice Lite 앱을 통해 화상 회의, 영화 시청, 음악 감상 등 소리가 나는 모든 환경에서 목소리의 명료도를 향상할 수 있습니다. 또한, 콘텐츠의 주변 음은 그대로 둔 채로 목소리만 더욱 크게 들을 수 있도록 설계되었기 때문에, 제작자가 의도한 음향 효과를 포기하지 않고 콘텐츠를 온전히 즐길 수 있습니다.
얼마냐고요?
Just Voice Lite는 무료로 이용가능한 앱입니다.
냉정하게 말하자면 Just Voice Lite란 콘텐츠에서 목소리만 분리해서 음량을 조금 더 키워준 것에 불과하죠. 하지만 이 기술은 무한한 잠재력을 가지고 있습니다.
분리한 목소리를 실시간으로 변조한다면 어떨까요? 울리는 공간에서 녹음한 콘텐츠를 실시간으로 목소리의 피치 조절(Pitch Shift)이나 잔향 제거(De-reverberation) 처리를 할 수도 있고요. 아니면 목소리를 분리하고 난 환경 음들에 가우디오랩이 자랑하는 공간음향기술(GSA, Gaudio Spatial Audio)을 실시간으로 적용해본다면 어떨까요? 내가 원하는 모습으로 오디오 공간감이 확 살아나지 않을까요?
예술가가 찍어낸 콘텐츠를 일방적으로 소비하고 끝내는 게 아닌, 실시간으로 콘텐츠의 요소를 조절하며 들을 수 있는 관객의 자유. 그런 자유에 가치를 매긴다고 한다면 당신은 앞으로 얼마까지 지불할 생각인가요? 관객의 자유로운 콘텐츠 소비를 서포트하기 위한 끊임없는 도전이 메타버스 오디오를 향하고 있는 가우디오랩의 지향점입니다.
"우리도 On-device로 처리하고 싶어요"
Just Voice SDK가 필요하다고요?
당신이 개발자라면 희소식이 있어요. On-device에서 음성 명료도를 향상 해주는 엔진인 Just Voice SDK도 준비해 두었습니다. 보청기용 소프트웨어, 화상회의용 시스템, AICC(AI Contact Center), 언어 학습 등에서 음성 명료도 향상을 위한 오디오 엔진이 필요하다면, 어려워하지 마시고 연락 주세요.
아! 물론 Just Voice Lite 앱은 음성을 더욱 크게 듣는 용도로 개발되었지만, Just Voice SDK는 주변 노이즈를 완전히 없애버리는 노이즈 저감(De-noise)도 가능해요. 어떻게 활용 할지에 대한 선택은 오직 사용자 당신에게 있습니다.
아니 그건 그렇고 Just Voice Lite를 아직도 사용해 본 적 없다고요?
macOS를 사용하는 당신이라면 언제든 시도해 보세요.
당신이 듣고 싶은 목소리를 더욱 선명하게 만들어줄 오디오의 미래, 지금 경험해 보세요!