가사나 자막 입력도 이제 AI가 해준다고요?
가사나 자막 입력도 이제 AI가 해준다고요?
(2021-04-26)
그러다 종종… 실시간 가사가 지원되지 않거나, 아예 잘못된 가사가 입력된 경우를 발견하곤 합니다. 그럴 때마다 제 음악 청취 경험은 다소 실망스러워지죠. 특히 애정하는 아티스트가 외국 가수이거나 국내에서 대중적이지 않은 편이라면, 가사 자체가 없을 확률은 더욱 높아집니다.
노래를 들으며 가사를 동시에 음미하는 경험, 왜 그렇게 어려운 일일까요?
다수의 음원 스트리밍 플랫폼에서는 실시간 가사 보기 서비스를 제공하기 위해 직간접적으로 ‘타임 코더‘라는 인력을 고용하고 있습니다. 사람이 직접 노래를 귀로 들으며 가사와 멜로디를 일일이 싱크(Sync) 하는 작업을 하는 것이죠. 하루에 새롭게 발매되는 음원 트랙이 수십만 곡에 이르기에, 모든 곡의 싱크 가사를 수작업으로 생성하는 것은 사실상 불가능합니다. 이런 이유로 종종 제 ‘최애곡‘에 실시간 가사가 지원되지 않는 슬픈 경우나 ‘휴먼 에러’로 이상하게 입력된 가사를 만나게 되는 것은… 어쩌면 어쩔 수 없는 필연이었던 것 같습니다.

벅스를 통해 첫 상용화를 시작한 가우디오랩 GTS의 모습. 이제 실시간 가사보기도 AI로 가능 !
이제 어려운 일이 전혀 아닙니다.
모든 곡에서 ‘실시간 가사 보기’가 가능한 시대가 왔거든요.
가우디오랩에서 벅스(Bugs)를 통해 상용화를 시작한 ‘인공지능 기반 가사 동기화 솔루션’인 GTS(Gaudio Text Sync)는 바로 이런 불편함을 풀어냈습니다. GTS는 Audio-AI 기술을 활용해 가사와 음원을 자동으로 동기화해서 효율적으로 실시간 가사 보기 기능을 제공할 수 있도록 돕는 솔루션입니다. 5초당 1곡의 빠른 속도와 정확성을 자랑합니다. 국내는 물론, 전 세계적으로도 인공지능을 활용해 가사 싱크를 맞추는 솔루션을 찾아보기 어려울 정도로 획기적인 가우디오랩만의 독자 기술이라고 하는데요. GTS에 대한 생생한 스토리, 안 들어볼 수 없겠죠?
가우디오랩의 CSO(Chief Sool Science Officer) 이자, AI 팀의 수장인 Ben과 GTS에 대해 몇 가지 질문을 나눠보았습니다.

국내외 유일 인공지능 기반 텍스트 싱크 솔루션, GTS
Ben 과의 인터뷰를 통해 가우디오랩 AI 팀과 GTS에 대해서 더 선명히 알 수 있는 시간이었습니다. 음악과 가사, 영상과 자막의 싱크를 정확하고 빠르게 맞추는 GTS가 매일같이 새로운 콘텐츠가 넘쳐나는 스트리밍 서비스 시장에서 차지할 중요한 역할에 대해서는 물론이고요.
‘위드 코로나’ 시대에 접어든 요즘, 전 세계 OTT들은 수천억 원, 조 단위의 투자를 하겠다는 발표를 너나없이 쏟아내며 세상을 놀라게 할 콘텐츠를 만들기 위해 경쟁하고 있습니다. 콘텐츠 생산량이 늘어나는 만큼 국내 이용자들도 다수의 미디어 플랫폼을 구독하며 이 흐름을 즐기고 있는데요. 국적과 관계없이 쏟아지는 콘텐츠를 빠르고 정확하게 소비자들에게 전달하는 것이, 스트리밍 서비스의 핵심 역량 중 하나로 부각되는 이유입니다.
음악, 영상 등 각종 스트리밍 플랫폼이 더 빠르고 정확하게 이용자 경험을 상승시킬 수 있는 방법 중 하나, 바로 독보적인 처리 속도와 정확도까지 갖춘 국내외 유일 상용 솔루션, GTS가 될 수 있겠네요! 🙌🏼
가우디오랩은…
다양한 디바이스와 플랫폼에 적용 가능한 오디오 기술을 만나 보세요
