ko
ko
가우딘리소스전체보기

AI Text Sync 개발의 어려움, 이렇게 격!파! 했어요 👊🏼

AI Text Sync 개발의 어려움, 이렇게 격!파! 했어요 👊🏼

(2021-10-25)

진화하는 ‘실시간 가사보기’

사람이 일일이 수기로 음악과 가사의 싱크(Sync)를 맞추던 ‘실시간 가사보기’는 이제 가우디오랩 GTS(Gaudio Text Sync)의 등장으로 과거의 일이 되어가고 있습니다. AI기술이 음성과 텍스트를 자동으로 동기화(Speech-Text Synchronization)하고 있으니까요! 😎 (무려 5초에 1곡씩 싱크를 맞춰버리는 스피드!)

GTS에 대한 소개는 지난 번 Ben과의 인터뷰(“가사나 자막 입력도 이제 AI가 해준다고요?”)를 통해 전해드리기도 했었어요 ☺️

사실 텍스트 싱크에 대한 수요는 영화, 드라마, 예능 등 수출/수입용 콘텐츠의 자막 뿐만아니라, 뮤직 스트리밍 서비스의 실시간 가사(동기 가사), UCC(or UGC)의 자막, 어학 교육 자료 제작 등 주류 미디어에서부터 1인 미디어 콘텐츠까지 다양한 곳에서 콸콸콸 쏟아져 나오고 있습니다. 특히나 스트리밍이 중심이 되는 현 미디어 생태계에서는 GTS가 가진 AI Text Sync 기술의 수요가 더욱 뜨겁게 증가할 수 밖에 없죠. 🔥

gaudio ai text sync

범람하는 콘텐츠 시장, 이제 텍스트 Sync는 GTS에 맡겨두세요!

 

AI Text Sync 개발의 어려움을 격파한 이야기

이렇게 핫한 기술이지만, 사실 해당 AI 모델을 설계하고 학습하는데 마주하는 실질적인 어려움도 적지 않았다고 합니다. GTS는 그 모든 어려움을 뚫어낸 소중한 노력의 산물인데요, 그 결과로 가우디오랩 AI그룹은 음원 분리, 음성 인식 등을 응용한 모델 설계와 다양한 알고리즘 신호처리 기술의 조합으로 AI Speech-Text Synchronization 기술을 개발, 상용화까지 성공해 시장에서 인정받고 있답니다!

가우디오랩의 CSO인 Ben과 GTS를 소중히 키워 세상에 내놓은 Manuel이 실제 Text Sync 모델을 개발하고 이를 상용화하는 과정에서 얻은 현장감 가득한 인사이트를 지난 9월 말 AI DATA INSIGHT를 통해 나눴다는 사실! AI 음성-동기화(AI Speech-Text Synchronization) 기술 개발 전반에 대한 특별 기고를 지금 바로 [AI DATA Insight]에서 확인하세요! ☺️

가우디오랩의 AI Scientist / Audio Scientist 되기

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 항목은 *(으)로 표시합니다

Privacy Settings
We use cookies to enhance your experience while using our website. If you are using our Services via a browser you can restrict, block or remove cookies through your web browser settings. We also use content and scripts from third parties that may use tracking technologies. You can selectively provide your consent below to allow such third party embeds. For complete information about the cookies we use, data we collect and how we process them, please check our Privacy Policy
Youtube
Consent to display content from Youtube
Vimeo
Consent to display content from Vimeo
Google Maps
Consent to display content from Google
Spotify
Consent to display content from Spotify
Sound Cloud
Consent to display content from Sound