近日據(jù)媒體報(bào)道,站自動(dòng)主英字幕嗶哩嗶哩(B站)正式推出自研的推出“AI原聲翻譯功能”。該功能利用突破性的原聲語音生成與視頻重構(gòu)技術(shù),精準(zhǔn)還原UP主獨(dú)特的翻譯聲線、音色和氣口,生成并實(shí)現(xiàn)翻譯語言與口型的文聲自然同步,為游戲、線及科技、站自動(dòng)主英字幕二次元等核心內(nèi)容的推出跨語言傳播提供了創(chuàng)新解決方案。
區(qū)別于傳統(tǒng)機(jī)器翻譯的原聲生硬感,B站AI原聲翻譯的翻譯核心優(yōu)勢在于“原汁原味”的本地化處理。其核心技術(shù)基于內(nèi)部研發(fā)的生成語音生成模型,通過創(chuàng)新的文聲語音時(shí)長與情感控制方法,精確調(diào)控語音節(jié)奏,線及并分離情感表達(dá)與說話人身份特征。站自動(dòng)主英字幕這確保了翻譯后的語音既保留UP主的個(gè)人風(fēng)格,又自然貼合目標(biāo)語言的韻律習(xí)慣。
在口型同步與字幕處理方面,技術(shù)團(tuán)隊(duì)結(jié)合先進(jìn)的智能視頻處理技術(shù),精準(zhǔn)擦除原字幕區(qū)域并進(jìn)行高還原度重繪,使翻譯后的口型與語音內(nèi)容完美匹配。針對游戲術(shù)語、二次元梗點(diǎn)等翻譯難點(diǎn),功能引入了深度挖掘技術(shù),結(jié)合大語言模型構(gòu)建的翻譯引擎,將專有名詞與文化梗的翻譯準(zhǔn)確率提升至90%,有效解決了跨文化傳播中的“笑點(diǎn)斷層”問題。
目前,該功能已支持中英雙語互譯,全面覆蓋站內(nèi)視頻、直播彈幕及界面按鈕,日均處理數(shù)十萬條非中文內(nèi)容翻譯需求。據(jù)B站技術(shù)團(tuán)隊(duì)透露,后續(xù)計(jì)劃將支持日語、韓語等近10種語言,進(jìn)一步強(qiáng)化對ACG文化圈的覆蓋能力。
B站董事長兼CEO陳睿表示,該功能是平臺“內(nèi)容無國界”戰(zhàn)略的關(guān)鍵落地。此前,B站已完成國內(nèi)版與國際版APP的合并,并積累了豐富的文化元素本地化經(jīng)驗(yàn)。此次AI原聲翻譯功能的推出,標(biāo)志著B站在跨語言技術(shù)布局上已全面成熟。
業(yè)內(nèi)分析指出,B站AI原聲翻譯功能通過多目標(biāo)優(yōu)化與強(qiáng)化學(xué)習(xí)技術(shù),首次實(shí)現(xiàn)了“翻譯準(zhǔn)確性-聲線還原度-口型匹配度”三者的高度協(xié)同,為長視頻平臺樹立了新的技術(shù)標(biāo)桿。
對UP主而言,該功能將顯著降低內(nèi)容出海的語言門檻,特別惠及游戲解說、動(dòng)畫測評等依賴“人設(shè)聲線”的創(chuàng)作者。對于用戶,無論是中文用戶觀看外語內(nèi)容,還是海外用戶體驗(yàn)中文視頻,都能獲得近乎“無字幕隔閡”的沉浸式體驗(yàn)。