AI都能配音了,配音員怎么辦?
2024-07-30
797
“我的工作會被AI取代嗎?”
很多行業都在擔憂這一問題,配音員也不能幸免。

今年4月,全國首例“AI生成聲音人格權侵權案”一審宣判,聲音被AI化出售的配音師獲賠25萬元。案件的起因讓人“細思恐極”:原告殷某起初只錄制了一段音頻,但AI化之后,他的聲音卻能被“復制”出來,“念出”任何一段文本。
次日,知名滬圈人氣配音演員趙乾景在微博官宣,將把聲音授權給TME出品的AI有聲劇《凡人修仙傳》。他一個人的聲音,被模型訓練成多種音色后,可實現一人配多角。
如今,配音界正或主動或被動地迎接新一輪的變革。一方面,生成式AI產品降低了配音的門檻,部分配音員的工作被取代;另一方面,頭部配音演員主動打破邊界,加劇配音界內卷。

“很誠實地說,不焦慮是不可能的。我會考慮,以后這份職業還需不需要我?上專業課時,老師讓我們思考,在AI發展迅速的今天,我們學這一專業的意義在哪?但其實老師也沒有標準答案。”播音主持專業大四學生景韜坦言。

被擠壓的生存空間
事實上,“所有與聲音有關的領域都有AI的參與,”景韜說。
語音客服、導航播報、網絡小說聽書……這些聲音均由AI合成。短視頻里耳熟能詳的“懶羊羊聲線”“蠟筆小新聲線”“四川方言”等等,也都由AI自動生成。

游戲領域中,網易《時空中的繪旅人》、米哈游《未定事件簿》都曾采用自家AI技術制作角色語音。AI配音的靈活性甚至給游戲業內帶來了新的玩法。游戲音頻設計春春介紹道:“部分廠商采取AI配音的模式,通過人工智能識別,能實現NPC(非玩家角色)像 ChatGPT 一樣跟玩家簡單對話。這樣能提升游戲的趣味性和互動性。”
哪怕是有人臉與口型出現的復雜場合、嚴肅場景,AI也能適配。景韜觀察到,“我的師哥師姐,剛畢業一年加入到某省會城市新聞播報節目,現在在主播臺上的,已經是他們的AI形象了。”

市場占有率越來越高,AI配音技術的發展也越來越快。2021年,剪映軟件推出的還只是各種音色的文本朗讀功能,2024年初已能“克隆音色”。6月18日,谷歌發布了名為V2A(Video-to-Audio)的最新系統,無需人工輸入提示詞,也可以為視頻配音。換句話說,V2A能自己“看懂”畫面,說出該說的話。
新技術的成熟,導致“聲音”的價值被急劇壓縮。在閑魚,幾塊錢就能買到偶像聲線的“生日祝福”。配音演員大碗表示,行業里“一些低端的有聲書、廣告,已經不需要人來錄了”。

配音員小艾偶然注意到,在配音愛好者的交流群里,有人接了50元/小時的有聲書角色音配音工作。“一個小時的角色音,配音肯定不止一小時。”據了解,知名配音演員的有聲書配音價格多在3000元/小時以上。
而聲音被壓價,不只是對中下層配音演員的沖擊,更是對整個行業生態的沖擊。配音演員洪海天認為:“很多新人剛起步時,會錄一些小說或者旁白,這些東西大量被AI替代,肯定擠壓了新人的生存空間。如果大家都沒辦法進入這個行業了,這個行業就會逐漸萎縮。”

與AI賽跑
目前,AI配音的優勢已逐漸凸顯——高效率、低成本、精準。它減少了真人配音的不確定性:不用跟配音演員約檔期、角色不會跟真人綁定而“塌房”……
當然,目前的AI配音,還做不到像真人那么完善。AI配音和真人發聲的邏輯不同,其制作是先采集真人發音的單音節字,再重新排列組合到新的文本中。有些AI配音聽起來像機器人,一個字一個字接連蹦出來,沒有氣息、停頓,也就沒有“人感”。

這在中低端AI配音軟件中非常明顯。例如部分短視頻配音,經常斷句不恰當、情感生澀、吐字不清晰、誤讀多音字。即便是最新發布的谷歌DeepMindV2A,也會出現口型對不齊、生成聲音不符合畫面等問題。
而真人配音不會出現這類情況,豐富的情感表達、真實性和自然感,甚至能為角色、視頻、文本加成。一位好的配音員,可以通過把握、理解角色,隨時調整語氣、語調、語速,為受眾呈現出更好的配音效果。
“同一個人哪怕配同一段臺詞,每次的氣息、節奏等細節都不會完全相同,這也是配音的魅力所在。”配音演員雪女士表示。相較之下,AI無法復刻人類的喜怒哀樂,也做不到像優秀的配音演員那樣,將聲音、技巧和感情融為一體。

當效率與人性化無法完美共存時,真人與AI技術的進步就像在進行一場賽跑。作為配音員,大碗目前還不太焦慮,“因為AI還達不到人的精細程度,但我覺得這只是時間問題。”

無法被取代的“不完美”
“在媒介發展史上,新舊媒介之間通常不是完全取代的關系,而是互相輔助和共同進化的關系……不能因恐懼而限制人工智能影像生產,也不能因貪念而過度依靠人工智能影像生產。”華南理工大學新聞與傳播學院副教授張陸園這樣認為。
因此,與其討論取代還是抵抗,合作或許才是AI配音未來的發展方向——在利用技術高效性和準確性的同時,保留人類藝術創作的深度和情感。
AI的廣泛應用,一方面會倒逼配音演員提高自身技能、學習新技術來增強自身競爭力;另一方面,在剛畢業的電視臺主持人李哲源看來,也是一次從業者返璞歸真、充分發揮個性的機會。

“它讓我們不必再為了某一個播音腔、朗誦腔、配音腔,把自己刻畫成流水線上的模子,而是將精力集中在自己的語音特點上。那些機械的、重復的、枯燥的事情,讓AI去做吧,我們就好好做自己,活出自己的樣子。”
在此基礎上,配音演員雪女士認為:“如何保證技術安全,規范AI配音應用,防止侵權事件發生,可能是行業更需要考慮的問題。”
“AI生成聲音人格權侵權案”一審宣判后,阿杰、夏磊等知名配音演員紛紛發博表態:“聲音作為一種人格權益,任何自然人的聲音均應受到法律的保護,對錄音制品的授權并不意味著對聲音的授權”。
2021年實施的《中華人民共和國民法典》將人格權獨立成編,首次以立法形式將保護“聲音”寫入民法典。其中第1023條規定,對自然人聲音的保護,參照適用肖像權保護的有關規定,明確將聲音權益作為特殊的人格利益予以保護。

但AI聲音是否屬于自然人聲音權益的保護范圍,仍存在模糊之處。金杜律師事務所合伙人宋海燕認為,需要明確聲音可識別性的具體判斷標準、取得授權的主體及授權方式,以及責任主體范圍。
配音演員洪海天、夏磊發博提供了操作思路:“有沒有這樣一種可能性:以后任何公司和個人對于人聲的使用(包括AI采樣)都要能說得清楚聲音數據的來源;每個聲音數據都必須標注勞動者的名字并且獲得勞動者的授權,這樣每個聲音數據都可以被追溯,其背后的勞動者也能被知道、被尊重并獲得相應的報酬。”
“不只是配音行業,各行各業都會朝著更個性化、更精細的方向去發展。”大碗說,提升行業整體水平,保護好從業者的生存環境,尊重他人的合法權益,或許才是應對AI時代的關鍵。