本篇文章以最近爆火的“霉霉說普通話”視頻入手,介紹了當(dāng)下的語音克隆、AI換臉、數(shù)字人軟件,及其優(yōu)勢和可能面對的問題。推薦給對AI數(shù)字人技術(shù)感興趣的童鞋閱讀。
最近一條“沒有譯制片腔調(diào)的翻譯”視頻火遍全網(wǎng)。視頻里,霉霉(美國歌星:泰勒·斯威夫特)用一口流利的普通話和主持人侃侃而談,不僅聲線毫無違和感,就連口型也全都對上了。不禁讓人感嘆,翻譯都卷到這個地步了。
視頻原作者“johnhuu教英語”翻譯常有,而AI換嘴和模擬聲線的翻譯不常有。這不,不少評論區(qū)網(wǎng)友表示“我就說霉霉什么時候普通話這么標(biāo)準(zhǔn)了”。不僅如此,馬斯克、艾瑪沃特森等人都在借助AI翻譯走上了“本土化”道路。
其實,這視頻乍一看挺神奇,但也不是什么新鮮事了,拆解起來就三個方面:翻譯+語音克隆+換嘴。翻譯方面,市面上大多數(shù)翻譯軟件都可以做到準(zhǔn)確,但論及優(yōu)美程度還是需要人工加工。語音克隆和AI換嘴的工具也相當(dāng)之多,例如目前主流的語音克隆軟件有Audio Clone、Voice Cloaker、Voice Changer,換臉App有Faceapp、Openfaceswap、換臉大師等等。
視頻火后,有網(wǎng)友扒出博主很有可能用的是HeyGen,該軟件可以直接將翻譯、語音克隆和換嘴三合一。
不扒不知道HeyGen崛起速度快的令人咂舌,據(jù)推特分析師Will統(tǒng)計,該網(wǎng)站從八月到九月訪問量直線上升92%,現(xiàn)位居各大獨立AI網(wǎng)站第一。而這個風(fēng)靡外網(wǎng)的軟件背后的開發(fā)者是實打?qū)嵉闹袊鴪F(tuán)隊——詩云科技,“詩云”取自劉慈欣的小說,其內(nèi)核“技術(shù)無法取代藝術(shù)”與創(chuàng)始人徐卓(Joshua Xu)的理念不謀而合。
2020年12月,詩云科技在深圳成立,僅僅三個月就獲得了紅杉中國和臻基金200萬至300萬美元的種子基金。對于這個年齡只有三個月大的公司來說,此時他們真正要做的是找到產(chǎn)品市場匹配。
其實早在徐卓就職于Snapchat時,就有一些跨境電商找上門來,咨詢“AI換臉”方面的技術(shù),特別是那些服裝品牌,服裝品牌SKU很大,每個季度上新產(chǎn)品又很多,尋找不同膚色的模特拍攝大量新品是一件時間成本和經(jīng)濟(jì)成本都很高的事,據(jù)了解歐美模特的成本是亞洲模特的2-3倍。而使用了AI換臉技術(shù)后,商家只需要聘請國內(nèi)模特再進(jìn)行替換,就能獲得不同人種的模特展示圖,大大降低了成本提高了效率,有效解決了服裝品牌國際化的痛點。
想來這也是為什么目前HeyGen主要面向B端的原因——點開HeyGen頁面,標(biāo)語寫著“為新一代從初創(chuàng)企業(yè)到成熟企業(yè)的全球最優(yōu)秀團(tuán)隊提供助力”。相較于傳統(tǒng)視頻制作,HeyGen無需設(shè)備,無需演員,無需三方團(tuán)隊,只要短短幾分鐘就可以生成攝制組要花許多天制作的視頻,確實能在很大程度上減少大量有視頻需求的企業(yè)的成本。
除此之外,我們還能看到其創(chuàng)始人Joshua Xu(徐卓)在線打廣“What you see here is my video 100% generated by AI.(你所看到的我的視頻100%由AI生成)”其神態(tài)、語句、畫面都十分自然,甚至能看到窗外吹動的樹葉。
一些體驗過的網(wǎng)友表示HeyGen是視頻生成效果最好的工具,只需要上傳一段十幾秒的視頻,就可以獲得本人音色、口型一致的說外語視頻,此外還可以從300多種語音包中選擇與人物形象相匹配的音色,涵蓋40多種語言。目前月付最基礎(chǔ)的套餐是15點數(shù)(1分鐘消耗1個點數(shù)),價格29美金(約200人民幣),每個月花200人民幣可生成15分鐘的視頻,每個視頻最長不超過5分鐘。這對于有外語口播需求的中小企業(yè)來說非常省時省力。
憑借這個需求,詩云科技撬開了跨境電商的市場,當(dāng)然這可能只是AIGC在營銷行業(yè)中應(yīng)用的一個縮影,或者說AIGC本質(zhì)上正在進(jìn)一步成為營銷行業(yè)的新范式。
所以說“霉霉說普通話”的本質(zhì)不過是最新的換臉技術(shù)再加一點小創(chuàng)意,而真正應(yīng)用到商業(yè)營銷中去的是更成熟的體系,比如復(fù)刻或者創(chuàng)造出一個數(shù)字人。國內(nèi)也已經(jīng)有很多明星將數(shù)字分身運用在直播、視頻領(lǐng)域。從IP型到功能型,數(shù)字人正在走向更廣闊的市場。
在這方面樂華娛樂當(dāng)屬水花最大,5月22日穿著經(jīng)典粉色皮膚的“杜華”出現(xiàn)在直播間,一開口粉絲懵了,這普通話怎么這么好了,不一會兒一個長相一模一樣的杜華也出現(xiàn)在屏幕上,用塑普介紹她旁邊的AI分身“華華子”,粉絲表示這才對味,僅用十分鐘的時間,直播間的觀眾就突破了32萬。于是,樂華順勢推出了旗下藝人陳昕葳的AI分身和數(shù)字人“樂樂”在直播間講解推銷杜華女士的護(hù)膚品牌Dr.JE。
去年,劉潤也自爆自己口播內(nèi)容的短視頻已是數(shù)字分身,只需要讓AI學(xué)習(xí)一下以前的視頻,就能生成一個“自己”,之后用音頻就可以驅(qū)動這個數(shù)字人產(chǎn)出視頻,體感非常高效。面對大量重復(fù)性較強但需要“本人”出鏡的工作,他們不約而同選擇復(fù)刻一個“硅基勞動力”。
朱梓驍、馬可等人更是直接用自己的數(shù)字人分身在直播間帶貨,辰亦儒的AI形象連續(xù)吃播長達(dá)15個小時,雖然質(zhì)疑聲也甚囂塵上,觀眾表示并不買單,但這一波確實吸引來了不少流量。
正如我們所說,營銷本質(zhì)就是內(nèi)容創(chuàng)作,當(dāng)AIGC出現(xiàn)的時候,營銷行業(yè)的變革自然隨之而來。目前已經(jīng)有千千萬萬的“基本款”數(shù)字人主播活躍在直播間,雖然遠(yuǎn)不如“明星版”吸引流量,但對于商家來說仍然是一個不虧的買賣。
艾媒咨詢數(shù)據(jù)顯示,預(yù)計到2025年,中國直播電商行業(yè)規(guī)模將達(dá)到21373億元,品牌自播成交額預(yù)計在今年會達(dá)至整體直播電商成交占比中的50.0%。
如何在品牌自播里找增量,不再依賴頭部主播帶貨,箭矢瞄準(zhǔn)了數(shù)字人。今年618,京東平臺的虛擬主播——言犀亮相多個品牌直播間,開播商家較去年雙十一增長了近5倍,現(xiàn)實成交額環(huán)比提高了246%。
相較于真人主播虛擬主播們呈現(xiàn)出以下幾個優(yōu)勢:
AIGC絕不是以數(shù)字人主播為噱頭那么簡單,而是滲透在直播交互的全過程——觸達(dá)、吸引、認(rèn)知、導(dǎo)購。在整個營銷過程中,數(shù)字人不僅可以為用戶提供產(chǎn)品信息,還可以作為品牌IP進(jìn)行形象展示,從而吸引一部分用戶,這也是當(dāng)數(shù)字人主播廣泛普及后,商家要著重發(fā)力的方向。
如今,全力下注AI營銷已成為行業(yè)共識,具備生成式AI入口屬性的數(shù)字人也成為了兵家必爭之地。但危險與機會并存,處在成長期的行業(yè)免不了存在問題。就目前來看,數(shù)字人顯然還是有四個關(guān)鍵性的問題亟待解決:
目前廣告主、服務(wù)商都在試水?dāng)?shù)字人,AIGC賽道正處在圈地跑馬階段,市場指向已經(jīng)逐步明朗,但高舉高打后是否能形成健康的發(fā)展模式,還要看玩家們的心智和規(guī)范意識。
請到「后臺-用戶-個人資料」中填寫個人說明。
聲明:本網(wǎng)站尊重并保護(hù)知識產(chǎn)權(quán),根據(jù)《信息網(wǎng)絡(luò)傳播權(quán)保護(hù)條例》,如果我們轉(zhuǎn)載的作品侵犯了您的權(quán)利,請在一個月內(nèi)通知我們,我們會及時刪除。
Copyright ? 2016 學(xué)習(xí)鳥. 頁面生成時間:0.549秒