伴隨著略顯詭異的配樂,鏡頭掃向一個(gè)房間:幾排桌子整齊地?cái)[放著數(shù)十臺(tái)電腦,屏幕上是各種主播正在賣貨。此時(shí),幾行大字啪啪啪打出:“太嚇人了,200平方米直播基地空無一人,全是AI數(shù)字人直播……”可仔細(xì)一看,這些主播的長(zhǎng)相又似乎跟真人無異。
最近,你在微博、小紅書,以及各大短視頻平臺(tái)上,是否刷到過類似視頻?有人真誠(chéng)發(fā)問:真人主播要失業(yè)了?也有人感慨,這是人類運(yùn)用技術(shù)打造“入侵真實(shí)的仿象”又一案例。
這種現(xiàn)在頻頻現(xiàn)身直播間的AI主播,名叫“2D超寫實(shí)數(shù)字人”。用最直白的語(yǔ)言來介紹,就是真人主播的“嘴替”。隨著人工智能概念近期的火爆,它們也被營(yíng)銷公司包裝成能替代真人主播的帶貨小能手。
(資料圖片僅供參考)
問題是,如果真人主播都搞不定,數(shù)字人能帶來成功嗎?
數(shù)字人涌進(jìn)直播間
數(shù)字人并不新鮮,洛天依、柳夜熙等都紅極一時(shí);帶貨也非初次試水,各種虛擬偶像此前早就參與過。而眼下這波正在風(fēng)頭上的數(shù)字人,有點(diǎn)不一樣。
虛擬偶像洛天依、柳夜熙
他們的形象更接近于普通人,如果不仔細(xì)看畫面,會(huì)誤以為就是真人。目前,這些AI主播主要出現(xiàn)在本地生活團(tuán)購(gòu)的直播間,引導(dǎo)用戶購(gòu)買各種團(tuán)購(gòu)券,也有少數(shù)會(huì)售賣零食、快消品等標(biāo)品,以單純的講解為主。
直播間里的2D超寫實(shí)數(shù)字人主播
“歡迎新進(jìn)直播間的寶寶們,5號(hào)鏈接大家都去拍”“團(tuán)購(gòu)呢是到店消費(fèi),人均不到50米(元)就能吃到烤肉”“招牌的牛鞭牛尾燉鮑魚套餐直播間只要68米,還在等什么”……當(dāng)有用戶進(jìn)入直播間,他們可能會(huì)念出網(wǎng)名并表示歡迎;除了介紹商品,還可以簡(jiǎn)單回答彈幕區(qū)的問題進(jìn)行“互動(dòng)”。
按照提供此類技術(shù)服務(wù)的公司的說法,這些2D超寫實(shí)數(shù)字人主播,“以真人為基礎(chǔ)1:1數(shù)字復(fù)刻而成的模型,和真人的形象、表情、聲音幾乎一模一樣”。
“我們熟悉的虛擬偶像,主要靠穿戴動(dòng)作捕捉設(shè)備的‘中之人’(操縱數(shù)字人進(jìn)行直播的人),而2D超寫實(shí)數(shù)字人走的是另一種技術(shù)路徑。”在杭州從事數(shù)字人行業(yè)四五年的阿文解釋,“整個(gè)過程簡(jiǎn)單點(diǎn)講,就是你事先拍一段三五分鐘的視頻,一般在綠幕前,可以加上一些常用手勢(shì);通過技術(shù)訓(xùn)練,根據(jù)你的視頻生成數(shù)字人;后續(xù)每次有需要時(shí),只要給一段文案或者音頻,它就會(huì)基于之前的視頻,替換嘴型部分,而表情、手勢(shì)等,依然是你的原視頻,所以看起來一模一樣?!?/p>
就現(xiàn)階段來說,這些數(shù)字人主播普遍還沒到爐火純青的地步。看得久了,就會(huì)發(fā)現(xiàn)他們的動(dòng)作是重復(fù)的,車轱轆話也是說了一圈又一圈;有些摳圖痕跡明顯,偶爾還會(huì)出現(xiàn)音畫不同步??闯龆四叩木W(wǎng)友好奇地在彈幕區(qū)發(fā)問:“主播是真人嗎?”
便宜但未必好用
但2D超寫實(shí)數(shù)字人主播有一大優(yōu)勢(shì),就是:便宜。
向業(yè)內(nèi)人士請(qǐng)教了一下,一位小商家如果從零開始,想要搭建一個(gè)最簡(jiǎn)單的真人直播間,頭一個(gè)月開銷保守估計(jì)在5萬元以上,后續(xù)每個(gè)月的支出可能也要兩三萬元。
相比之下,2D數(shù)字人就劃算多了。他們可以365天7×24小時(shí)不間斷吆喝帶貨,還不需要交五險(xiǎn)一金,賣出的貨不拿提成。場(chǎng)地成本同樣省了,想要什么背景,動(dòng)手直接在電腦上替換。
有需求的地方,就有商機(jī)。眼下,市面上已經(jīng)出現(xiàn)了不少提供此類數(shù)字人相關(guān)服務(wù)的公司。比如南京一家有名的數(shù)字人公司,一個(gè)數(shù)字人主播定制費(fèi)用為8000元,一年系統(tǒng)使用費(fèi)8萬多元。
還有一大批野生的散戶,分散在各種平臺(tái)兜售。這類數(shù)字人多以公共使用為主,即企業(yè)事先已集中采購(gòu)獲得形象授權(quán)產(chǎn)出通用的數(shù)字人。你購(gòu)買服務(wù)后,可以從公模中挑選喜歡的形象。
公模
其中廣州的一位代理商坦言,單個(gè)2D數(shù)字人單場(chǎng)直播下來,GMV(網(wǎng)站成交金額)可能并不算高。他展示的其中一個(gè)烤肉團(tuán)購(gòu)券案例,每分鐘在線人數(shù)11人,人均觀看時(shí)長(zhǎng)39秒,千次觀看成交金額886元,商品點(diǎn)擊率6%。
“優(yōu)勢(shì)是在于提供多種形象,一段音頻可生成多個(gè)不同數(shù)字人直播視頻,輕松搭建直播矩陣?!彼o出的優(yōu)惠價(jià)是2500元使用1套數(shù)字人直播系統(tǒng)半年,如果花39800元/年,就可以買下20套數(shù)字人直播系統(tǒng)。
而杭州一家公司的業(yè)務(wù)助理表示,2D超寫實(shí)數(shù)字人在本地生活中小商家中用得比較多,還可以用于海外TikTok、Youtube、亞馬遜等平臺(tái)的內(nèi)容創(chuàng)作。他說春節(jié)前后杭州一家旅游公司就采購(gòu)了10個(gè)數(shù)字人,賣出了大量的旅游線路。
“直播這個(gè)事呢,我覺得2D數(shù)字人還真代替不了真人主播?!盨imon是上海一家直播機(jī)構(gòu)的運(yùn)營(yíng)負(fù)責(zé)人,多次來杭州做直播活動(dòng),也和這邊數(shù)字人相關(guān)業(yè)務(wù)的公司有過接觸,但終因體驗(yàn)感不達(dá)預(yù)期而作罷。
“真人主播的不可替代性,主要在于情感連結(jié)、互動(dòng)溝通這塊,可以提升粉絲粘性、提供情緒價(jià)值。短期看,2D數(shù)字人主播做不到這些?!?/p>
“此外,直播平臺(tái)有自己的一套算法機(jī)制,如果一直用數(shù)字人直播,不會(huì)分發(fā)太大流量?!痹赟imon看來,定制一個(gè)精致的數(shù)字人主播也需要一定投入,但現(xiàn)階段綜合來看,產(chǎn)出可能不一定和投入成正比。
抖音:發(fā)布者應(yīng)對(duì)AI生成內(nèi)容作顯著標(biāo)識(shí)
作為一種輔助工具,這類會(huì)直播的數(shù)字人本身并沒有什么問題,科技進(jìn)步的一大意義就是把人從重復(fù)性勞動(dòng)中解放出來。不過,現(xiàn)在已經(jīng)出現(xiàn)了這樣一種趨勢(shì):賣數(shù)字人的公司將數(shù)字人和新時(shí)代互聯(lián)網(wǎng)營(yíng)銷深度捆綁,讓人覺得自己距離成功就差一個(gè)數(shù)字人。
更何況,眼下在直播中使用數(shù)字人,還存在一定風(fēng)險(xiǎn)。
5月9日,抖音發(fā)布關(guān)于人工智能生成內(nèi)容的平臺(tái)規(guī)范暨行業(yè)倡議。其中提到,創(chuàng)作者、主播、用戶、商家、廣告主等平臺(tái)生態(tài)參與者,在抖音應(yīng)用生成式人工智能技術(shù)時(shí),發(fā)布者應(yīng)對(duì)人工智能生成內(nèi)容進(jìn)行顯著標(biāo)識(shí),幫助其他用戶區(qū)分虛擬與現(xiàn)實(shí),特別是易混淆場(chǎng)景;虛擬人需在平臺(tái)進(jìn)行注冊(cè),虛擬人技術(shù)使用者需實(shí)名認(rèn)證;禁止利用生成式人工智能技術(shù)創(chuàng)作、發(fā)布侵權(quán)內(nèi)容,包括但不限于肖像權(quán)、知識(shí)產(chǎn)權(quán)等。一經(jīng)發(fā)現(xiàn),平臺(tái)將嚴(yán)格處罰。
記者也向快手客服做了相關(guān)咨詢。對(duì)方一再表示,建議直播時(shí)真人出鏡,如果檢測(cè)出或者被舉報(bào)“非真人直播”,很可能會(huì)被封號(hào);不過,當(dāng)數(shù)字人用于短視頻發(fā)布,那么平臺(tái)一般就看內(nèi)容是否合規(guī)。
此前,有人為了防止被封禁,想出了一個(gè)方法:雙機(jī)位直播,用一個(gè)數(shù)字人搭配真人講解,前者循環(huán)口播,后者做產(chǎn)品展示和互動(dòng)。
人均一個(gè)數(shù)字人的時(shí)代來了?
除了電商領(lǐng)域,在阿文看來,這類2D超寫實(shí)數(shù)字人的最佳使用場(chǎng)景,是純觀點(diǎn)輸出的短視頻?!氨热缌_振宇之前堅(jiān)持了十年的‘羅胖60秒’。此類視/音頻無需實(shí)時(shí)互動(dòng),動(dòng)作也沒太大變化,每次只需要替換嘴型部分,大大節(jié)省制作時(shí)間和成本?!?/p>
事實(shí)上,一些大V正在這么做。如果你刷過幾期財(cái)經(jīng)自媒體博主劉潤(rùn)的短視頻,就會(huì)發(fā)現(xiàn)屏幕大多打著一行字:部分畫面使用了AI技術(shù)制作。去年10月,他就公開透露,短視頻平臺(tái)上的內(nèi)容大部分由“數(shù)字人劉潤(rùn)”完成。
財(cái)經(jīng)作家吳曉波也在最新一次的跨年演講中直言:2023年每家公司都可能需要一個(gè)數(shù)字人,用它來做本地生活、客服、品牌直播、短視頻等。
入局的還有互聯(lián)網(wǎng)大廠。3月底,騰訊發(fā)布AI智能創(chuàng)作助手“騰訊智影”,主打人人都能打造數(shù)字人。用戶上傳少量圖片、視頻素材,就能得到自己的數(shù)字人分身,數(shù)字人直播也已接入。而早在去年的百度世界大會(huì)上,“百度App數(shù)字人計(jì)劃”就號(hào)稱要實(shí)現(xiàn)“人均一個(gè)數(shù)字人”。
騰訊AI智能創(chuàng)作助手“騰訊智影”
此外,隨著各種生成式AI工具的興起,網(wǎng)上能找到不少免費(fèi)教程。動(dòng)手能力強(qiáng)的,依葫蘆畫瓢,不花一分錢也可以搗鼓出一個(gè)數(shù)字人。
話說,你想要用自己的數(shù)字人做些什么?直播帶貨賺錢、創(chuàng)作短視頻,還是成為你的互聯(lián)網(wǎng)嘴替?
標(biāo)簽: