時間:2023-06-11|瀏覽:340
虛擬數(shù)字人的運作原理:虛擬數(shù)字人的誕生發(fā)展與AI人工智能可以說是密不可分。虛擬數(shù)字人系統(tǒng)一般情況下由人物形象、語音生成、動漫生成、音視頻生成表明、互動等5個模塊組成。最先看一下非互動型數(shù)字人:系統(tǒng)根據(jù)目標文本生成對應(yīng)的人物語音及動漫,并生成音視頻呈現(xiàn)給客戶。互動型數(shù)字人依據(jù)驅(qū)動方式的差異可分為智能驅(qū)動型和真人驅(qū)動型。智能驅(qū)動型數(shù)字人:根據(jù)智能系統(tǒng)自動讀取并分析鑒別外部輸入信息,依據(jù)分析結(jié)果決策數(shù)字人后續(xù)的導(dǎo)出文字,驅(qū)動人物模型生成對應(yīng)的語音與動作來使數(shù)字人跟用戶互動。真人驅(qū)動型數(shù)字人:真人依據(jù)安防監(jiān)控系統(tǒng)傳出的用戶視頻,和用戶實時語音,同時通過動作捕捉采集系統(tǒng)將真人的表情、動作展現(xiàn)在虛擬數(shù)字人形象上,進而與客戶進行互動。
虛擬數(shù)字人落地難在哪?盡管虛擬數(shù)字人產(chǎn)業(yè)發(fā)展前景向好,但要完成產(chǎn)業(yè)化落地,還存在一些難點。例如,虛擬數(shù)字人技術(shù)跨度大、專業(yè)人才跨界人才空缺大、產(chǎn)業(yè)鏈很長領(lǐng)域溝通成本高、領(lǐng)域商品質(zhì)量參差不齊欠缺統(tǒng)一標準,等等。從技術(shù)角度看,應(yīng)進一步強化虛擬數(shù)字人建設(shè)模塊的發(fā)展,讓虛擬數(shù)字人越來越真實,行動更為流暢自然,更能理解對話內(nèi)容,提升虛擬人交互性。從應(yīng)用角度看,必須強化對虛擬數(shù)字人生產(chǎn)力提高的研究,讓企業(yè)可以多方位設(shè)定虛擬數(shù)字人,給予其不同人設(shè)與性格,形象和響聲上都可進行多樣化解決。從倫理角度看,政府可以激勵創(chuàng)立中小企業(yè)虛擬人合作協(xié)會,出臺政策激勵科技人員多方位研究,一同協(xié)商解決技術(shù)性難題,針對AI覺醒、個人隱私泄露等突發(fā)問題進行風險預(yù)估。
總的來說,人們在追求虛擬數(shù)字人技術(shù)的革新的同時,還應(yīng)堅持以人為本的理念,實現(xiàn)技術(shù)對人類社會的福祉最大化,搭建向善的技術(shù)標準。