中文字幕亚洲欧美,日韩中文在线观看,亚洲欧美中日韩中文字幕,欧美日韩高清不卡免费观看,在线亚洲精品,亚洲欧美日韩综合一区,日韩高清第一页

×

掃碼關注微信公眾號

百度多模態(tài)數(shù)字人搶先登場,微美全息(WIMI.US)AI算法驅動開啟虛擬人紀元

2025/6/23 11:18:57     

近日,在百度(BIDU.US)AI Day開放日上,百度官宣打造業(yè)界首個超頭主播羅永浩數(shù)字人,這也是業(yè)內(nèi)首個多模態(tài)高度融合數(shù)字人。該技術基于文心大模型4.5T升級,實現(xiàn)語言、聲音與形象的協(xié)調(diào)一致。

首個多模態(tài)高度融合數(shù)字人

此前,6月15日,羅永浩數(shù)字人在百度電商首次開播。據(jù)悉,數(shù)字人直播間僅開播26分鐘創(chuàng)下超1300萬人次觀看、GMV突破5500萬元的行業(yè)新紀錄,部分核心品類帶貨量反超真人直播。


image.png


據(jù)百度方面介紹,此次合作主要得益于百度發(fā)布的高說服力數(shù)字人等關鍵技術突破。百度電商數(shù)據(jù)顯示,目前已有累計超 10 萬數(shù)字人主播,覆蓋電商、教育、醫(yī)療等數(shù)十個行業(yè),驗證了數(shù)字人直播的商業(yè)可行性。

此外,今年 4 月百度發(fā)布的高說服力數(shù)字人已讓數(shù)字人帶入 3.0 時代,這是一個新的里程碑,標志著智能電商邁入新篇章,新一代高說服力數(shù)字人成為了一個像真人一樣。

百度強調(diào),羅永浩數(shù)字人已達到媲美超頭主播的體感效果,隨著大模型與多模能力發(fā)展,數(shù)字人未來超越真人效果極具潛力。


image.png


事實上,AI 數(shù)字人融合了人工智能、計算機視覺、自然語言處理等尖端技術,能夠以高度逼真、智能的形象呈現(xiàn)在現(xiàn)實中,它可以根據(jù)不同的課程內(nèi)容和教學目標,扮演教師助手、虛擬講解員、學習伙伴等多種角色。

捕捉市場風口

技術層面,各類大模型加速迭代并構建開源生態(tài),人工智能應用場景的構建成為新的科技焦點,多模態(tài)AI成為核心突破方向,并且AI驅動數(shù)字人的應用場景正在加速落地,逐步向互聯(lián)網(wǎng)、文旅、金融、快消、教育等領域加速滲透。

例如相較于傳統(tǒng)的教學模式,AI 數(shù)字人能夠實現(xiàn) 24 小時不間斷的教學服務,為學生提供個性化的學習指導,精準解答疑問,引導學習思路,極大地提高了教學效率和學習效果。

專家表示,在當今數(shù)字化浪潮席卷全球的背景下,各個領域正面臨著前所未有的變革機遇,而隨著技術的不斷進步,AI 數(shù)字人作為前沿科技的結晶,正逐步走進人們的視野,而將其深度融合,并有望形成千億級新賽道。


image.png


微美全息AI算法驅動數(shù)字人體系創(chuàng)新

誠然,越來越多的企業(yè)與資本布局數(shù)字人領域。公開資料顯示,AI上市企業(yè)微美全息(WIMI.US),在經(jīng)過技術的不斷積累和大量的市場檢驗后,將大模型與多模態(tài)技術結合,通過深度學習、動作模擬、情感模擬等算法,僅需少量真人視頻數(shù)據(jù)即可生成高擬真數(shù)字人,顯著降低制作成本,并支持低延遲、高精度的交互體驗。

此外,微美全息數(shù)字人支持語音、圖像、視頻等多模態(tài)交互,結合大模型的記憶與性格復刻能力,實現(xiàn)自然對話和情感化互動。同時為深化對AI驅動的交互式數(shù)字人解決方案的應用方式,微美全息依托AI虛擬數(shù)字人生成平臺,實現(xiàn)低成本、短周期、批量化生產(chǎn),定制化設計外貌特征,滿足不同行業(yè)場景需求,提供更智能、個性化和精準的交互體驗。

結語

在當下這個挑戰(zhàn)與機遇并存的時期,作為由計算機圖形學、動作捕捉、AI深度學習、語音合成等計算機手段創(chuàng)造及使用,并具有多重人類特征的綜合產(chǎn)物,數(shù)字人是新一代信息技術集成創(chuàng)新和應用的未來產(chǎn)業(yè),也是數(shù)字經(jīng)濟與實體經(jīng)濟融合的高級形態(tài)。未來,數(shù)字人是否廣泛滲透到傳統(tǒng)產(chǎn)業(yè)中,實現(xiàn)產(chǎn)業(yè)的向外擴展,成為繼互聯(lián)網(wǎng)之后的又一重要推動力?請拭目以待。