揭榜任務(wù):研制高速4D面部采集技術(shù),研究并實現(xiàn)批量化、自動化的產(chǎn)業(yè)級面部模型處理與制作流程?;诙嗄B(tài)信息進行多樣化采集,建設(shè)人臉高精度4D模型數(shù)據(jù)庫,實現(xiàn)高逼真數(shù)字人面部和身體的快速構(gòu)建。搭建基于大模型的多模態(tài)數(shù)字人交互系統(tǒng),實現(xiàn)視覺、聽覺等多模態(tài)輸入信息的統(tǒng)一表征,實現(xiàn)基于預(yù)訓(xùn)練模型的表情、動作推理。
預(yù)期目標(biāo):到2025年,數(shù)字人4D面部動態(tài)重建幀率≥30fps,綁定后生成表情誤差小于5mm,數(shù)字人的自然度、真實度等主觀體驗評分達到行業(yè)領(lǐng)先水平?;诙嗄B(tài)交互輸入結(jié)合大模型實現(xiàn)高準(zhǔn)確度、低延遲的動作、表情、行為推理。
(七)虛擬空間創(chuàng)作平臺
揭榜任務(wù):研究基于元宇宙虛擬空間的構(gòu)建系統(tǒng),實現(xiàn)低代碼快速構(gòu)建虛擬空間。研究音視頻互動平臺,實現(xiàn)在元宇宙中進行語音、視頻交流。研究多人協(xié)作系統(tǒng),實現(xiàn)數(shù)字孿生模型的多人交互協(xié)作。研究共享桌面技術(shù),實現(xiàn)多人共享演示內(nèi)容。研究元宇宙空間與云渲染方式的融合,實現(xiàn)手機或PC訪問元宇宙空間。研究人物換裝、捏臉功能,實現(xiàn)在虛擬空間中打造個性化的數(shù)字人。集成智能助手,提供專屬場景的業(yè)務(wù)問答與指令。
預(yù)期目標(biāo):到2025年,實現(xiàn)不少于5類場景的低代碼快速構(gòu)建,支持會議元宇宙、展覽元宇宙、教育元宇宙、辦公元宇宙、園區(qū)元宇宙等場景,場景運行流暢不卡頓。支持在線人數(shù)、模型加載效率、延遲時間等核心指標(biāo)達到國際先進水平。
(八)3D沉浸式實時通信系統(tǒng)
揭榜任務(wù):研究基于多模態(tài)、多視角的三維視覺技術(shù),實現(xiàn)對人、物、場的動態(tài)三維數(shù)據(jù)采集、建模和顯示。研制基于多傳感器的三維數(shù)據(jù)捕捉設(shè)備和基于裸眼3D顯示器的沉浸式實時通信系統(tǒng),旨在提供身臨其境的沉浸感體驗,可應(yīng)用于視頻會議和遠程協(xié)作,為遠程教育和培訓(xùn)、遠程手術(shù)和醫(yī)學(xué)會診、游戲和文旅等領(lǐng)域提供新的技術(shù)手段。
預(yù)期目標(biāo):到2025年,3D沉浸式實時通信系統(tǒng)從采集到呈現(xiàn)端到端時延小于400ms,幀率大于25,三維重建平均誤差、結(jié)構(gòu)相似性、感知損失指標(biāo)達到行業(yè)領(lǐng)先水平。
(九)3D實景地圖平臺
揭榜任務(wù):研究3D實景地圖平臺,突破3D實景地理實體在語義化、結(jié)構(gòu)化等維度上的技術(shù)瓶頸。研究用時空數(shù)據(jù)編織與時空知識圖譜技術(shù)實現(xiàn)對地理實體自身屬性及實體間關(guān)系進行一致性描述,以實現(xiàn)地理實體的語義化,達到計算機可理解、可分析。研究用GeoAI方法識別分類技術(shù),實現(xiàn)地理實體單體分割并獲取其幾何輪廓及組成結(jié)構(gòu)。在城市規(guī)劃、應(yīng)急防災(zāi)、交通治理等場景下實現(xiàn)快速批量應(yīng)用。
預(yù)期目標(biāo):到2025年,地理實體語義化覆蓋率、結(jié)構(gòu)化準(zhǔn)確率等核心指標(biāo)達到行業(yè)領(lǐng)先。
(十)基于文本描述的3D場景生成系統(tǒng)
揭榜任務(wù):研究基于文本描述的3D場景生成系統(tǒng),突破傳統(tǒng)方法需要大量標(biāo)記3D模型數(shù)據(jù)集的限制,解決當(dāng)前基于文本描述的3D場景生成算法結(jié)果過飽和、過平滑、缺少細節(jié)等問題。研究多模態(tài)室內(nèi)3D場景生成,實現(xiàn)高質(zhì)量3D內(nèi)容生成,包括復(fù)雜效果,基于文本生成多樣性3D內(nèi)容和360°場景等。研究基于分布式云渲染實現(xiàn)多模態(tài)實時3D場景生成系統(tǒng),實現(xiàn)高帶寬高質(zhì)量內(nèi)容實時傳輸,海量高質(zhì)量3D內(nèi)容實時云端生產(chǎn)、渲染、交互。
預(yù)期目標(biāo):到2025年,實現(xiàn)根據(jù)輸入的文本信息,對于實例輸入的文本生成特定實例圖像。實現(xiàn)基于文本或文本+圖像的室內(nèi)3D場景的生成,生成場景的渲染視角圖像與文本一致性指標(biāo)CLIP score、渲染圖像的感知指標(biāo)Inception score等核心指標(biāo)達到國際領(lǐng)先。
三、公共支撐
(十一)元宇宙數(shù)字身份標(biāo)識技術(shù)解決方案
揭榜任務(wù):研究元宇宙數(shù)字身份標(biāo)識技術(shù),構(gòu)建跨平臺、跨設(shè)備、跨系統(tǒng)的元宇宙中數(shù)字身份及作品標(biāo)識體系。研究數(shù)字身份映射體系,將元宇宙中數(shù)字身份與現(xiàn)實中人員身份關(guān)聯(lián),確保元宇宙世界中數(shù)字身份活動的真實性。通過“嵌入式”標(biāo)識服務(wù),為每個數(shù)字身份及相關(guān)作品分配唯一數(shù)字標(biāo)識,建立起可信賴、可查驗、可追溯的數(shù)字身份及標(biāo)識管理體系。
預(yù)期目標(biāo):到2025年,實現(xiàn)元宇宙數(shù)字身份標(biāo)識技術(shù)解決方案在至少1類行業(yè)領(lǐng)域開展應(yīng)用試點;實現(xiàn)元宇宙數(shù)字身份及作品的唯一標(biāo)識技術(shù),數(shù)字身份標(biāo)識可跨平臺、跨設(shè)備、跨系統(tǒng)互認(rèn)互通;技術(shù)解決方案的安全性、創(chuàng)新性及實用性達到行業(yè)領(lǐng)先水平。
附:1.2023年未來產(chǎn)業(yè)創(chuàng)新任務(wù)揭榜單位推薦表-元宇宙方向