下載app免費(fèi)領(lǐng)取會(huì)員
2024年7月20日,在中國圖學(xué)學(xué)會(huì)第七屆“奮發(fā)圖強(qiáng)”青年科學(xué)家論壇召開期間第三屆圖學(xué)感知與認(rèn)知計(jì)算論壇暨中國圖學(xué)學(xué)會(huì)“奮發(fā)圖強(qiáng)”青年人才學(xué)術(shù)沙龍2024年度第二期(總第22期)在大連成功舉辦。主題為“多模態(tài)內(nèi)容感知與生成”。
本屆論壇由第九屆中國科協(xié)青年人才托舉工程入選者、浙江大學(xué)羅亞威研究員和北京工業(yè)大學(xué)王博岳副教授擔(dān)任論壇主席,邀請(qǐng)到了中科院自動(dòng)化所董未名教授、北京航空航天大學(xué)李帥教授、中山大學(xué)任文琦教授、中科院自動(dòng)化所劉振宇教授、北京航空航天崔志勇教授、浙江大學(xué)彭思達(dá)研究員與中山大學(xué)苗嘉旭副教授等知名專家,圍繞多模態(tài)內(nèi)容感知與生成,就最新的理論發(fā)展、技術(shù)創(chuàng)新及應(yīng)用實(shí)踐進(jìn)行深入交流與探討。
首先,中國科學(xué)院自動(dòng)化研究所董未名研究員以“繪畫中的AI”為主題,著眼于隨著多模態(tài)大模型和擴(kuò)散模型技術(shù)的迅速發(fā)展,由人工智能生成的繪畫作品在藝術(shù)性和內(nèi)容豐富度方面都有了極大的提升的趨勢(shì)。他回顧了AI繪畫技術(shù)的發(fā)展歷程,介紹圖像/視頻風(fēng)格遷移、文字引導(dǎo)的藝術(shù)圖像/視頻生成和多模態(tài)信息引導(dǎo)的藝術(shù)圖像/視頻生成等AI繪畫技術(shù)的基本原理,并展示由相關(guān)技術(shù)生成的美術(shù)作品。另外,還探討AI繪畫與人類藝術(shù)家創(chuàng)作之間的關(guān)系,并對(duì)AI繪畫技術(shù)未來的理論研究和應(yīng)用發(fā)展方向進(jìn)行展望。
中國科學(xué)院自動(dòng)化研究所董未名研究員作報(bào)告
隨后,北京航空航天大學(xué)李帥教授介紹了圖學(xué)在醫(yī)療領(lǐng)域方面的進(jìn)展。針對(duì)在臨床問診和檢查仿真過程中,需構(gòu)建高逼真的虛擬標(biāo)準(zhǔn)化病人,并使其呈現(xiàn)出指定病癥的行為。他主要從人物再識(shí)別、人體動(dòng)作識(shí)別、雙人交互行為理解、文本驅(qū)動(dòng)的行為生成、人與物體交互行為生成、個(gè)性化人物行為生成、情境化的多模態(tài)交互行為生成等方面對(duì)相關(guān)研究成果進(jìn)行介紹,并介紹相關(guān)技術(shù)在虛擬標(biāo)準(zhǔn)化病人方面的醫(yī)學(xué)應(yīng)用案例。
北京航空航天大學(xué)李帥教授作報(bào)告
第三,中山大學(xué)任文琦教授帶來了圖像修復(fù)方面工作的介紹。傳統(tǒng)的基于RGB圖像的單一模態(tài)視覺模型在惡劣成像環(huán)境下,由于硬件信息捕捉的局限性,難以生成信息完備的圖像內(nèi)容,影響下游感知任務(wù)的準(zhǔn)確性。因此,如何融合信息互補(bǔ)的多模態(tài)內(nèi)容并處理和恢復(fù)退化的單一模態(tài)信息成為亟待解決的技術(shù)問題。本報(bào)告從光學(xué)相差矯正、多曝光融合、視頻去雨、圖像去霧、暗光圖像去噪五個(gè)方向,研究以RGB圖像、事件數(shù)據(jù)、近紅外成像、深度圖、多曝光圖像、位置嵌入為代表的多模態(tài)內(nèi)容,深入探討了基于多模態(tài)融合的圖像處理與恢復(fù)技術(shù)。
中山大學(xué)任文琦教授作報(bào)告
第四,中國科學(xué)院自動(dòng)化研究所中國科學(xué)院分子影像重點(diǎn)實(shí)驗(yàn)室的劉振宇教授介紹了醫(yī)療輔助診斷方向的最新進(jìn)展。他的工作利用人工智能方法,結(jié)合醫(yī)學(xué)影像宏觀信息和病理圖像微觀信息,構(gòu)建面向新輔助治療效果評(píng)估的醫(yī)學(xué)信息系統(tǒng),輔助臨床醫(yī)生對(duì)新輔助療效進(jìn)行精準(zhǔn)預(yù)測(cè)評(píng)估具有重要價(jià)值。相關(guān)醫(yī)學(xué)信息系統(tǒng)已在多中心臨床大數(shù)據(jù)進(jìn)行驗(yàn)證,并開發(fā)了輔助診斷系統(tǒng)軟件,在多家醫(yī)院開展了臨床試驗(yàn)驗(yàn)證,為探索醫(yī)學(xué)影像人工智能方法的臨床應(yīng)用提供了新思路。
中國科學(xué)院自動(dòng)化研究所中國科學(xué)院分子影像重點(diǎn)實(shí)驗(yàn)室劉振宇教授作報(bào)告
第五,隨著自動(dòng)駕駛技術(shù)的不斷進(jìn)步,融合感知技術(shù)在提高車輛環(huán)境感知能力和決策準(zhǔn)確性方面發(fā)揮著重要作用如何從多視角多源數(shù)據(jù)中獲取精準(zhǔn)的自動(dòng)駕駛場(chǎng)景感知信息,并生成復(fù)雜自動(dòng)駕駛場(chǎng)景以輔助決策與測(cè)試仍是當(dāng)前重要挑戰(zhàn)。北京航空航天大學(xué)崔志勇教授的報(bào)告簡(jiǎn)要探討了自動(dòng)駕駛領(lǐng)域中的BEV感知技術(shù),多模態(tài)數(shù)據(jù)融合、三維占據(jù)感知以及自動(dòng)駕駛場(chǎng)景的生成能力。
北京航空航天大學(xué)崔志勇教授作報(bào)告
第六,物理世界仿真是對(duì)人們?nèi)粘I钸M(jìn)行真實(shí)、立體、時(shí)序化反映和表達(dá)的數(shù)字空間。傳統(tǒng)多視圖重建算法是構(gòu)建數(shù)字三維世界的重要工具。然而,傳統(tǒng)重建算法依賴精細(xì)的數(shù)據(jù)采集過程,并且難以處理復(fù)雜動(dòng)態(tài)場(chǎng)景。浙江大學(xué)彭思達(dá)研究員針對(duì)這些挑戰(zhàn)講述了基于多視圖幾何和先驗(yàn)學(xué)習(xí)等思想,在相機(jī)位姿估計(jì)、場(chǎng)景重建以及物體生成三方面提出了新技術(shù),提升了場(chǎng)景仿真的質(zhì)量與效率。
浙江大學(xué)彭思達(dá)研究員作報(bào)告
最后,隨著多媒體和網(wǎng)絡(luò)技術(shù)的迅猛發(fā)展,海量的圖像.視頻、文本等多媒體數(shù)據(jù)快速增長(zhǎng),以視頻為中心的跨媒體分析、理解和推理成為人工智能研究的一個(gè)重要而具有挑戰(zhàn)性的問題。中山大學(xué)苗嘉旭副教授帶來的報(bào)告重點(diǎn)關(guān)注文本-視頻跨媒體理解和推理技術(shù),他介紹了基于語言查詢的視頻時(shí)空定位技術(shù)以及細(xì)粒度的視頻理解方法,之后探討了視覺語言跨模態(tài)場(chǎng)景下智能機(jī)器的演繹推理和事件預(yù)測(cè)能力。
中山大學(xué)苗嘉旭副教授作報(bào)告
報(bào)告結(jié)束后,各位研究專家與參會(huì)人員對(duì)共同感興趣的領(lǐng)域和問題進(jìn)行了溝通互動(dòng)和交流,分享彼此見解。論壇主席為各位演講嘉賓頒發(fā)了證書。
本文版權(quán)歸腿腿教學(xué)網(wǎng)及原創(chuàng)作者所有,未經(jīng)授權(quán),謝絕轉(zhuǎn)載。
上一篇:路在何方,唉!設(shè)計(jì)院,將成“絕唱”!
下一篇:中央企業(yè)BIM軟件創(chuàng)新聯(lián)合體啟動(dòng)大會(huì)暨第二屆BIM成果應(yīng)用大會(huì)在京召開
推薦專題