完善主體資料,免費贈送VIP會員!
* 主體類型
* 企業(yè)名稱
* 信用代碼
* 所在行業(yè)
* 企業(yè)規(guī)模
* 所在職位
* 姓名
* 所在行業(yè)
* 學歷
* 工作性質
請先選擇行業(yè)
您還可以選擇以下福利:
行業(yè)福利,領完即止!

下載app免費領取會員

NULL

ad.jpg

第三屆圖學感知與認知計算論壇暨中國圖學學會“奮發(fā)圖強”青年人才學術沙龍2024年度第二期(總第22期)在大連成功舉辦

發(fā)布于:2024-08-02 09:37:34

網(wǎng)友投稿

更多

  2024年7月20日,在中國圖學學會第七屆“奮發(fā)圖強”青年科學家論壇召開期間第三屆圖學感知與認知計算論壇暨中國圖學學會“奮發(fā)圖強”青年人才學術沙龍2024年度第二期(總第22期)在大連成功舉辦。主題為“多模態(tài)內容感知與生成”。


       本屆論壇由第九屆中國科協(xié)青年人才托舉工程入選者、浙江大學羅亞威研究員和北京工業(yè)大學王博岳副教授擔任論壇主席,邀請到了中科院自動化所董未名教授、北京航空航天大學李帥教授、中山大學任文琦教授、中科院自動化所劉振宇教授、北京航空航天崔志勇教授、浙江大學彭思達研究員與中山大學苗嘉旭副教授等知名專家,圍繞多模態(tài)內容感知與生成,就最新的理論發(fā)展、技術創(chuàng)新及應用實踐進行深入交流與探討。

image.png


       首先,中國科學院自動化研究所董未名研究員以“繪畫中的AI”為主題,著眼于隨著多模態(tài)大模型和擴散模型技術的迅速發(fā)展,由人工智能生成的繪畫作品在藝術性和內容豐富度方面都有了極大的提升的趨勢。他回顧了AI繪畫技術的發(fā)展歷程,介紹圖像/視頻風格遷移、文字引導的藝術圖像/視頻生成和多模態(tài)信息引導的藝術圖像/視頻生成等AI繪畫技術的基本原理,并展示由相關技術生成的美術作品。另外,還探討AI繪畫與人類藝術家創(chuàng)作之間的關系,并對AI繪畫技術未來的理論研究和應用發(fā)展方向進行展望。

image.png

  中國科學院自動化研究所董未名研究員作報告


       隨后,北京航空航天大學李帥教授介紹了圖學在醫(yī)療領域方面的進展。針對在臨床問診和檢查仿真過程中,需構建高逼真的虛擬標準化病人,并使其呈現(xiàn)出指定病癥的行為。他主要從人物再識別、人體動作識別、雙人交互行為理解、文本驅動的行為生成、人與物體交互行為生成、個性化人物行為生成、情境化的多模態(tài)交互行為生成等方面對相關研究成果進行介紹,并介紹相關技術在虛擬標準化病人方面的醫(yī)學應用案例。

image.png

  北京航空航天大學李帥教授作報告


       第三,中山大學任文琦教授帶來了圖像修復方面工作的介紹。傳統(tǒng)的基于RGB圖像的單一模態(tài)視覺模型在惡劣成像環(huán)境下,由于硬件信息捕捉的局限性,難以生成信息完備的圖像內容,影響下游感知任務的準確性。因此,如何融合信息互補的多模態(tài)內容并處理和恢復退化的單一模態(tài)信息成為亟待解決的技術問題。本報告從光學相差矯正、多曝光融合、視頻去雨、圖像去霧、暗光圖像去噪五個方向,研究以RGB圖像、事件數(shù)據(jù)、近紅外成像、深度圖、多曝光圖像、位置嵌入為代表的多模態(tài)內容,深入探討了基于多模態(tài)融合的圖像處理與恢復技術。

image.png

  中山大學任文琦教授作報告


       第四,中國科學院自動化研究所中國科學院分子影像重點實驗室的劉振宇教授介紹了醫(yī)療輔助診斷方向的最新進展。他的工作利用人工智能方法,結合醫(yī)學影像宏觀信息和病理圖像微觀信息,構建面向新輔助治療效果評估的醫(yī)學信息系統(tǒng),輔助臨床醫(yī)生對新輔助療效進行精準預測評估具有重要價值。相關醫(yī)學信息系統(tǒng)已在多中心臨床大數(shù)據(jù)進行驗證,并開發(fā)了輔助診斷系統(tǒng)軟件,在多家醫(yī)院開展了臨床試驗驗證,為探索醫(yī)學影像人工智能方法的臨床應用提供了新思路。

image.png

  中國科學院自動化研究所中國科學院分子影像重點實驗室劉振宇教授作報告


       第五,隨著自動駕駛技術的不斷進步,融合感知技術在提高車輛環(huán)境感知能力和決策準確性方面發(fā)揮著重要作用如何從多視角多源數(shù)據(jù)中獲取精準的自動駕駛場景感知信息,并生成復雜自動駕駛場景以輔助決策與測試仍是當前重要挑戰(zhàn)。北京航空航天大學崔志勇教授的報告簡要探討了自動駕駛領域中的BEV感知技術,多模態(tài)數(shù)據(jù)融合、三維占據(jù)感知以及自動駕駛場景的生成能力。

image.png

  北京航空航天大學崔志勇教授作報告


       第六,物理世界仿真是對人們日常生活進行真實、立體、時序化反映和表達的數(shù)字空間。傳統(tǒng)多視圖重建算法是構建數(shù)字三維世界的重要工具。然而,傳統(tǒng)重建算法依賴精細的數(shù)據(jù)采集過程,并且難以處理復雜動態(tài)場景。浙江大學彭思達研究員針對這些挑戰(zhàn)講述了基于多視圖幾何和先驗學習等思想,在相機位姿估計、場景重建以及物體生成三方面提出了新技術,提升了場景仿真的質量與效率。

image.png

  浙江大學彭思達研究員作報告


       最后,隨著多媒體和網(wǎng)絡技術的迅猛發(fā)展,海量的圖像.視頻、文本等多媒體數(shù)據(jù)快速增長,以視頻為中心的跨媒體分析、理解和推理成為人工智能研究的一個重要而具有挑戰(zhàn)性的問題。中山大學苗嘉旭副教授帶來的報告重點關注文本-視頻跨媒體理解和推理技術,他介紹了基于語言查詢的視頻時空定位技術以及細粒度的視頻理解方法,之后探討了視覺語言跨模態(tài)場景下智能機器的演繹推理和事件預測能力。

image.png

  中山大學苗嘉旭副教授作報告


       報告結束后,各位研究專家與參會人員對共同感興趣的領域和問題進行了溝通互動和交流,分享彼此見解。論壇主席為各位演講嘉賓頒發(fā)了證書。


本文版權歸腿腿教學網(wǎng)及原創(chuàng)作者所有,未經(jīng)授權,謝絕轉載。

未標題-1.jpg

上一篇:路在何方,唉!設計院,將成“絕唱”!

下一篇:中央企業(yè)BIM軟件創(chuàng)新聯(lián)合體啟動大會暨第二屆BIM成果應用大會在京召開

60acb4e0ef112.png