【講座題目】基于多模態大模型的智能理解與內容生成
【時 間】2022年12月24日 上午:9:10-10:00
【地 點】保定校區 計算機系 自動化系 騰訊會議:841-767-337
【主 講 人】王金橋,研究員/博士生導師,中科院自動化所
【主講人簡介】
王金橋,中國科學院自動化研究所紫東太初多模態中心常務副主任,研究員,博導,武漢人工智能研究院院長,中國科學院大學人工智能學院崗位教授,多模態人工智能產業聯盟秘書長,主要從事多模態大模型、視頻分析與檢索、大規模目標識別等方面的研究。共發表包括IEEE國際權威期刊和頂級會議論文300余篇,國際期刊50余篇,國際會議220余篇。完成國家標準提案3項,發明專利36項,10項國際視覺算法競賽冠軍,北京市科技進步一等獎,吳文俊人工智能科技進步二等獎,中國發明創新銀獎。
【報告內容簡介】
自從GPT/Bert模型提出以來,基于自監督學習的預訓練模型迎來了爆發式發展。當前包含文本、語音、圖像、視頻等多種模態數據的信息在不斷融合,預訓練模型正由單模態邁向多模態自監督學習,我們通過跨模態多任務自監督學習融合文本、語音、圖像、視頻海量弱相關的多模態數據,開拓性地實現了圖像、文字、語音和視頻等不同模態數據之間的統一表示和互相生成,基于國產化基礎軟硬件平臺打造了紫東太初大模型開放服務平臺,既可以實現一站式低代碼的模型微調和模型部署,支持跨模態理解和跨模態生成,在智慧文旅、智慧城市、智能制造和智慧醫療等多個領域實現了落地應用。