【講座題目】對電力市場負荷服務實體的聯合投標與定價的深度強化學習
【講座時間】2019年12月16日(星期一)上午10:30
【講座地點】保定校區 教一樓 217
【主 講 人】Hongbo Sun,美國三菱電機研究所高級首席研究科學家
【主講人簡介】
Hongbo Sun,在重慶大學獲得電氣工程博士學位,現任美國三菱電機研究所高級首席研究科學家,在加入三菱電機研究所之前,他曾先后擔任過重慶大學的全職教授、Oracle 的首席應用工程師、SPL 的技術架構師。他參與編著了一本書籍專著,并發表 110 余篇論文,并獲得 25 項專利。他的研究方向包括電力系統的運行和控制、電力系統的規劃和分析、智能電網的應用。
【內容簡介】
在本次報告中,主講人將對負荷服務實體聯合在電力批發市場進行能源投標和在零售電力市場能源定價的問題進行講解。聯合投標和定價問題被構建為具有連續狀態和行為空間的馬爾可夫決策過程,其中,能源投標和能源定價是兩個具有共同目標的行為。應用深度確定性策略梯度算法來求解此馬爾可夫決策過程,以獲取最佳的投標和定價策略。然而,深度確定性策略梯度算法通常需要大量的狀態轉換樣本,導致很高的計算成本。為此,應用神經網絡從歷史數據中學習動態報價和價格響應函數,去分別構建電力批發市場和終端用戶集體行為的模型。這些響應函數可準確捕獲批發電力市場出清結果與終端用戶的響應之間的時間相關性,并可用于生成狀態轉換樣本,而無需任何計算成本。更重要的是,響應函數還為馬爾科夫決策過程中的狀態選擇提供了信息。本報告還通過一個算例將說明所提出方法的有效性。