人工智能與數(shù)據(jù)科學(xué)專題: AlphaGo的算法原理:強化學(xué)習(xí)與圖神經(jīng)網(wǎng)絡(luò)(GNN)研究
項目時間 2023.04.29 開課
 編輯 | 幾何留學(xué)學(xué)姐 

 

01
適合人群
  • 適合年級 (Grade): 大學(xué)生及以上

  • 適合專業(yè) (Major): 計算機科學(xué)、人工智能、數(shù)據(jù)科學(xué)、電子與計算機工程等專業(yè),軟件工程、自動化等相關(guān)專業(yè)或者希望掌握強化學(xué)習(xí)的學(xué)生;對人工智能、大數(shù)據(jù)以及交叉學(xué)科和方向感興趣的學(xué)生;

  • 學(xué)生需要具備線性代數(shù)及概率論與數(shù)理統(tǒng)計基礎(chǔ),至少會使用一門編程語言實現(xiàn)神經(jīng)網(wǎng)絡(luò),有過強化學(xué)習(xí)開發(fā)經(jīng)驗的申請者優(yōu)先

02
項目介紹

項目內(nèi)容涉及強化學(xué)習(xí)核心理論和技能,具體包括遺傳算法、強化學(xué)習(xí)框架、Q-learning、行動者-批評(actor-critic;AC)模型、馬爾可夫決策過程、優(yōu)化控制、圖神經(jīng)網(wǎng)絡(luò)(graph neural networks; GNN)、自動機器學(xué)習(xí)(Auto ML)等。學(xué)生通過項目了解如何開發(fā)基于強化學(xué)習(xí)的生產(chǎn)力軟件,在結(jié)束時提交項目個性化研究課題報告,進行成果展示。

03
授課教授

?Pietro導(dǎo)師現(xiàn)任劍橋大學(xué)計算機科學(xué)與技術(shù)終身正教授,意大利國家認(rèn)定Top100科學(xué)家, H-index64,被引用次數(shù)35000+。

 

?教授2021年連中三篇計算機頂會ICML,其論文還曾發(fā)表在包括世界級學(xué)術(shù)期刊 《Nature》。

 

?導(dǎo)師持有歐洲學(xué)習(xí)和智能系統(tǒng)實驗室(Ellis;歐洲大型跨國人工智能研究所,目前擁有千位全球頂尖計算機工程師、數(shù)學(xué)家和其他領(lǐng)域科學(xué)家,旨在重構(gòu)歐洲人工智能前沿研究)席位、劍橋大學(xué)大數(shù)據(jù)研究指導(dǎo)委員會席位。

 

?Pietro導(dǎo)師的研究興趣為人工智能圖神經(jīng)網(wǎng)絡(luò)建模,在國際知名學(xué)術(shù)期刊發(fā)表論文多篇,曾榮獲歐盟委員會未來與新興技術(shù)(FET;迄今歐盟規(guī)模最大、資助力度最強的科研資助項目之一)會展三等獎。

04
你能獲得
  • 7周在線小組科研學(xué)習(xí)+5周論文指導(dǎo)學(xué)習(xí),共125課時

  • 項目報告

  • 優(yōu)秀學(xué)員獲得主導(dǎo)師 Reference Letter

  • 結(jié)業(yè)證書

  • EI/CPCI/Scopus/ProQuest/Crossref/EBSCO或同等級別索引國際會議全文投遞與發(fā)表指導(dǎo)

  • 成績單

05
個性化研究課題參考
  • 強化學(xué)習(xí)在博弈論中的應(yīng)用:類alpha算法開發(fā)

  • 利用經(jīng)驗留存解決強化學(xué)習(xí)所需樣本太多問題的可行性分析

  • 強化學(xué)習(xí)中的機器獎勵設(shè)置方法迭代

  • 為強化學(xué)習(xí)過擬合的特定場景重新建模的自動過程研究

  • 具有精確尺度估計的動作-評價網(wǎng)絡(luò)結(jié)構(gòu)與強化學(xué)習(xí)優(yōu)勢函數(shù)

 

開課日期:2023-04-29

具體上課時間、最終時間安排,均以實際安排為準(zhǔn)

預(yù)約咨詢

  • 幾何留學(xué)公眾號
  • 幾何留學(xué)APP
  • 幾何留學(xué)APP

    2403個學(xué)校

    10582個專業(yè)

    3217個錄取案例

    8697份錄取報告