人工智能與數(shù)據(jù)科學(xué)專題:AlphaGo到GPT中RLHF的進(jìn)化
項(xiàng)目時(shí)間 2024.05.11 開(kāi)課
 編輯 | 幾何留學(xué)學(xué)姐 

 

01
適合人群
  • 適合年級(jí) (Grade): 大學(xué)生及以上

  • 適合專業(yè) (Major): 計(jì)算機(jī)科學(xué)、人工智能、數(shù)據(jù)科學(xué)、電子與計(jì)算機(jī)工程等專業(yè),軟件工程、自動(dòng)化等相關(guān)專業(yè)或者希望掌握強(qiáng)化學(xué)習(xí)的學(xué)生;對(duì)人工智能、大數(shù)據(jù)以及交叉學(xué)科和方向感興趣的學(xué)生;

  • 學(xué)生需要具備線性代數(shù)及概率論與數(shù)理統(tǒng)計(jì)基礎(chǔ),至少會(huì)使用一門編程語(yǔ)言實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò),有過(guò)強(qiáng)化學(xué)習(xí)開(kāi)發(fā)經(jīng)驗(yàn)的申請(qǐng)者優(yōu)先

  • 建議選修: Python編程與數(shù)據(jù)處理

 

02
項(xiàng)目介紹

項(xiàng)目?jī)?nèi)容涉及強(qiáng)化學(xué)習(xí)核心理論和技能,具體包括遺傳算法、強(qiáng)化學(xué)習(xí)框架、Q-learning、行動(dòng)者-批評(píng)(actor-critic;AC)模型、馬爾可夫決策過(guò)程、優(yōu)化控制、圖神經(jīng)網(wǎng)絡(luò)(graph neural networks; GNN)、自動(dòng)機(jī)器學(xué)習(xí)(Auto ML)等。學(xué)生通過(guò)項(xiàng)目了解如何開(kāi)發(fā)基于強(qiáng)化學(xué)習(xí)的生產(chǎn)力軟件,在結(jié)束時(shí)提交項(xiàng)目個(gè)性化研究課題報(bào)告,進(jìn)行成果展示。

 

個(gè)性化研究課題參考:

強(qiáng)化學(xué)習(xí)在博弈論中的應(yīng)用:類alpha算法開(kāi)發(fā)

利用經(jīng)驗(yàn)留存解決強(qiáng)化學(xué)習(xí)所需樣本太多問(wèn)題的可行性分析

強(qiáng)化學(xué)習(xí)中的機(jī)器獎(jiǎng)勵(lì)設(shè)置方法迭代

為強(qiáng)化學(xué)習(xí)過(guò)擬合的特定場(chǎng)景重新建模的自動(dòng)過(guò)程研究

具有精確尺度估計(jì)的動(dòng)作-評(píng)價(jià)網(wǎng)絡(luò)結(jié)構(gòu)與強(qiáng)化學(xué)習(xí)優(yōu)勢(shì)函數(shù)

 

03
項(xiàng)目背景

近年來(lái),人工智能數(shù)據(jù)科學(xué)技術(shù)不斷突破與發(fā)展。卷積神經(jīng)網(wǎng)絡(luò)CNN開(kāi)啟了深度學(xué)習(xí)新篇章,推動(dòng)計(jì)算機(jī)視覺(jué)落地自動(dòng)化駕駛等諸多領(lǐng)域;循環(huán)神經(jīng)網(wǎng)絡(luò)RNN推動(dòng)了自然語(yǔ)言處理,使得機(jī)器翻譯、智能語(yǔ)音技術(shù)日趨成熟;深度學(xué)習(xí)之上,強(qiáng)化學(xué)習(xí)圖神經(jīng)網(wǎng)絡(luò)GNN的崛起正在深度賦能數(shù)據(jù)挖掘,將成為企業(yè)場(chǎng)景拓展、數(shù)據(jù)整合、行業(yè)效率飛躍的關(guān)鍵。項(xiàng)目將聚焦強(qiáng)化學(xué)習(xí),特別是圖神經(jīng)網(wǎng)絡(luò)GNN這一構(gòu)筑未來(lái)數(shù)字生態(tài)的核心數(shù)據(jù)科學(xué)技術(shù)。

04
授課教授
Pietro

劍橋大學(xué)University of Cambridge終身正教授

?Pietro導(dǎo)師現(xiàn)任劍橋大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)終身正教授,意大利國(guó)家認(rèn)定Top100科學(xué)家, H-index64,被引用次數(shù)35000+。

?教授2021年連中三篇計(jì)算機(jī)頂會(huì)ICML,其論文還曾發(fā)表在包括世界級(jí)學(xué)術(shù)期刊 《Nature》。

?導(dǎo)師持有歐洲學(xué)習(xí)和智能系統(tǒng)實(shí)驗(yàn)室(Ellis;歐洲大型跨國(guó)人工智能研究所,目前擁有千位全球頂尖計(jì)算機(jī)工程師、數(shù)學(xué)家和其他領(lǐng)域科學(xué)家,旨在重構(gòu)歐洲人工智能前沿研究)席位、劍橋大學(xué)大數(shù)據(jù)研究指導(dǎo)委員會(huì)席位。

?Pietro導(dǎo)師的研究興趣為人工智能圖神經(jīng)網(wǎng)絡(luò)建模,在國(guó)際知名學(xué)術(shù)期刊發(fā)表論文多篇,曾榮獲歐盟委員會(huì)未來(lái)與新興技術(shù)(FET;迄今歐盟規(guī)模最大、資助力度最強(qiáng)的科研資助項(xiàng)目之一)會(huì)展三等獎(jiǎng)。

 

05
你能獲得
  • 7周在線小組科研學(xué)習(xí)+5周不限時(shí)論文指導(dǎo)學(xué)習(xí) 共125課時(shí)

  • 項(xiàng)目報(bào)告

  • 優(yōu)秀學(xué)員獲主導(dǎo)師Reference Letter

  • EI/CPCI/Scopus/ProQuest/Crossref/EBSCO或同等級(jí)別索引國(guó)際會(huì)議全文投遞與發(fā)表指導(dǎo)(可用于申請(qǐng))

  • 結(jié)業(yè)證書

  • 成績(jī)單

 

06
項(xiàng)目大綱
  • 強(qiáng)化學(xué)習(xí):項(xiàng)目將在本周聚焦遺傳算法和強(qiáng)化學(xué)習(xí)框架。Introduction to reinforcement learning

  • 環(huán)境:強(qiáng)化學(xué)習(xí)由智能體和環(huán)境兩部分構(gòu)成。項(xiàng)目將在本周探討離策略、無(wú)模型強(qiáng)化學(xué)習(xí)算法 Q-learning、行動(dòng)者-批評(píng)(actor-critic;AC)模型、馬爾可夫決策過(guò)程等。Environment

  • 優(yōu)化:項(xiàng)目將在本周深入學(xué)習(xí)強(qiáng)化學(xué)習(xí)與優(yōu)化控制。Optimization

  • 集成與控制 Integration and Control

  • 集成:項(xiàng)目將在本周進(jìn)一步探討圖神經(jīng)網(wǎng)絡(luò)(graph neural networks; GNN)、自動(dòng)機(jī)器學(xué)習(xí)(Auto ML)等。Integration

  • 項(xiàng)目回顧與成果展示 Program Review and Presentation

  • 論文輔導(dǎo) Project Deliverables Tutoring

 

開(kāi)課日期:2024-05-11

具體上課時(shí)間、最終時(shí)間安排,均以實(shí)際安排為準(zhǔn)

預(yù)約咨詢

最新項(xiàng)目

計(jì)算機(jī)科學(xué)專題:捕捉、表示并與世界的瞬間互動(dòng),數(shù)字圖形圖像處理方法研究 機(jī)器學(xué)習(xí)與數(shù)據(jù)科學(xué)專題:監(jiān)督式與非監(jiān)督式學(xué)習(xí),基于SVM、K-means等分類與聚類方式的算法研究 生物醫(yī)學(xué)與基因工程:以微生物為例分析轉(zhuǎn)基因與克隆,探究抗生素耐藥性在多物種間的傳播 電子工程專題:以微電網(wǎng)與儲(chǔ)能系統(tǒng)為例,探究電子電力技術(shù)的應(yīng)用革新 開(kāi)課在即!法律經(jīng)濟(jì)學(xué)專題:從現(xiàn)代經(jīng)濟(jì)分析中探尋普通法的原則與案例 如何操控消費(fèi)者的潛意識(shí)?解密“沖動(dòng)消費(fèi)”和“洗腦營(yíng)銷”背后的心理認(rèn)知及購(gòu)物模式研究 土木工程與智能建造專題:人工智能在建筑結(jié)構(gòu)設(shè)計(jì)原理與可靠性分析方面的應(yīng)用 心理學(xué)專題:擺脫共情,重新審視“對(duì)錯(cuò)善惡”——現(xiàn)代科學(xué)中倫理觀念的建立與道德困境研究 2024暑期iHUB·深圳:混合文化背景下世界經(jīng)濟(jì)落后地區(qū)的教育生態(tài)與教育政策對(duì)比研究 心理學(xué)專題:心理學(xué)視角下的“七宗原罪”,認(rèn)知科學(xué)在犯罪動(dòng)機(jī)調(diào)查中的實(shí)際應(yīng)用
  • 幾何留學(xué)公眾號(hào)
  • 幾何留學(xué)APP
  • 幾何留學(xué)APP

    2403個(gè)學(xué)校

    10582個(gè)專業(yè)

    3217個(gè)錄取案例

    8697份錄取報(bào)告