国产在线国偷精品免费看-97久久香蕉国产线看观看-色婷婷亚洲一区二区三区-国产一区二区三区影院

統(tǒng)一認證VPN入口

學(xué)科學(xué)術(shù)

當(dāng)前位置: 長沙理工大學(xué) > 學(xué)科學(xué)術(shù) > 正文

田晗: 基于深度強化學(xué)習(xí)的智能網(wǎng)絡(luò)控制的得失

發(fā)布日期:2025年07月08日  來源:計算機學(xué)院

報告承辦單位:計算機學(xué)院

報告內(nèi)容: 基于深度強化學(xué)習(xí)的智能網(wǎng)絡(luò)控制的得失

報告人姓名:田晗

報告人所在單位:中國科學(xué)技術(shù)大學(xué)

報告人職稱/職務(wù)及學(xué)術(shù)頭銜:特任副研究員

報告時間: 2025年718日周五上午8

報告地點: 金盆嶺校區(qū)9教214

報告簡介:目前,深度強化學(xué)習(xí)(DRL)擅長提供端到端的控制策略解決方案,因此在研究中被應(yīng)用于擁塞控制、流量調(diào)度、自適應(yīng)碼率、負載均衡等網(wǎng)絡(luò)系統(tǒng)的各個子控制任務(wù)當(dāng)中。相比于傳統(tǒng)方法人工對網(wǎng)絡(luò)系統(tǒng)控制策略進行調(diào)試更新,深度強化學(xué)習(xí)的數(shù)據(jù)驅(qū)動的模型更新能力能夠?qū)W(wǎng)絡(luò)系統(tǒng)快速迭代,從而能夠快速的適應(yīng)新的網(wǎng)絡(luò)基礎(chǔ)設(shè)施、拓撲和網(wǎng)絡(luò)應(yīng)用需求。然而,AI模型并非靈丹妙藥。我們在實踐將深度強化學(xué)習(xí)運用在網(wǎng)絡(luò)控制任務(wù)當(dāng)中,遇到了很多困難與挑戰(zhàn):訓(xùn)練仿真環(huán)境的保真度有限;無法保證某些特殊性質(zhì)(如公平性);難以滿足高頻控制任務(wù)對低延時和低系統(tǒng)開銷的要求;以及在未知網(wǎng)絡(luò)環(huán)境下模型泛化能力下降等。在本次報告中,我們將以基于DRL的擁塞控制策略為例,介紹我們在研究過程中所面臨的上述問題及提出的一系列的解決方案,從而拋磚引玉,為準(zhǔn)備和正在將AI方案引入網(wǎng)絡(luò)任務(wù)當(dāng)中的研究者和網(wǎng)絡(luò)工作者們提供一些啟發(fā)。

報告人簡介: 田晗, 中國科學(xué)技術(shù)大學(xué)計算機科學(xué)與技術(shù)學(xué)院特任副研究員。本科畢業(yè)于北京航空航天大學(xué),碩士畢業(yè)于中山大學(xué),博士畢業(yè)于香港科技大學(xué)iSING智能網(wǎng)絡(luò)實驗室。主要研究方向包括智能網(wǎng)絡(luò)系統(tǒng)、機器學(xué)習(xí)系統(tǒng)、隱私計算等。近年來在網(wǎng)絡(luò)系統(tǒng)、人工智能與隱私計算等領(lǐng)域的重要國際學(xué)術(shù)期刊及會議發(fā)表論文數(shù)十篇,其中包括USENIX NSDI, USENIX OSDI, IEEE S&P, Eurosys, CoNEXT, IEEE Transactions on Networking等國際頂尖學(xué)術(shù)會議和期刊。擔(dān)任CoNEXT, ChinaSys等執(zhí)行委員會委員,頂級網(wǎng)絡(luò)學(xué)術(shù)期刊TON、TMC等審稿人。