行業洞見

行有(yǒu)疆 思無界

CinLearn前瞻視角 與你同享

李玉箫:打開深度學(xué)習黑盒,進一步理(lǐ)解AI

深度學(xué)習發展至今,帶來了人工(gōng)智能(néng)(AI)的發展熱潮。現實情況是由于核心AI算法,尤其是深度學(xué)習算法,通常運行在類似于“黑盒”中(zhōng)的工(gōng)作(zuò)模式下,使得AI在高效高性能(néng)的同時,相應的可(kě)解釋性很(hěn)難得到同等保證。
 
本期馬德(dé)裏歐洲大學(xué)(UEM)計算機公(gōng)開課的分(fēn)享主題為(wèi)《深度變分(fēn)推斷框架下的無線(xiàn)感知與AI可(kě)解釋性》,分(fēn)享嘉賓李玉箫為(wèi)清華大學(xué)電(diàn)子工(gōng)程系的在讀博士,研究方向為(wèi)深度變分(fēn)推斷理(lǐ)論和算法框架,針對包含複雜分(fēn)布的推斷問題,結合深度學(xué)習和變分(fēn)推斷方法,設計新(xīn)的算法方案,主要應用(yòng)于5G、6G的無線(xiàn)感知技(jì )術以及AI的可(kě)解釋性。

 

李玉箫介紹

 

· 清華大學(xué)電(diàn)子系信息與通信工(gōng)程方向博士在讀

· 目前在巴斯克應用(yòng)數學(xué)研究所訪學(xué)

· 發表過十餘篇所在領域頂刊頂會文(wén)章

· 國(guó)内外多(duō)個大廠、研究組織實習經曆

 
李老師将從自己博士論文(wén)的研究課題入手,聯系行業火爆的ChatGPT,帶領我們探索深度學(xué)習的黑盒。以下為(wèi)李老師的講述——
 
 
01
 
深度學(xué)習的背景知識——統計推斷
 
 
計算機專業會較多(duō)接觸概率論與數理(lǐ)統計,其中(zhōng)貝葉斯推斷由來已久。它能(néng)做很(hěn)多(duō)預測問題,比如說天氣預測,是否下雨、濕度溫度等;學(xué)術一點的,可(kě)以進行基因癌症的診斷。
 
同時,傳統推斷也面臨着現代挑戰。伯努利分(fēn)布是機器學(xué)習中(zhōng)的常用(yòng)分(fēn)布,比如說我擲一個硬币,正反面的概率都是二分(fēn)之一,該随機變量滿足伯努利分(fēn)布。目前更為(wèi)複雜的問題是,深度學(xué)習涉及圖像、音視頻等信息,那傳統的高斯分(fēn)布或伯努利分(fēn)布這些簡單的參數化分(fēn)布,就不易解釋,即難解分(fēn)布( intractable distributions)。

 

主要有(yǒu)以下三種表現:
 
一是隐式分(fēn)布具(jù)有(yǒu)難解分(fēn)布。就無線(xiàn)感知應用(yòng)而言,室外容易定位,能(néng)測出距離;室内由于多(duō)徑效應影響,有(yǒu)桌子等障礙物(wù)的反射波,就不易觀測。
    
二是目标變量具(jù)有(yǒu)難解分(fēn)布。就無線(xiàn)感知而言,例如環境分(fēn)析就是這樣一個問題,比如我站在畫廊,想知道自己的周圍環境,譬如障礙物(wù)、房間結構,這時環境變量的分(fēn)布是難解的,無法像距離一樣去物(wù)理(lǐ)定義。 
  
三是隐變量具(jù)有(yǒu)相互依賴關系。例如無線(xiàn)感知中(zhōng)的多(duō)智能(néng)體(tǐ)協作(zuò)定位,多(duō)個智能(néng)體(tǐ)提供的信号之間俱有(yǒu)耦合關系,對于推理(lǐ)結果有(yǒu)影響,可(kě)以做更複雜的圖推理(lǐ)。
 
 

02

 
無線(xiàn)感知與AI可(kě)解釋性
 
 

結合深度學(xué)習的數據知識,以及傳統推斷的模型知識,讓我們可(kě)以解讀複雜信息。舉個例子:

 

問:“我到最近柱子的距離是多(duō)少?”那麽,傳統統計推斷的物(wù)理(lǐ)模型就可(kě)以解讀,通過識别波峰,用(yòng)電(diàn)磁波的傳播速度乘以時間就能(néng)知道距離;

 

如果問:“這幅圖的場景有(yǒu)哪些?”圖像信号是隐式的,無法建模,無法多(duō)步推理(lǐ),這時通過深度學(xué)習可(kě)以解出;

 
又(yòu)問:“如何判斷我的位置和周圍環境的關系?” 這時候需要分(fēn)析多(duō)徑信号與複雜場景的關系,用(yòng)到統計推斷和深度學(xué)習,破解位置和場景的關系。
 

我的研究領域側重無線(xiàn)感知,在對環境感知後,結合各類其他(tā)技(jì )術,如AI進行後續的處理(lǐ),實現對物(wù)理(lǐ)環境的重建,對環境進行分(fēn)析,對環境中(zhōng)的人與物(wù)進行識别、分(fēn)析,觸發後續的動作(zuò)等。

 
 
03
 
深度變分(fēn)推斷框架是什麽?
 
 

談及深度變分(fēn)推斷框架(Deep Variational Inference Framework),主要分(fēn)為(wèi)三類。

 

第一類是易解概率(Tractable Likelihood)和獨立潛在變量( Independent Latent Variables) 。比如說盲圖像超分(fēn)(Blind Image Super-resolution),旨在對未知退化類型的低分(fēn)辨率圖像進行超分(fēn)增強,由于其對于實際應用(yòng)的重要促進作(zuò)用(yòng)而受到越來越多(duō)的關注。主要分(fēn)為(wèi)顯示建模(Explicit Modelling)和隐式建模(Implicit Modelling)兩類方法,目前最新(xīn)的方法BSRGAN,通過對多(duō)種模糊核、下采樣、噪聲退化進行随機置換,在不同類型真實退化數據上取得了非常好的效果。 

 
第二類是難解概率(Intractable Likelihood)和獨立潛在變量( Independent Latent Variables) 。傳統方法隻能(néng)做距離估計,通過網格和深度學(xué)習,可(kě)以把環境變量做一個二維顯示,即信号樣本點,随着訓練的進行,點會做相應變化。
 
第三點是獨立潛在變量( Independent Latent Variables) 。比如傳統定位每一個點都有(yǒu)一個波形,然後三點畫圓,推測位置。現在我想通過圖推理(lǐ),輸入一個有(yǒu)連接關系的圖,再直接通過深度學(xué)習網絡,推出圖模型。損失函數,由統一模型推出來。  
 
 

04

 
為(wèi)什麽ChatGPT能(néng)脫穎而出?
 
 

剛剛我是從無線(xiàn)通信的角度探讨深度學(xué)習,能(néng)為(wèi)傳統的統計推斷框架做什麽。接下來我們反其道行之,讨論統計推斷可(kě)以為(wèi)深度學(xué)習提供什麽靈感,聯系ChatGPT和大語言模型,來談一談。

 

統計階段能(néng)為(wèi)深度學(xué)習做什麽?深度學(xué)習本身,比如說大語言模型,它需要加入第一性原理(lǐ),加入經典的推斷算法嗎?我認為(wèi)是需要的。

目前的大語言模型主要基于2017年提出的Transformer架構搭建,算法本質(zhì)上沒怎麽變,區(qū)别在于框架和訓練方法。它面向的任務(wù)是機器翻譯,當然現在也有(yǒu)一些圖像,還有(yǒu)強化學(xué)習方面的研究。大語言模型分(fēn)為(wèi)三類:Encoder-Decoder、Encoder-only、Decoder-only(主流大模型)。ChatGPT4就屬于Decoder-only。
 

ChatGPT4脫穎而出主要源于指令微調(Instruction Tuning),在多(duō)個以Instruction為(wèi)指導的大量任務(wù)進行學(xué)習,讓模型在理(lǐ)解這些具(jù)體(tǐ)的指令後給出答(dá)案。

 

ChatGPT4的升級之處在于,不用(yòng)GPT3.5的反饋獎勵模型,而采用(yòng)句式獎勵模型GPT4。這也和我的研究聯系起來,我會認為(wèi)把模型知識加進去,比添加新(xīn)的網絡結構去誘導網絡更有(yǒu)用(yòng)、更安(ān)全以及更具(jù)可(kě)解釋性。

 
 

05

 
互動答(dá)疑
 
 

UEM:請問李老師,如何将深度學(xué)習應用(yòng)于不同的領域?

 

李玉箫:理(lǐ)論領域,目前深度學(xué)習應用(yòng)比較好的是圖像和自然語言。再比如帶編碼的信息信号,機器學(xué)習其實很(hěn)容易在數據集上過拟合,因為(wèi)自然信号它本身就沒有(yǒu)很(hěn)好的數學(xué)模型。但是在傳統的,比如腦電(diàn)信号,還有(yǒu)人體(tǐ)的物(wù)理(lǐ)信号,包括我研究的無線(xiàn)信号,UWB、Wi-Fi、藍牙這種情況下,機器學(xué)習現在必須基于傳統的方法做一些增益,因為(wèi)它無法直接使用(yòng)。

 
然後從更廣義的應用(yòng)層面。我會覺得比如醫(yī)療保健,我們可(kě)以用(yòng)醫(yī)學(xué)圖像分(fēn)析疾病診斷、藥物(wù)發現或者基因學(xué)研究,來提高醫(yī)療保健的準确性和效率;金融服務(wù)領域,可(kě)以做一些風險評估、投資管理(lǐ);交通運輸領域,比如智能(néng)交通、自動駕駛、交通流量預測;制造業領域,比如智能(néng)制造、質(zhì)量控制,包括能(néng)源維護或者開采方面。
 

UEM:未來想進入科(kē)技(jì )大廠,學(xué)習哪些領域能(néng)幫助我更好地實現職業發展目标? 

 

李玉箫:依據我所了解的情況,如果是博士的話,可(kě)能(néng)更看重方向一點,但有(yǒu)時候需要看是否契合具(jù)體(tǐ)的某一個部門的業務(wù)方向。就這幾年而言,5G、無線(xiàn)通信、物(wù)聯網這一塊比較火,但這一塊科(kē)研界也還比較欠缺。智能(néng)駕駛這幾年挺波動的,企業開的薪酬高,需承擔一定風險。

 

另外的話,圖像自然語言這一塊,一個是純的AI賽道,譬如圖像、音視頻、自然語言處理(lǐ)等任務(wù),薪酬高,競争也非常激烈。但是如果拿(ná)自然語言去做一些别的事情,比如說醫(yī)療、風險評估、城市規劃,那這些完全可(kě)以應對,市場也有(yǒu)很(hěn)大的需求。

  
——
 
最後,李老師提到:“對于純AI 研究,我很(hěn)感興趣AI在推理(lǐ)和擴展性方面的理(lǐ)論研究,它們有(yǒu)助于幫我們界定深度學(xué)習的适用(yòng)範圍和潛在風險。”
 

當一個深度學(xué)習網絡可(kě)以識别公(gōng)園中(zhōng)的一隻小(xiǎo)狗,我們并不知道這個學(xué)習系統到底是聚焦在環境中(zhōng)狗的尾巴上,還是狗所在的草(cǎo)坪。如果機器學(xué)習具(jù)備舉一反三、觸類旁通的能(néng)力,相信AI的可(kě)解釋性會大大增強。

 

感謝(xiè)李老師的精(jīng)彩分(fēn)享,讓我們得以窺探AI深度學(xué)習的黑盒子!也歡迎你申請馬德(dé)裏歐洲大學(xué)的計算機科(kē)學(xué)與管理(lǐ)碩士,在職學(xué)習,斬獲前沿的計算機知識。

 
 
關于【馬德(dé)裏歐洲大學(xué)】的碩士專業,如果您想了解更多(duō)信息。歡迎關注我們的官方公(gōng)衆号【UEM Online】,在公(gōng)衆号菜單欄的“課程選擇”中(zhōng)獲取。
 
撰文(wén) | Anna Wei
編輯 | Anna Wei

關閉