該系列是由亞利桑那州大學(xué)(ASU)和中(zhōng)國(guó)官方授權合作(zuò)夥伴職學(xué)CinLearn攜手推出的中(zhōng)文(wén)公(gōng)開課系列。每一期公(gōng)開課将邀請領導與管理(lǐ)碩士、心理(lǐ)學(xué)碩士、計算機與科(kē)技(jì )工(gōng)程碩士和教育學(xué)碩士的授課老師,為(wèi)學(xué)生們帶來精(jīng)彩分(fēn)享。
大數據是AI時代的基石。據前瞻産(chǎn)業研究院報告數據顯示,2020年全球人工(gōng)智能(néng)(AI)市場規模達2萬億美元,預計到2030年将達15.7萬億美元。不難預見,未來幾年必定是大數據和AI雙向繁榮、雙向促進的時代。
本期ASU公(gōng)開課,特邀Ira A.富爾頓工(gōng)程學(xué)院陳以農教授傾情呈現。陳教授圍繞《大數據和AI前沿領域的課程概述》,生動地為(wèi)我們講述了關于大數據和AI的方方面面。
△ 陳以農教授 / 圖源ASU
陳以農教授(Prof.Yinong Chen)簡介:
· Ira A. 富爾頓工(gōng)程學(xué)院教學(xué)教授、博士生導師
· 物(wù)聯網與機器人教育實驗室主任
· 中(zhōng)文(wén)計算機與科(kē)技(jì )工(gōng)程碩士項目教學(xué)主任(Faculty Directo)
以下為(wèi)陳教授的講述——
人工(gōng)智能(néng)領域簡介
1.1前沿計算技(jì )術——從一張圖,讀懂AI發展史
我們的前沿技(jì )術,最早從互聯網開始,之後我們把互聯網變成了計算平台。在服務(wù)器與計算層面,我們進一步發展了雲計算、大數據。
△ 圖源陳以農教授
形成了比較成熟的大數據算法和平台之後,20世紀50年代我們迎來了第一代人工(gōng)智能(néng),80年代是第二代人工(gōng)智能(néng),今天的數字人工(gōng)智能(néng),是第三代人工(gōng)智能(néng),基于大數據分(fēn)析而非人腦模拟。在此基礎上,我們進入了實體(tǐ)人工(gōng)智能(néng)階段,即不僅限于數字平台,而是走向實體(tǐ),走向生活,走向社會。
再進一步的增強智能(néng)階段,我們稱之為(wèi)“互聯網+”;另一方面,互聯網也在向下發展為(wèi)物(wù)聯網。
圍繞計算和技(jì )術,我們開發各種各樣的應用(yòng)領域,比如電(diàn)信工(gōng)業、鍾表工(gōng)業、汽車(chē)工(gōng)業等都在智能(néng)化、電(diàn)子化。這就是今天我們信息技(jì )術所涉及的各個領域,美國(guó)75%以上的經濟增長(cháng)都源于此。
1.2機器學(xué)習與人工(gōng)智能(néng)——ChatGPT的劃時代意義
我們剛才講到的數字人工(gōng)智能(néng)、實體(tǐ)人工(gōng)智能(néng)和增強人工(gōng)智能(néng),反映出我們今天所說的人工(gōng)智能(néng)和機器人技(jì )術領域.
△ 圖源陳以農教授
第一層的兩個領域雖然不同,但幾乎相互覆蓋;第二層包括機器學(xué)習、專家系統、自然語言處理(lǐ)(NLP)等;到第三層,機器學(xué)習包含深度學(xué)習、監督學(xué)習和無監督學(xué)習等。初級的人機對話很(hěn)早就已出現,但幾個月前的ChatGPT,遠(yuǎn)遠(yuǎn)超越我們任何一個人的知識和智能(néng),這就是在自然語言的處理(lǐ)之上,增加了機器學(xué)習。ChatGPT經過十多(duō)年的深度學(xué)習、監督學(xué)習和無監督學(xué)習之後,還将繼續發展下去。
我們今天的機器學(xué)習是基于大數據,并通過各種平台、設備來收集數據,選擇目标數據為(wèi)我所用(yòng)。通過将數據進行預處理(lǐ),把它轉換成鍵值對(key-value pair),之後進行數據挖掘、機器學(xué)習、構建模型。
大家注意到,這和我們第一代的人工(gōng)智能(néng)模型完全不一樣。第一代、第二代是試圖先找到模型,再通過模型進行預測;現在是通過對數據的大量分(fēn)析反推模型,用(yòng)機器學(xué)習的算法來學(xué)習模型。因為(wèi)我們人腦的模型實在太複雜,再經過幾十年,上百年也不一定能(néng)真正模拟人腦。
我們最後找到的模型,不一定真正就是我們大腦的思維模型,而是能(néng)夠反映我們所有(yǒu)收集數據的模型,然後再用(yòng)這樣的模型對我們新(xīn)錄入的數據進行測試,這就是機器學(xué)習。
還有(yǒu)就是增強學(xué)習。模型是一個不斷改進的過程,就像新(xīn)一代ChatGPT4或5,一邊讓用(yòng)戶使用(yòng),一邊通過用(yòng)戶搜集新(xīn)數據,自我叠代。
1.3從大數據到智能(néng)決策——AI可(kě)以幫助人,但無法替代人
今天我們從數據收集、數據預處理(lǐ),來尋找模型、建立模型;通過機器學(xué)習,分(fēn)類和回歸;然後我們會建立知識本體(tǐ),并把知識和模型進行整合以及數據處理(lǐ)。
△ 圖源陳以農教授
但并不是所有(yǒu)的人工(gōng)智都是自主決策,因此我們往往還需要人來做決策,比如醫(yī)生用(yòng)人工(gōng)智能(néng)來輔助診斷,顯然醫(yī)生不可(kě)能(néng)記住或見過所有(yǒu)的病例。如果我們擁有(yǒu)醫(yī)生使用(yòng)的藥物(wù)、病人測試的結果,最終治療的效果等大數據,就能(néng)夠調用(yòng)出來幫助我們訓練模型,對新(xīn)病人的情況給出建議。
整個過程,我們還是需要醫(yī)生來最終決策。我們不可(kě)能(néng)把大量數據給醫(yī)生,需要用(yòng)一種可(kě)視化的方法,讓醫(yī)生能(néng)夠理(lǐ)解人工(gōng)智能(néng)大數據的決策。這就是從大數據到智能(néng)決策的完整過程。
這些成果和計算平台是分(fēn)不開的。進行實時的大數據處理(lǐ),需要超級計算機,不是簡單的快,而是有(yǒu)針對性地進行軟件硬件共同設計,以更匹配人工(gōng)智能(néng)的機器學(xué)習。
1.4量子計算與量子機器學(xué)習——發展前景廣闊
這就要講到雲計算這個虛拟平台,它能(néng)夠提供從理(lǐ)論上無限的計算能(néng)力,還有(yǒu)一個方向是量子計算,他(tā)們的計算能(néng)力是線(xiàn)性增長(cháng),需要處理(lǐ)的數據量是指數級增長(cháng)。我們要讓計算能(néng)力匹配數據增長(cháng),就需要找出新(xīn)的計算模式。
△ 圖源陳以農教授
其實,上世紀50年代,物(wù)理(lǐ)學(xué)家Richard Feynman就提出了量子計算機的概念,經過一代代到了超大規模集成電(diàn)路。雖然主流的電(diàn)子計算機一直在發展,但是我們一直在尋找新(xīn)的計算模型,真正有(yǒu)希望取代電(diàn)子計算機的就是量子計算機。
量子計算涉及到量子比特(位),它具(jù)有(yǒu)超級位置和量子糾纏兩大屬性。
相比數字位(Bits),量子位(Qubits)可(kě)以是0和1的超級位置。數字計算,是用(yòng)确定性的數字去模拟一個不确定的結果;量子計算,算出來的是一個概率,比如推算面前的物(wù)體(tǐ)99%是輛車(chē)。
量子糾纏的特性更加神奇。如測量了孿生對的第一個量子位,則立即知道第二個量子位的值。量子計算的超級力量來自超級位置和糾纏。
這個非常關鍵,我剛才提到我們今天數據量的增長(cháng)就是指數增長(cháng),将來要能(néng)夠真正駕馭數據增長(cháng),計算機最終需要實現量子計算。它可(kě)以用(yòng)在需要超計算能(néng)力的地方:
實現更快的機器學(xué)習。如滿足ChatGPT對指數級數據的需求,讓機器學(xué)習更快完成訓練。
打破當前的安(ān)全系統。比如網絡安(ān)全、操作(zuò)系統安(ān)全、軟件安(ān)全的複雜算法,電(diàn)子計算機可(kě)能(néng)需要上百年才能(néng)破解。一旦量子計算出現,以前所有(yǒu)為(wèi)數字計算設計的安(ān)全系統就可(kě)能(néng)被打破。美國(guó)已經開始布局要對所有(yǒu)的安(ān)全系統進行重新(xīn)評估和升級。
設計與發現新(xīn)藥物(wù)。量子計算能(néng)夠更快、更好地幫助我們設計出新(xīn)藥物(wù)。還有(yǒu)金融、股市、保險等領域,其實都需要超級計算。
前一段時間我參加國(guó)際會議,未來量子計算機可(kě)以用(yòng)于優化通訊網絡。比如航空領域用(yòng)量子計算來做通訊系統,可(kě)以讓超音速飛機,在天空與地面保持實時通訊。通常要保持實時通訊,會有(yǒu)五六秒(miǎo)的時間差,量子計算極大地提升了飛機對障礙物(wù)等風險的預判能(néng)力。
ASU現在已經在研究用(yòng)量子位搭建機器學(xué)習的模型。希望在若幹年後,我們的量子機器學(xué)習能(néng)夠趕超機器學(xué)習。
FSE598《前沿計算技(jì )術》,會覆蓋旗艦課CSE571《人工(gōng)智能(néng)》。因為(wèi)所有(yǒu)大數據、人工(gōng)智能(néng)都是基于算法,所以需要很(hěn)強的算法基礎,CSE551講得就是《算法基礎》。而《軟件驗證、确認和測試》,會教你學(xué)習軟件開發。
由于面向職場人士,我們特地開發了《技(jì )術創業》課程。《高級計算機網絡》會講到互聯網及各種計算機網絡,還有(yǒu)《雲計算》、《數據可(kě)視化》等課程。其中(zhōng),《社交媒體(tǐ)挖掘基礎》由我們的董事教授劉歡來講,在ASU隻有(yǒu)不到3%的老師獲此殊榮。
大數據與人工(gōng)智能(néng)在工(gōng)業界的應用(yòng)
大數據和人工(gōng)智能(néng)最早用(yòng)于銀行和證券,也是最為(wèi)廣泛的應用(yòng),目前形成了Top10應用(yòng)領域:
1. 銀行和證券
2. 通訊媒體(tǐ)和娛樂
3. 醫(yī)療保健機構
4. 教育
5. 制造和自然資源
6. 政府
7. 保險
8. 零售和批發貿易
9. 運輸
10. 能(néng)源和公(gōng)共事業
教育行業,如ASU是美國(guó)最大的公(gōng)立大學(xué),線(xiàn)上線(xiàn)下學(xué)生共13.5萬,會經常用(yòng)到大數據和人工(gōng)智能(néng)。
U.S.News發布《100 Best Jobs US News2021》排名(míng)顯示,在前12名(míng)中(zhōng),信息相關的工(gōng)作(zuò)收入是醫(yī)療工(gōng)作(zuò)的1.39倍。大流行病過去後,《100 Best Jobs US News2023》發布的數據顯示,軟件開發重回Top1,Top5是信息安(ān)全分(fēn)析師,Top8是信息經理(lǐ),Top9是網頁(yè)設計,前12名(míng)中(zhōng),信息相關的工(gōng)作(zuò)收入增為(wèi)醫(yī)療工(gōng)作(zuò)的1.53倍。
△ 圖源陳以農教授
Q&A互動答(dá)疑
ASU:我本科(kē)是計算機相關,碩士課程對于我們的難易度怎麽樣?
陳以農:我們課程的難度是按照研究生的課程來設計的,相比你是不是計算機專業,會更加注重你是否有(yǒu)數學(xué)基礎。我們會講授數據結構算法、程序設計語言等計算機行業方面的主要内容,如果你有(yǒu)數學(xué)基礎,那麽這個課程不會太難。
那麽會不會太簡單呢(ne)?中(zhōng)文(wén)課程是按照ASU英文(wén)課程設計的,學(xué)生需要在本科(kē)基礎之上才能(néng)學(xué)習,不會太難,也不會太簡單,你一定會學(xué)到很(hěn)多(duō)新(xīn)的東西。我要強調的是ASU非常注重創新(xīn),我們的課程不隻是理(lǐ)論概念,而是需要學(xué)生動手編程實踐。
ASU:中(zhōng)文(wén)碩士課程和英文(wén)碩士課程會不會有(yǒu)很(hěn)大的差别,大概什麽樣的差别?
陳以農:我們有(yǒu)2種方式。一種是直接把英文(wén)老師的課翻譯成中(zhōng)文(wén),大概有(yǒu)4門課是這樣;一種是直接請會講中(zhōng)文(wén)的老師,讓他(tā)用(yòng)中(zhōng)文(wén)把課再講一遍。在ASU中(zhōng)英文(wén)的課程可(kě)以相互轉換。FSE598算是例外,是我直接用(yòng)中(zhōng)文(wén)講的,主要針對非計算機的理(lǐ)工(gōng)科(kē)學(xué)生。在線(xiàn)英文(wén)課程的很(hěn)多(duō)學(xué)生也是相似的背景,負責英文(wén)招生的老師,邀請我把課程用(yòng)英文(wén)再講一遍。
感謝(xiè)陳教授深入淺出的講解,将計算機理(lǐ)論與實際應用(yòng)結合起來,抽絲剝繭,層層深入,讓我們對大數據和AI前沿領域方面的知識獲益匪淺。
關閉