物理、AI,以及科學發現的未來

從左至右:Evgeni Gousev、Jesse Thaler、Valerie Browning、Walter Copan 與 主持人France Córdova。
人工智慧與物理學正在改變彼此,影響從課堂延伸到恆星,也見於學術界與產業、國防安全、補助與管理等。
今年稍早的時候,學術界、政府部門及產業界的頂尖物理學家齊聚一堂,在一個座談會上分享他們對機器學習與生成式AI (generative AI)改變科學發現、創造力、智慧財產權、訓練、溝通與勞動力部分的希望。這個活動由美國物理協會(AIP)基金會召開,2024年4月11日於華盛頓DC的美國物理中心舉行,前NSF主任France Córdova擔任主席(AIP基金會隸屬美國物理協會的一部分,Physics Today便是由美國物理協會發行),她指出,AI徹底改變了科學許多面向:「人工智慧無所不在、無處不在、無時不在,就像一個狡猾或是令人擔憂的幽靈,取決於你的觀點。」
以下文字是從會議紀錄的改編及濃縮。
Córdova:「AI是如何改變物理學研究呢?是它加速了科學發現,或是催動漸進式的進展呢?」
Jesse Thaler (MIT與NSF) : 「我在2016年人們談論深度學習革命時,是持懷疑態度的,我是一名理論物理學家,所以我用我的粉筆與黑板進行”深度思考”。從那時我意識到,經過時間考驗的物理之策略如何能跟處理大型數據集的機器學習策略相結合,造就許多進展。
這只是我們研究所的三個實例:我們想要去了解強核力,為此,美國所有的超級計算開放資源有10% 現在投入求解格點量子色動力學的方程式,它描述強作用力,其將夸克與膠子束縛而成質子與中子,接著形成核子。我的一些同事正利用一種生成式AI來做氫與氦的第一原理計算,並遵照元素週期表前進。
微中子物理是美國正在投資的另一個戰略領域。一項正在進行的實驗,將微中子束從費米實驗室發送到南達科他州的一個礦區(參閱Anne Heavey於Physics Today的文章,2022年7月號第46頁)(註:此文翻譯亦刊在物理雙月刊https://pb.ps-taiwan.org/modules/news/article.php?storyid=861),這個偵測器仰賴液態氬時間投影室(time-projection chambers,一種利用設定電場分布讓粒子通過液態氬時產生訊號的偵測器)精確獲取有關微中子的資訊,我們沒有AI就無法處理這些複雜的數據,也無法可靠地重建微中子事件。
這兩者都是AI影響物理研究的例子,但物理學家如何能影響AI研究呢?我喜歡”grokking”的例子,這是指一個機器學習演算法不停的跑而沒學會,然後突然間頓悟了,對物理學家來說,這種突然的變化是一種相變,而確實,grokking中發生的是資訊”氣體”突然結晶成為知識,晶格結構出現在學習結構的潛藏空間裡,物理學家對於了解這個過程有獨特的優勢。
當我的年輕同事把我拖進這個我一開始不相信的世界愈來愈深時,我是拼了老命堅持著。2016年,兩位研究生給我看他們的機器學習論文,它和我的工作直接競爭,我辛辛苦苦的去做量子場論計算,而他們在這裡用了些神經網路。我告訴他們論文中的所有錯誤:『這無法解釋,你沒有不確定性(uncertainties),你不了解牽涉到的概念!』我認為他們會改找其他人當指導教授,但結果反而是他們的論文基本上解決了我所有的顧慮。
這個經驗告訴我,我們不應該只是把AI從架子上拿下來照搬照做,為使這些方法適用於物理學,我們需要納入所有我們在追求科學發現之高標準時通常會做的事。
Walter Copan (科羅拉多礦業學院):「我認為,人工智慧與物理學研究並存的方式太多了。
就拿大型物理實驗的硬體來說,AI控制系統正使得過去需要研究生花費數月的架設成為可能,像是在非常複雜的光學系統上控制精密的雷射實驗,或是如何去設計粒子束與粒子加速器,來傳送完全所要的所需能量分布的需求。
系外行星是另一個很好的例子。目前為止找到的5000顆行星當中,有許多顆是由AI發現與驗證。系外行星的發現一般是由於行星繞行恆星時,恆星訊號強度發生變化,人工智慧絕對是適合這種即時的圖形辨識現象。
確實,AI圖形辨識可以加速任何牽涉到大量數據的物理研究及發現過程,像是在大型強子對撞機(LHC),或是我們預期的Brookhaven國家實驗室的電子離子對撞機。」
Valerie Browning (Lockheed Martinc公司):「現在有了大型語言模型(large language models,LLM)和生成式AI,人工智慧正從一個非常有價值的計算工具發展成更像一位合作者,這將進一步加速科學發現。幾個領域確實大有可為:量子計算與機器學習的交集、新的再生能源系統材料的發現,以及物理訊息神經網路(physics-informed neural networks,PINN)與機器學習的連結。」
Córdova: 「那業界的觀點是什麼呢?」
Evgeni Gousev (高通公司與TinyML基金會):「在矽谷,我們開發領先的AI技術,包括硬體與軟體,即用於科學研究的所有工具。但以發展來說,AI還在學步的階段,你可以用大約10小時教會一個青少年開車,但我們在自動駕駛上已經花費數十億美元及超過10年的時間,它還沒有實現。AI技術仍是非常初期,檯面下它運算一些基本的機率方程式,進行矩陣乘法,這種單憑蠻力方式是不能持續的。
這是物理學家可以增加價值的地方,我們被訓練去解決問題並將經驗連結起來,我們有大好機會能幫助AI變得更可解釋(explainable)、更合理(reasonable)、更可信賴(reliable)及更有可擴展性(scalable)。」
Córdova:「研究上有風險嗎?」
Browning:「AI並不否定審慎行為(due diligence)和科學方法的需要。當你要嘗試要把事情付諸行動時,風險就來了,利用AI與機器學習工具發展出來的模型或見解可能是在某些狀態或限制下有效,當這些條件沒進入到設計流程時,就會有風險。
在航空與國防領域裡,一個錯誤就能造成生命威脅,因此我們做的許多事都是帶入工程的嚴謹性。當你嘗試去預測所有的極端案例(罕見事件),它們可能發生在非常變動且可能資源有限的環境時,評估、確認與驗證是一項挑戰。」
Copan:「風險是個『信任,但也要查證』的過程。再拿AI與系外行星來說明,這發現過程的正確度超過96%,未預測到和出現誤報的地方,我們可以從中吸取經驗教訓。
NIST在可信賴AI的標準上具有關鍵作用,對於一系列應用,擁有一個測試平台非常重要,這裡可以驗證人工智慧的協定,並能獨立驗證其準確性。」
Córdova:「AI是如何改變教育呢?」
Thaler:「我們校園裡分為兩派人,一派是AI狂熱者,一派是頭埋進沙子裡的鴕鳥,說AI跟他們無關。不過,如果我們沒有把這些工具帶進教室,那麼我們基本上沒有做到身為老師的教學職責。
而一旦你強迫學生們去使用生成式AI,它的確改變你需要紙筆作答的考試型態。如今,學生可以利用ChatGPT風格的機器人來回答一個,像是如何去跑處理雷射干涉重力波天文台(LIGO)數據的程式碼的問題,聊天機器人甚至可以產生範例程式碼。我的MIT同事開發了一個關於科學工作流程的聊天機器人,它是個驚人的學習資源,學生甚至不知道如何提問,也能與聊天機器人互動來找出埋藏在技術文獻中的答案。」
Copan:「人工智慧和機器學習現在是科學研究的基本工具,讓學生能掌握AI是很重要的,他們將透過AI來推動物理的發展,反之亦然。」
Córdova:「AI改變了科學溝通嗎?」
Thaler:「在這裡,可能性是以一種令人驚訝的方式成長,就如同我從針對我的愚人節玩笑”ChatJesseT”中發現。它是一個聊天機器人,知道我所有的論文、維基百科條目及網頁。ChatJesseT非常熱情地談論物理與AI,是我在MIT的學生與博士後研究員利用檢索增強生成(retrieval-augmented generation,RAG)從信任的語料庫中取出,再加上一些提示工程(prompt engineering)建構了它。這啟發我們以歐本海默的所有論文來訓練它,它可以給出有關技術概念(像是波恩-歐本海默近似)的答案,也可以回答社會與物理交集的問題
我們發現”Open-AI-mer” 機器人可以和大眾就AI的前景與危險性展開對話,劍橋科學節(Cambridge Science Festival)的訪客非常有興致去和”Open-AI-mer”交談,然後詢問站在一旁的物理學家,機器人的回應是虛幻還是真實。
我曾經帶著老頑固的帽子,認為我們永遠無法使用語言模型做科學上的發現,因為物理的語言是方程式。我開始理解到,大量的數據都是文字形式,譬如說,一位高中生和一位博士後研究員將AI與哈伯影像資料庫結合使用――它擁有哈伯太空望遠鏡的影像,及用來證明望遠鏡時間合理性的提案,他們將文字數據與影像數據放在一起,創造一個與科學數據集互動的新方式。
我們物理學家正意識到(也許令我們懊惱),這個語言事實上是個強大的溝通方式,生成式AI能集結技術專家與大眾,創造更多的交流機會。
更棒的是,我們可以客製化自己的聊天機器人(叫ChatFrance、ChatWalt,如果你願意的話)來滿足我們的需求。我太太是個律師,她的提示工程版本就是以對她的專業有用的格式來回應某些類型的法律問題。即使我們沒有寫程式方面的專業,也能編寫這種工具做各種任務,否則工作會非常繁重。」
Córdova:「什麼是政府補助單位的關鍵政策考量?」
Browning:「國防高等研究計畫署(Defense Advanced Research Projects Agency,DARPA)投入研發的約40億美元經費中,有大約70%是用於AI的應用或發展。」
Copan:「我們看到在AI聯邦科學與技術的投資已有了革命性的轉變,而政策和規章自然地需要時間來跟上科學發現與技術的規模與腳步。現在,美國想要成為全球人工智慧的領頭羊,一些局處會開始質疑研究人員使用AI取得成果,不是以經濟效益並最後發展可用於其他用途的可擴充模型的方式。很顯然,所有科學單位都會因為需要用科學過程來驗證模型,而機會受到影響。
不過美國能在多大程度利用人工智慧作為經濟效率的力量倍增器(force multiplier)、推動者(enabler)及驅動者(driver),同時也是個勞動力問題。科學產業無論現在還是未來,內外人力都存在需要填補的缺口,這些都會有政策影響。」
Córdova:「現在產業界擁有大部分的AI資源,大學需要這些工具來從事基礎的研究問題,但這些工具既昂貴又缺乏,有什麼解決方案呢?」
Browning:「這個挑戰加劇了高效能計算更廣泛、更長期存在的不平等問題,包括我們學術機構在圖形處理器(graphics processing units ,GUI)的使用,這會阻礙經驗學習。使用的學生能夠處理一些具挑戰性的真實世界問題,而這經驗可以為那些資源較少的人打開關閉的大門。要解決這問題,需要專注、考慮跟投資。」
作為一個國家,我們認知到進入是個問題。例如,《晶片與科學法》(The CHIPS and Science Act)提議在資金上大幅提升,以支持更多進入到STEM領域,包括量子與AI,並強化研究的基礎建設與先進計算。不過對於現今的學生,還有更多需要去做的。
Gousev:「問題的一部分在於,所有東西從價格到訂貨量,一切都被過度炒作,但AI並不是一個”一體適用”的工具,大學必須以聰明的方式來使用它,從你要嘗試解決的問題開始。雲端上的數據幾乎都被GPT類的模型消耗掉,但現實世界中還有更多的數據,我們需要AI來收集並使它有所作為。」
這些炒作將會減少,隨著更多新創公司進入這領域開發新的方法、創新、技術與硬體,會帶來更多產能,演算法亦將更有效率。人類大腦消耗20瓦功率能做非常複雜的任務,圖形處理器要耗掉數千瓦,超級沒有效率,我很樂觀認為,AI將變得愈來愈有效率並更實惠。
現場觀眾:「有適當技能的人是否能掌握AI的發展?」
Gousev:「現在是物理學家發光發熱的重大時刻,我們自20世紀做的許多物理發現後,就有一點封閉起來,是時候回來了,我們可以帶給當前AI的混亂世界更多解釋性、更有效率及更多常識。」
Copan:「在訓練物理學家的過程,我們必須從整體下手,讓他們具備有說服力與清晰的溝通能力,如此他們能建立團隊與共識。現在需要的,是物理學、商業頭腦、情商與溝通技巧的結合:”物理plus”。」
Thaler:「在我們NSF的AI研究所,我們訓練極有天賦的跨領域專家前往業界工作,他們是一流的問題解決者,一旦你讓這些人進入有影響力的公司的基層,他們將會一路晉升到高層。」
現場觀眾:「AI在創新與創造力中扮演什麼樣的角色呢?」
Thaler:「我們沒有充分利用電腦的能力來探索廣闊的可能性,我一部分想知道,是否人類一些成就的巔峰可以透過詳盡搜尋來達成:愛因斯坦的相對論可以從一個最佳化原理產生嗎?它真的需要對時空幾何的理解嗎?有其它的方法能得此洞見呢?我的部分想法是,我們也許在過去的物理發現中很幸運,事物是簡單及微擾的,物理學家可以用基本的原則來取得進展。
也許我們現在面臨的問題在本質上是複雜的;也許物理學家需要小心,不要把事物太過簡化到它們最簡單的形式;也許我們必須接受某種程度的複雜性;也許為了突破性的物理見解,我們需要開始像電腦一樣思考,並混合非常、非常多種不同的選項。或許,創造力的未來是用蠻力。」
Copan:「實驗設計和發現本質上是人類的活動。我們現在與機器處於一種非常有趣的共生關係,有科學發現的可申請專利部分,也有版權作品的原始樣貌,是什麼構成一個創造力過程的開端,而AI或機器輔助程式在其中的角色是什麼?
美國專利及商標局(US Patent and Trademark Office)及世界上其它智慧財產局已做出某些政策決定,關於發明活動以及人類發明家對比機器的角色,但在某些方面,這些是人造的,樣態不斷在變化。」
Browning:「有一些AI 重新發現我們已知物理定律的實例,誰說AI不會發現新的東西?AI只要一些提示就能探索許多不同的選項,假設我想設計一個有特殊性能的熱交換機,但不偏好現今熱交換器的長相,AI提供一些相當有創意的選項,再加上新的製造技術與材料,我認為這是有希望的。」
Córdova:「剛好網際網路之父Vint Cerf在我們的觀眾之中(Cerf 是Google的副總裁兼首席網際網路傳教士(Evangelist),也是AIP基金會的新任董事),很合適請他來為我們說最後一些話。」
Vint Cerf:「區分一般的機器學習模型與特定大型的語言模型是很重要的,前者能夠讓我們發現也許未注意到的關聯性,注意關聯性是物理發現中很重要的部分。對於大型語言模型,我認為我們還未全然明瞭是怎麼回事,我們知道它們具有生成能力並可以產生幻覺,但有趣的是,因為訓練的方法,它們確實把一些意想不到的組合並列起來。
但問題是,它們並沒有足夠的背景資料。我要求一個大型語言模型為我寫訃文來測試,它生成了一個700字的簡歷,給了一個我認為太早的日期,它談論我的工作,把我沒做的事說是我的功勞,把我做的事歸功於其他人,它還編造我沒有的家庭成員。
這說明大型語言模型怎麼去製造逼真的人類話語,它們的回答就好像我們在問:『如果你是人類,你會對這個提示指令說什麼?』就這樣,但有一些知識概念隱藏在內,因為統計學反映出有意義的真實文字,也因此你會感覺有一個懂某些事情的鬼在那裡。
這裡有一個辛酸的案例。我們一位員工要求一個聊天機器人反轉一串隨機的字元,它產生了反向字串並補充:『順帶一提,這是一個Python程式做的。』它讓我們停了下來。機器學習和生成式AI很大部分只是個工具,我們必須要夠聰明來分辨幻覺與幻象。」
完整的對話內容在https://www.youtube.com/live/cUeEP15KN8M
1. A. Heavey, Phys. Today 75(7), 46 (2022)
France Córdova是AIP基金會的董事會主席、科學慈善聯盟主席,以及NSF的前主任。Valerie Browning是Lockheed Martin公司技術辦公室的研究與技術副主任,她是AIP董事會成員。 Walter Copan是科羅拉多礦產學院研究與技術轉移的副主任及NIST前主任。 Evgeni Gousev是高通公司(Qualcomm Research)工程部的資深主任和tinyML基金會的董事會主席,他也是在AIP基金會的董事會裡面。 Jesse Thaler是MIT物理系教授及NSF人工智慧與基礎互動研究所(Institute for Artificial Intelligence and Fundamental Interactions)所長。