微軟亞洲研究院副院長邱鋰力:無線通訊和感知與AI大模型正雙向賦能

可以預見的是大模型在無線通訊領域的應用將越發廣泛,而無線通訊的發展也將為大模型的應用帶來更多可能。

提到大模型,人們已經不再陌生,多模態的大模型從吟詩作畫擴展到提升娛樂體驗和工作效率。 但在微軟亞洲研究院副院長、微軟亞洲研究院(上海)負責人邱鋰力看來,大模型還可以做得更多。

新增大模型可理解的模態種類

“AI科技已經能處理不同的數據模態,如文字、圖片、視頻和語音。然而,要支持醫療等不同行業的特定應用,我們還需處理更多如生理訊號、無線感知科技,包括WiFi、毫米波和雷射雷達等不同於傳統模態的數據。我們致力於更好地支持這些新模態,並探索如何將它們與傳統模態結合,這一領域有巨大的發展潜力。”在提到大模型的相關應用時,邱鋰力關注的是先讓更多模態的數據可以被大模型理解。

作為無線通訊領域的專家,她和團隊在無線技術領域的研究主要是增强訊號、提高速率,並開發傳輸和感知的算灋。

她給第一財經在內的媒體記者展示了幾塊不到A4紙大小的輕薄板子,還有幾塊像樂高堆疊而成的塑膠板。 這些就是頗為神奇的“超表面”——這是一種具有人工設計結構的二維資料,通過設計每個超表面的單元,能精准修改射波的波前、相位和振幅,從而擁有波束轉向、聚焦、偏振轉換等等的强大能力。 通過對聲音訊號或電磁波做精准的建模和優化,超表面能實現用普通的聲波成像以及新增無線訊號的通訊距離和速率。 這些被動超表面低成本、無需供電、容易部署,是有效提升無線效能和功能的科技。

舉個例子,超表面能為智慧音箱帶來“視覺”。 智慧音箱只有很少幾個揚聲器和麥克風,但可以通過超表面蒐集物體發出不同方向的波,根據人在房間裏的位置變化帶來反射訊號的變化不僅能定位人的位置,而且能感知距離的變化從而探測呼吸,也能在不侵犯隱私的情况下瞭解空間內的資訊。

超聲波成像很普遍,但超表面讓科技實現的門檻顯著下降,可以使智慧音箱這樣的設備成像。 超聲成像的優勢之一是它能相對保護隱私,同時能透射。 超聲波頻寬有幾兆Hz,還需有專業的帶有幾百個收發器的探頭。 而智慧音箱只有幾千Hz的頻寬,2-4個揚聲器和麥克風。 頻寬和收發器都大大受限。 “在類似普通智慧音箱上做成像,我們是第一次達到這種效果。”邱鋰力介紹。

邱鋰力的團隊不僅開發超表面來提高無線感知的精度,同時也結合了機器學習。 無線訊號傳入時,通過信號處理,可以確定一些基本資訊,比如訊號的角度和距離,從而實現2D定位。 但在實際應用中,由於信號強度可能不足,或者目標物體移動速度較快,通常的信號處理方法無法準確捕捉目標位置,就常會出現異常情况。 這時,結合使用機器學習模型進行分析就顯得尤為重要,這種結合信號處理和機器學習的方法,能更有效地解决問題。

機器學習對不同模態訊號的分析可以應用在諸多系統的開發上,比如智慧語音早篩系統。 “語音是一個非常有用的訊號,一方面它比視頻能更好地保護隱私,同時它也包含了很多豐富的資訊,包括人的生理健康資訊,比如我們的發音反映了發音器官的健康程度,發音也能反映出頭腦的健康程度還有情緒。所以,我們團隊基於這些開發出了語音‘治療師’用於高鼻音患者,也開發了阿爾茨海默症的早篩系統,相關項目我們正在與醫院合作,希望能推動科技落地。此外,我們也正在探索通過語音來感知情緒。”她說。

邱鋰力表示,團隊也在探索通過視頻做無監督的异常檢測,比如自閉症患者有一些异常的刻板行為,“我們通過建模,抽取2D、3D的關鍵點資訊,並利用刻板行為的一些特徵,實現無監督异常行為監測”。

這些都是未來的應用方向之一。

大模型與無線通訊的雙向賦能

大模型的不斷發展也在與無線通訊雙向賦能。

“AI能够提高數據的壓縮率,許多內容可以在接收端直接生成,從而减少傳輸量,大大減輕網絡壓力。如果丟包,我們也能通過AI科技自動修復。使用AI科技傳輸數據,也促使微軟去開發一些新技術,比如在邊緣設備上運用AI,避免所有數據都上傳到雲端,這樣既减少了傳輸需求,也更好地保護了隱私。像微軟近期發佈的Phi-3-mini就可以更好地保護隱私,不用傳到雲端。”她表示,這是大模型在無線通訊資料傳輸時可以發揮的作用。

4月末,微軟在官網推出了小語言模型(SLMs)——Phi-3-mini。 作為微軟Phi系列的第四代產品之一,Phi-3-mini有38億參數和3.3T tokens的龐大訓練數據量,有4k和128k tokens兩個上下文長度變體,經過預訓練和指令調整,可以更好地理解人類的語言、表達、邏輯並執行不同類型的指令。

“我們需要結合通信算灋和應用需求,瞭解資料傳輸的具體需求,以便更好地進行資料壓縮和復原,從而降低傳輸成本。每一個模態都有它自己的特性。”她說。

囙此,如今的無線通訊網絡是一個包含了多種人工智慧算灋的複雜領域。

“AI科技影響著無線通訊的各個層面,從實體層、網路層到應用層。在實體層,最基本的任務是解碼無線訊號,即確定傳輸的是1還是0。通常,這一任務依賴於信號處理科技,但在很多天線陣列的情况下,傳統的信號處理方法並非最優。囙此,採用AI科技可能會提高處理效果,現時許多公司正在推動這方面的發展。”邱鋰力告訴第一財經,大模型在網路層出現異常時進行診斷和修復也有巨大的應用潜力,“因為這些模型擁有龐大的知識庫,能够進行有效診斷。它們不一定需要依賴現成的案例,通過分析網路通訊協定便可以預測可能的故障原因。” 這使大模型可以在網絡异常診斷時發揮作用。

在未來,隨著AI科技的不斷進步,可以預見的是大模型在無線通訊領域的應用將越發廣泛,而無線通訊的發展也將為大模型的應用帶來更多可能。

-