
摘要

來源:淵亭防務
摘要
美國國防系統信息分析中心(DSIAC)最新發布題為《人工智能在武器系統中的應用》報告(后臺發送“AI武器”獲取英文原文報告),概述了人工智能的歷史和含義、人工智能的原理和技術,以及在武器系統中的應用,包括回顧監督自主系統的研究和方案;制導、導航和控制;行動和路徑規劃;傳感器與信息融合;智能戰略和規劃;兵棋建模;以及認知電子戰。
關鍵詞:美國,人工智能,武器系統,機器學習,自主系統
人工智能(AI)應用于武器系統代表了過去十年研究的一個主要趨勢。這些舉措旨在提高武器精度,執行非主動瞄準手段、輔助導航、制導和控制(例如,在全球定位系統無法使用的情況下),并與傳統的基于物理的方法相比,減少總體計算資源,使更小、更經濟的武器系統實現智能瞄準。這項研究還包括將操作人員的作戰空間擴展到無人機,并使用集群方法與有人/無人平臺協同作戰。
美國國防系統信息分析中心(DSIAC)2022年10月12日發布題為《人工智能在武器系統中的應用》報告概述了人工智能的歷史和含義、人工智能的原理和技術,以及在武器系統中的應用,包括回顧監督自主系統的研究和方案;制導、導航和控制;行動和路徑規劃;傳感器與信息融合;智能戰略和規劃;兵棋建模;以及認知電子戰。
背景
機器學習(ML)和人工智能研究的最新進展揭示了人工智能在實現創新、增加機器的效用以及增強人類能力和經驗方面的能力和潛力。展示關鍵和相關的人工智能研究和最先進的技術至關重要,這些技術不僅賦予了武器系統比常規武器系統更多的自主權,而且顯著提高了它們的殺傷力和作戰生存能力。
常規武器技術大多是自動化系統,在計劃、執行和完成任務時依賴于一組預編程規則。使用支持AI的智能硬件增強人在回路系統可以在戰場上提供更多的情報信息,并通過AI系統執行一些簡單和常規的任務來緩解人類決策。
無人作戰空中系統(UCAS) 是經過驗證的具有成本效益的系統解決方案,適用于情報、監視和偵察 (ISR) 任務和遠程空襲。然而,自動化功能仍然受到人在回路操作、評估和參與的限制。雖然在任何可預見的未來都無意消除武器化人工智能系統中的人為因素,人類的能力將繼續構成這些系統協同潛力的上限。盡管如此,人工智能智能武器系統的新生態系統仍將迎來新的戰爭形式和戰略。
《人工智能:一種現代方法》(Artificial Intelligence: A Modern Approach)一書中給出了人工智能的最新定義,即“設計和構建智能體,這些智能體從環境中接收感知并采取影響環境的行動”。如果以人類為中心來定義人工智能,即以人類的智能水平執行任務,那么人工智能需要感知、推理、推斷、知識構建、決策和規劃、學習、溝通以及高效改變和操縱環境的能力。人工智能大致分為三個主要層次——弱人工智能(ANI)、強人工智能(AGI)和超人工智能(ASI)。圖 1-2 說明了三個層次內的各種分組。
機器學習是機器從數據中學習以做出準確預測的能力。它大致分為四類學習,提供豐富的專用和通用技術系列。
監督學習
在這種學習形式中,訓練數據使用包含輸入和標記或預定義的輸出數據。
如果有丟失的輸入或輸出條目,則會對其進行預處理,以便將輸入正確定位到其真正對應的輸出。
通過數據集訓練學習,即使輸入數據不在原始數據集,系統也將學會把陌生的輸入與其預測輸出(標簽或值)相關聯。
這種類型的訓練解決的典型問題是回歸和分類。
無監督學習這種學習形式的系統直接從未標記的數據中發現有價值或隱藏的結構。
無監督學習用于聚類分析、降維或估計可能生成輸入數據的密度。
半監督學習
當數據集包含標記數據和未標記數據時,這種學習形式的系統利用未標記數據更好地捕獲基礎數據分布,并獲得更好的預測,前提是僅從標記數據進行訓練。
這種學習形式適用于訓練數據集中標記數據遠少于未標記數據的情況。
強化學習在這種學習模式中,系統使用獎勵/懲罰機制進行訓練,使其在系統需要時獲得獎勵或在不需要時獲得懲罰。
強化學習問題涉及學習做什么(如何將情況映射到行動)以最大化數字獎勵信號。
最先進的方法
1.1深度學習(DL)
深度學習是指ML中強大算法的子集,采用深度連接的人工神經網絡(ANN),稱為深度神經網絡(DNNs)。DNN的構建模塊是感知器,它由一個被稱為“人工”神經元的信息處理單元組成。“人工”神經元的現代概念具有以下三個基本要素:
突觸:突觸是由價值強度加權或表征的連接鏈。
傳遞函數:該函數傳統上表示線性回歸模型(線性組合器),將輸入信號相加,這些輸入信號由它們各自的權重或強度值加權。
激活函數:限制神經元輸出幅度的函數。
傳遞函數可以包括外部施加的偏置值,該偏置值調制(增加/減少)激活函數的凈輸入。
多層感知器(MLP)是單層感知器和基本前饋網絡結構(圖2-1)的泛化,其成功歸功于誤差反向傳播算法,該算法基于誤差校正學習規則。該算法使用基于梯度下降的方法和鏈式規則,該算法旨在通過逆著突觸連接的方向,通過網絡反向傳播其關于自由參數(權重和偏差)的變化,來最小化損失函數(例如,平方誤差、交叉熵等)。
深度神經網絡的深度是指網絡中的層,無論它是前饋、反饋還是卷積架構。對于一個神經網絡必須是一個DNN的隱藏層數沒有一般的規則。然而,具有非線性激活函數的三層或更多層(包括輸出)的神經網絡被認為是深度神經網絡(DNN)(圖2-2)。
從大數據生成復雜模型的深度學習能力提高了準確性和表達能力。因此,深度學習為人工智能問題領域內的廣泛應用提供了以下一系列相關解決方案:
語音、圖像和視頻識別
多維數據中的背景評估(例如,成像、視頻、雷達和監控系統)
時間序列預測
函數逼近
數據壓縮
數據異常值檢測
系統識別
場景理解
可解釋的人工智能
自動駕駛
1.2強化學習(RL)
馬爾可夫決策過程(MDP):MDP是一個離散時間隨機過程,用于在隨機環境中對基于行動的主體的順序決策進行建模,在隨機環境中,該主體可以行動,并且行動的結果是不確定的。
部分可觀測MDP(POMDP):部分可觀測MDP (POMDP) 對不確定性擴展到狀態的情況進行建模。不對狀態的進行精確觀察,而只觀察與狀態的概率關系。POMDP 的一個常見解決方案是在當前時間步上推斷基礎狀態的信念分布,然后應用將信念映射到行動的策略。
單智能體強化學習 (SARL):在SARL中,RL模型分為狀態、動作和獎勵。狀態是代表當前世界或環境的任務。動作是RL智能體可以用來改變這些狀態的事情,而獎勵是智能體為執行所需動作而獲得的效用。
多智能體強化學習 (MARL):MARL是不同于 SARL的另一種強化學習形式。學習組織環境的機械手、學習走路的人形機器人或學習自行停車的汽車都是SARL的例子。MARL關注多個智能體如何相互交互以及它們的環境。MARL有兩個理論框架——隨機博弈和擴展形式的博弈。
深度強化學習(DRL):DRL是強化學習研究的最新進展的結果,證明了將深度神經網絡融入到強化學習算法中的好處。深度神經網絡充當狀態到值,或“狀態動作對”對到動作值標準的函數逼近器。當與強化學習一起使用時,深度神經網絡解釋輸入并提供策略預測。
DARPA 的“阿爾法狗斗”(AlphaDogfight 近距空中格斗) 比賽(圖 2-3)以蒼鷺系統公司的Heron Systems AI對人類飛行員的壓倒性勝利而告終,開創了一個可信、自主和潛在致命的機器時代。
2.1隨機優化
隨機過程是指捕獲隨機概率分布模型的隨機過程。在數學優化問題中,隨機優化是當隨機性存在時,最小化或最大化目標函數的一系列方法:
群體智能(SI):SI 是由分布式、自組織智能體的去中心化集體行動形成的行為模式。
每個個體代理根據其本地規則采取行動和作出反應,復雜的群體行為由此展開。
進化算法(EAs):進化算法是一種受自然啟發的隨機搜索算法,采用進化的原理——繁殖、遺傳交叉和變異,以提高系統中期望數量(適應度)的結果。
近年來,進化算法被用于提高人工智能/機器學習模型在所有機器學習過程中的性能——即在預處理(例如,特征選擇和不平衡數據重采樣)、學習中(例如,參數設置、隸屬函數和神經網絡拓撲)和后處理(例如,規則優化、決策樹/支持向量修剪和集成學習)。
物理學啟發的算法:從電磁和引力現象到物質和量子物理學,以下算法受到物理世界中觀察到的現象的啟發:人工勢場法 (APF)、模擬退火算法 (SA) 、量子菌群優化算法(QBSO)。
其它元啟發式:元啟發式算法家族中的其它優化方法是那些提倡集成自適應或學習搜索啟發式以智能地避開局部最小值或達到全局最優值的方法。
它們包括以下內容:
引導本地搜索算法 (GLS) 、禁忌搜索算法(TS) 、反應式搜索。
2.2圖搜索算法
圖搜索算法是一系列針對路徑規劃應用的搜索算法,例如在靜態和動態環境中求解最短路徑。圖搜索算法包括D* 算法和快速遍歷隨機樹 (RRT*)。
在很大程度上,當前范式的應用范圍很窄,缺乏強人工智能的幾個關鍵特征——可概括性、可解釋性、知識抽象、常識和因果推理。目前對神經符號人工智能和神經進化(NE)的研究試圖以不同的方式解決弱人工智能的一些局限性。
3.1神經符號人工智能
神經符號人工智能是人工智能的一個新興領域,它將經典的基于規則的人工智能與現代深度學習技術相結合。該架構強調神經、符號和概率方法與推理之間的交互。符號部分用抽象知識表示理性。概率推理在事實、關于不確定性的推理和看不見的場景之間建立因果關系。神經部分發現表征和模式,以將環境數據感知為知識,并幫助導航搜索空間。
3.2神經進化(NE)
NE是使用遺傳算法對神經網絡的人工進化。遺傳算法(GA)不僅可以進化連接權重,作為網絡反向傳播中,隨機梯度下降的替代方案,還可以進化網絡結構和連接權重,以顯著增強網元網絡的性能。該算法使用該結構來最小化搜索空間的維數。
人工智能在武器系統中的應用
報告重點介紹適用于自主系統和武器系統中最先進的人工智能方法,包括自主、感知中的人工智能、制導、導航和控制方面的人工智能、任務和路徑規劃、智能戰略、對手建模、認知電子戰。
1.1定義、自主級別和發展框架
定義:自主系統的特點是能夠根據對環境的感知、態勢感知以及對本地或動態環境的理解來選擇和規劃適當的行動路線以達到目標。
自主級別:美國國防部根據自主程度將武器化自主系統分類如下 (見圖 3-1):
本節重點介紹典型自主頂層功能架構中感知相關的最先進技術。這些人工智能技術適用于自主核心軟件和有效載荷ISR系統(情報、監視和偵察)中的感知。
2.1圖像分割
語義理解是將語義與圖像內容相關聯以構建理解和語境的任務。圖像分割對于場景或視覺理解尤為重要。分割主要分為三類——語義分割、實例分割和全景分割(見圖 3-2)。
2.2目標探測、分類和場景理解
報告強調了在基于圖像的主要數據庫挑戰中,使用最先進的深度神經網絡拓撲來處理圖像和視頻數據在感知方面的顯著進步。
圖像技術:圖像分類、圖像生成、人體姿態估計、語義分割、視覺推理、視覺問答(VQA)。
視頻技術:活動識別、目標探測、視覺常識推理(VCR)。
2.3傳感器融合
傳感器融合涉及對各種傳感器信息進行攝取和統一。在自主系統環境中,多傳感器融合用于解碼來自多個異構傳感器的信息,以推斷情境,并獲得感測環境的融合單一“視圖”。人工智能技術已被用來改進感知和定位中的這一重要處理功能。
在多智能體系統中,控制是根據如何控制智能體來指定的,在這種情況下,它可以是集中的、分散的或分層的。在其低級表示中,控制處理低級任務,例如在制導、導航和控制 (GN&C) 問題域中發現的跟蹤和調節功能。
3.1制導、導航和控制(GN&C)系統
GN&C是解決控制和支持運動物體任務的系統部分設計的重要問題領域。從將衛星送入軌道和制導彈藥到導航潛艇,這些系統對于自主系統的運動控制以及隨后實現任務目標是絕對必要的。GN&C系統描述如下:
測量車輛瞬時狀態的導航系統。
計算最佳軌跡和相應的車輛轉向指令以實現最佳軌跡的制導系統。
控制系統接收來自制導系統的轉向命令,并在存在所有干擾的情況下引導車輛遵循所需的高度。
控制系統具有三大功能:
1)在整個任務中穩定車輛;
2)駕駛車輛按照引導系統指示的所需高度行駛;
3)將車輛負載保持在所需的范圍內。
DARPA 的空戰演進項目(ACE)(圖 3-3)就是在復雜環境中使用人工智能進行武器系統控制的一個例子。
任務和路徑規劃是機器人和自主堆棧中的重要控制功能。它涉及計算從源點到目標點的最優路徑或準最優路徑。對于動態環境,這是一個非多項式時間復雜度(NP-hard)問題,其復雜性隨著狀態自由度的提高呈指數級增長。路徑規劃優化通常分為路徑搜索方法和軌跡優化問題。路徑搜索方法是通過啟發式和元啟發式算法解決的。
一個有效的路徑規劃算法需要滿足以下四個性能標準:1)必須以穩健的方式在現實的靜態環境中提供最佳路徑;2)必須可擴展到動態環境;3)必須與所選的自參考方法保持兼容:4)必須盡量減少復雜性和計算資源。
智能系統的標志性能力是決策推理。游戲場景中智能戰略和規劃的重要應用包括:單智能體系統(深度思維的AlphaGo、AlphaGo Zero、Alpha Zero、 MuZero)和多智能體系統(OpenAI Five、深度思維的AlphaStar)。
對手建模分為三種方法——策略分類、基于目標的生成模型和策略近似:
策略分類旨在通過監督或博弈論方法從學習專家那里預測策略。
在基于目標的生成模型中,一個或多個智能體如何實現一個目標是行為分類的基礎。
策略近似從狀態/動作集學習函數映射,預估對手行為背后的真實策略。
電磁頻譜是戰爭的重要前沿;現代和常規武器依靠電磁、光電和聲學信號進行通信、情報、傳感和武器投送。現代人工智能方法有望將統計信號處理和信息論中的傳統電子戰(EW)問題重新定義為人工智能問題。人工智能在電子戰中的使用,現在稱為認知電子戰 (CEW),已經獲得了極大的關注,特別是在自動調制分類、自動脈內調制分類和雷達脈沖重復間隔跟蹤領域。
典型的現代電子戰系統分為三個應用領域或系統構成(見圖 3-4):
由電子支援措施 (ESM) 系統提供的電磁威脅攔截、識別和定位。
由電子對抗(ECM)系統提供的進攻性措施,干擾或阻止敵人的電磁作戰手段。
由電子反對抗(ECCM)系統提供的防御措施,提供彈性和保護免受敵人的電子對抗。
將人工智能應用于武器系統的系統和項目計劃
美國政府已經建立了一些專門針對人工智能的重要機構。聯合人工智能中心 (JAIC) 由美國國防部于2018 年成立,旨在通過利用人工智能技術來擴展和轉變美國的軍事能力和服務,加速人工智能的使用,并領導國家努力保持美國的軍事技術優勢,成為與人工智能相關的下一代技術的全球力量。
負責研究和工程的國防部副部長(USD[R&E])成立自主系統的利益共同體(CoI),其中之一側重于自主方面的研究,旨在鼓勵跨領域技術重點領域的多機構協調和協作,為協調整個部門的科學和技術戰略、分享新想法、技術方向和技術機會提供了一個論壇。
在美國聯邦層面和國防部之外是重要的人工智能相關組織,例如國家人工智能咨詢委員會 (NAIAC)、國家人工智能安全委員會 (NSCAI) 和國家人工智能研究所。
1.1下一代空中優勢計劃(NGAD)
美國空軍目前正在根據NGAD計劃開發第六代戰斗機。這些戰斗機的一個關鍵要素是“人工智能僚機”、人工智能自主功能和有人-無人編隊(MUM-T)能力的集成。
1.2 X-61“小精靈”
X-61“小精靈”是源自 DARPA 的 Gremlins 計劃的技術演示平臺,旨在提供半自主、空中可回收且低成本的 UCAS(圖4-1)。X-61 可以攜帶多種有效載荷,包括 EO/IR 成像、電子戰傳感器和武器。
美國海軍正在將人工智能技術應用于幾個正在進行的自主平臺開發計劃。與國防部指令準則一致,人工智能技術通過海軍的無人海上自主架構和通用控制系統采用。
“海上獵人”是一個無人海軍平臺,用于開發 TTP(戰術、技術和程序)。它是海軍自主開發的測試平臺之一。它的自主性如此發達,以至于它從圣地亞哥航行到珍珠港。2020 年 8 月,第二艘名為“海鷹”的海上獵人下水(圖 4-2)
3.1德事隆系統“粗鋸齒 ”M5
“粗鋸齒”M5(Ripsaw M5)是第五代中型無人戰車,具有完全自主能力的美國陸軍技術演示器,是其三層美國陸軍機器人戰車項目 RCV 決定性殺傷力連續體概念的一部分(圖 4-3)。
4.1DARPA's 進攻性蜂群使能戰術(OFFSET)
DARPA 的OFFSET是下一代作戰技術生態系統的計劃推動者,旨在生產各種具有集群任務能力的無人平臺。該計劃設想使用超過250個無人機和地面系統的蜂群協作。
4.2CSDB小直徑炸彈群
CSDB是一種基于在“金帳汗國”計劃下開發的自主武器彈藥的集群技術,該計劃屬于美國空軍的“先鋒”(Vanguard) 計劃之一,CSDB的集群技術旨在提供自主識別、目標選擇和打擊能力。
為了滿足下一代戰場的數據密集型和網絡處理要求,國防部正在加緊開發多個系統,支持具有人工智能任務規劃和作戰管理能力的聯合全域指揮與控制。
美國陸軍的建設性機器學習對抗戰術 (COMBAT) 計劃旨在利用人工智能開發先進的對抗性兵棋戰術,以確保美國軍隊的長期戰術優勢和為敵人強化無法預料的戰場現實。DARPA 的可解釋人工智能計劃將通過確保人工智能能夠產生可解釋的模型和推理并以人類可以理解的方式呈現基本原理來幫助戰斗管理決策者。這個過程將使用神經符號人工智能和最先進的人機交互技術。
6.1復仇女神系統(NEMESIS)
雖然增強現實提供了信息優勢并增強了作戰人員在戰斗中的感知,但NEMESIS增加了自動化、關鍵決策制定的戰術維度。NEMESIS是一個仿生視覺AI系統(圖 4-4),旨在通過融合多模態傳感器、識別場景和情況、解釋情境以及向戰斗人員實時提供快速、智能的決策和策略來模擬人類的視覺和認知。
常規武器系統依靠 GPS 信號鎖定慣性導航系統解決方案來獲得準確的實時位置、導航和授時 (PNT) 信息。然而,在通信信號可能受到干擾和欺騙的嚴峻和電子敵對環境中,任務執行可能會由于導航系統中丟失位置和時間精度而中斷。人工智能驅動的技術正在開發和測試,以在這種環境中保持導航。
DARPA 的“垂釣者” 計劃(Angler) 旨在開發一個水下平臺,該平臺能夠在沒有衛星和地面通信的情況下執行完全自主的長期任務,并借助傳感器套件在黑暗、湍流和半透明的環境中提供感知。
未來戰場中的人工智能
馬賽克戰作戰概念采用多域、非均勻和不對稱的力量投射,采用不同類型、類別、配置和大小的各種武器平臺。通過馬賽克瓷磚的類比,該概念預見到所有組成部分匯聚在一起,形成一種非常規的打擊力量,從而擾亂和破壞敵人的穩定(圖 5-1)。該概念的特點是其動態互操作性、可擴展性和集成靈活性,從而實現了新武器技術和具有成本效益的系統的敏捷集成。人工智能的使用是馬賽克戰爭的關鍵推動力。
使用人工智能,下一代武器系統將具有高度集成的自主功能和決策能力。關鍵發展領域將以人工智能為目標,實現更高水平的跨域信息融合、智能自適應拓撲網絡、快速數據處理、部分信息彈性控制、分布式控制和準確預測能力。無人裝備將采用先進的視覺、雷達和聲納算法,用于ATR、多模態傳感器融合以增強感知和智能任務規劃。
此外,由及時、關鍵、準確和精煉的戰斗價值信息傳播支持的跨域合作構成了戰略作戰和戰術優勢。未來人工智能通過可操作情報準備提供將海量態勢和戰場情報數據(信號情報 [SIGINT]、電子情報 [EINT] 以及測量和特征情報 [MASINT])轉換為粗略的智能規劃的能力,這不僅有助于減少認知負荷,還有助于指揮官和操作員的戰略決策。
結語
人工智能有望成為確保未來戰場戰備和戰術優勢的決定性因素。群體智能、人機交互、非線性自適應控制、視覺感知、對手建模和認知電子戰是利用人工智能提供前沿智能戰斗系統的一些關鍵領域。此外,隨著神經符號人工智能和神經進化人工智能研究的最新進展,正在跨越邊界以縮小弱人工智能(一般人工智能)和強人工智能(完全人工智能)之間的差距。