
人類和人工智能協(xié)同驅(qū)動(dòng)的規(guī)劃系統(tǒng)與交互式游戲引擎相結(jié)合

摘要:“今夜就戰(zhàn)”(Fight Tonight)項(xiàng)目由美國空軍研究實(shí)驗(yàn)室 (AFRL) 于2021年12月啟動(dòng),目的是尋求創(chuàng)新研究,通過將人工智能(AI)驅(qū)動(dòng)的規(guī)劃與交互式游戲相結(jié)合,大幅縮短空中任務(wù)指令(ATO)規(guī)劃周期,從而徹底改變空戰(zhàn)規(guī)劃。項(xiàng)目圍繞兩個(gè)關(guān)鍵技術(shù)領(lǐng)域“交互式規(guī)劃改進(jìn)”和“規(guī)劃游戲與結(jié)果分析”分兩步開展,預(yù)計(jì)項(xiàng)目周期將近五年。總項(xiàng)目經(jīng)費(fèi)為9900萬美元,截至目前已先后授予BAE系統(tǒng)公司和雷神BNN技術(shù)公司價(jià)值1700萬美元和2500萬美元的合同。
關(guān)鍵詞:美國,空軍,作戰(zhàn)規(guī)劃,人工智能,游戲引擎
美軍空中作戰(zhàn)中心(AOC)的空戰(zhàn)規(guī)劃任務(wù)就好比煉金術(shù),其提煉的對(duì)象是對(duì)于戰(zhàn)略指導(dǎo)的詮釋和對(duì)于已知變量(例如,燃油燃燒率、武器容量、后勤需求)與不可預(yù)測(cè)性(例如,維護(hù)問題、對(duì)手行動(dòng))的傳統(tǒng)優(yōu)化。AOC戰(zhàn)略部門負(fù)責(zé)將戰(zhàn)略指導(dǎo)轉(zhuǎn)化為具體目標(biāo),并執(zhí)行任務(wù)分析、行動(dòng)方案的制定、分析和選擇。AOC作戰(zhàn)規(guī)劃部門負(fù)責(zé)制定滿足作戰(zhàn)環(huán)境限制的詳細(xì)執(zhí)行計(jì)劃,為空中任務(wù)指令 (ATO) 的準(zhǔn)備和重新分配執(zhí)行詳細(xì)分析和構(gòu)件生成。這些活動(dòng)的復(fù)雜性和密切協(xié)作的需要使得當(dāng)前空戰(zhàn)規(guī)劃流程需要數(shù)百名專家協(xié)同進(jìn)行工作,AOC內(nèi)部走完整個(gè)“主空中攻擊規(guī)劃”(MAAP)流程需要36小時(shí),而這顯然無法滿足節(jié)奏日益加快且充滿變量的未來戰(zhàn)場(chǎng)。預(yù)計(jì)未來的作戰(zhàn)環(huán)境將有更多的移動(dòng)和企圖逃離的目標(biāo),作戰(zhàn)規(guī)劃必須具備更高的敏捷性以支持指令執(zhí)行。而與同等競(jìng)爭(zhēng)對(duì)手的敵對(duì)行動(dòng)中,則要求更高的出擊率以應(yīng)對(duì)快速?zèng)_突和潛在的數(shù)量劣勢(shì)。當(dāng)前的作戰(zhàn)規(guī)劃流程通常是線性的,詳細(xì)分析選項(xiàng)的機(jī)會(huì)有限,且需要在執(zhí)行過程中隨著條件的變化進(jìn)行耗時(shí)的計(jì)劃調(diào)整和修復(fù)。盡管目前看來,在有限條件下生成作戰(zhàn)規(guī)劃是有效的,但其速度和靈活性將無法滿足未來沖突發(fā)生的速度和規(guī)模。美國空軍研究實(shí)驗(yàn)室 (AFRL) 于2021年12月啟動(dòng)“今夜就戰(zhàn)”(Fight Tonight)項(xiàng)目,目的是尋求創(chuàng)新研究,通過將人工智能(AI)驅(qū)動(dòng)的規(guī)劃與交互式游戲相結(jié)合,大幅縮短空中任務(wù)指令(ATO)規(guī)劃周期,從而徹底改變空戰(zhàn)規(guī)劃。
人類和人工智能協(xié)同驅(qū)動(dòng)的規(guī)劃系統(tǒng)與交互式游戲引擎相結(jié)合
在作戰(zhàn)規(guī)劃過程中,人類能夠在不確定的情況下理解戰(zhàn)略要求并進(jìn)行推理,這一點(diǎn)是包括人工智能在內(nèi)的機(jī)器所無法替代的。但同時(shí),人腦的認(rèn)知吞吐量有限且推理多個(gè)潛在未來的能力受限,使得現(xiàn)階段作戰(zhàn)規(guī)劃的效率和充分性都僅僅是勉強(qiáng)滿足需求,而自動(dòng)化在優(yōu)化定義明確的變量方面具有極大的優(yōu)勢(shì)。顯而易見,依靠人類洞察力來指導(dǎo)和解釋自動(dòng)化規(guī)劃和分析,作戰(zhàn)規(guī)劃流程就能夠高效地產(chǎn)出更加可靠的行動(dòng)方案。
“今夜就戰(zhàn)”項(xiàng)目開發(fā)的工具將使人類用戶與人工智能合作,在4小時(shí)內(nèi)制定空戰(zhàn)規(guī)劃,在僅僅數(shù)分鐘內(nèi)逐步進(jìn)行重新規(guī)劃,并能夠同時(shí)對(duì)多種選擇與預(yù)期結(jié)果之間的權(quán)衡進(jìn)行探索。此外,“今夜就戰(zhàn)”將開發(fā)優(yōu)化人類角色和機(jī)器角色的工具——人類負(fù)責(zé)提供深刻的見解和創(chuàng)造力,而機(jī)器負(fù)責(zé)通過約束條件進(jìn)行推理并生成對(duì)各種可用選項(xiàng)的詳細(xì)分析。
按照未來作戰(zhàn)的速度和規(guī)模與人工智能協(xié)同制定規(guī)劃,將需要具有以下功能的通用基礎(chǔ)設(shè)施:
為 AI 模型和分析提供所需的表示和數(shù)據(jù)的形式化。
靈活且持久的數(shù)據(jù)接口,能夠?yàn)椤敖褚咕蛻?zhàn)”建模和分析功能提供及時(shí)的作戰(zhàn)環(huán)境信息,并為客戶應(yīng)用程序提供來自“今夜就戰(zhàn)”系統(tǒng)的建模和分析結(jié)果。
交互式用戶界面,使用戶能夠提供指導(dǎo)、實(shí)時(shí)反饋,并實(shí)時(shí)快速傳達(dá)復(fù)雜作戰(zhàn)環(huán)境的詳細(xì)信息。
可擴(kuò)展的計(jì)算表示形式,用于在交互式實(shí)時(shí)環(huán)境中管理大量實(shí)體的狀態(tài)及其更新。
游戲?qū)崨r的捕捉與維護(hù),以進(jìn)行復(fù)盤和分析。
商業(yè)游戲已經(jīng)顯示出滿足以上要求的能力,但通常是作為娛樂產(chǎn)品開發(fā)的,對(duì)規(guī)劃行動(dòng)方案的關(guān)注有限。例如,像《星際爭(zhēng)霸II》和《羅馬:全面戰(zhàn)爭(zhēng)》這樣的商業(yè)游戲讓玩家能夠?qū)崟r(shí)指揮復(fù)雜的部隊(duì),為管理資源、行動(dòng)和戰(zhàn)略提供多個(gè)視角。美國空軍研究實(shí)驗(yàn)室 (AFRL) 尋求利用商業(yè)游戲行業(yè)的進(jìn)步與作戰(zhàn)數(shù)據(jù)和規(guī)劃流程相結(jié)合,為AOC提供基于游戲的規(guī)劃引擎。
此處所設(shè)想的基于游戲的規(guī)劃過程將是不連續(xù)的,允許用戶以粗略的分辨率制定初始計(jì)劃,然后在更精細(xì)的級(jí)別進(jìn)行迭代,并根據(jù)需要靈活地返回到低保真度規(guī)劃。預(yù)計(jì)自動(dòng)化分析將參與從基于建模不確定性的統(tǒng)計(jì)分析到使用人工智能模擬友方和對(duì)手決策的規(guī)劃執(zhí)行的所有作戰(zhàn)規(guī)劃過程。“今夜就戰(zhàn)”系統(tǒng)將創(chuàng)建在已經(jīng)成熟的自動(dòng)化規(guī)劃和調(diào)度技術(shù)的基礎(chǔ)上,但目前的能力不足以滿足項(xiàng)目愿景的需求,并且持續(xù)性規(guī)劃和結(jié)果評(píng)估所需的數(shù)據(jù)和框架集成也十分有限。
交互式游戲引擎將作為在不確定和動(dòng)態(tài)條件下進(jìn)行方案制定、預(yù)演和評(píng)估的基礎(chǔ),并被設(shè)定為用戶與整個(gè)“今夜就戰(zhàn)”系統(tǒng)進(jìn)行交互的主要手段。其目標(biāo)是為用戶提供穩(wěn)定的可視化界面和環(huán)境來探索和選擇兵力分配,播放、暫停和倒放攻擊計(jì)劃以了解關(guān)鍵決策點(diǎn),實(shí)時(shí)操縱計(jì)劃,評(píng)估潛在的計(jì)劃變化,并探索多種關(guān)于可能的操作條件的假設(shè)。
簡(jiǎn)而言之,“今夜就戰(zhàn)”項(xiàng)目旨在加快規(guī)劃過程,并允許作戰(zhàn)員對(duì) AOC 戰(zhàn)略和作戰(zhàn)規(guī)劃部門的各潛在行動(dòng)方案進(jìn)行充分探索。由人類和人工智能協(xié)同驅(qū)動(dòng)的規(guī)劃系統(tǒng)與交互式游戲引擎相結(jié)合,為作戰(zhàn)規(guī)劃人員提供了一種跨越式的能力,這種能力將使戰(zhàn)斗規(guī)劃者能夠快速高效地推理方案選項(xiàng)和合理未來,并增加規(guī)劃者的自信,使其相信自身在面對(duì)與同等對(duì)手的高度動(dòng)態(tài)沖突時(shí)有能力制定最佳計(jì)劃。在美軍設(shè)想的概念中,“今夜就戰(zhàn)”項(xiàng)目將為持續(xù)性作戰(zhàn)規(guī)劃以及戰(zhàn)略和作戰(zhàn)評(píng)估的改進(jìn)提供交互界面(如圖4所示)。
兩大關(guān)鍵技術(shù)領(lǐng)域
該項(xiàng)目開放式跨部門公告(BAA)的總體策略是快速有效地執(zhí)行研究和開發(fā),為緊迫的問題提供實(shí)用的解決方案,預(yù)計(jì)需要將現(xiàn)有技術(shù)快速集成到可現(xiàn)場(chǎng)測(cè)試的功能原型中,從而在以下兩個(gè)關(guān)鍵領(lǐng)域擴(kuò)展最先進(jìn)的技術(shù):
技術(shù)領(lǐng)域一(TA1):交互式規(guī)劃改進(jìn)。
通過用戶引導(dǎo)的探索性資源分配和任務(wù)優(yōu)先級(jí)排序過程生成可執(zhí)行方案的能力。
該服務(wù)將幫助用戶設(shè)計(jì)任務(wù)的兵力分配,了解可用的選項(xiàng),并對(duì)調(diào)整優(yōu)先級(jí)的影響進(jìn)行評(píng)估。
擬議的解決方案必須考慮各種關(guān)鍵因素,例如可接受的風(fēng)險(xiǎn)水平、交戰(zhàn)規(guī)則、友方的戰(zhàn)斗指令、敵方戰(zhàn)斗指令和聯(lián)合綜合優(yōu)先目標(biāo)列表 (JIPTL)。
技術(shù)領(lǐng)域二(TA2):規(guī)劃游戲與結(jié)果分析。
能夠交互式地模擬攻擊計(jì)劃的執(zhí)行,基于不確定性的評(píng)估結(jié)果方差,以及對(duì)可能的未來進(jìn)行實(shí)證分析。
規(guī)劃者應(yīng)該能夠探索和理解如何針對(duì)采用了不同策略和響應(yīng)的假想對(duì)手而展開計(jì)劃。
擬議的解決方案還應(yīng)支持修改規(guī)劃要素、作戰(zhàn)條件和敵友軍能力,以確定這些變化將如何影響方案的有效性和風(fēng)險(xiǎn)。
兩個(gè)階段:技術(shù)演示構(gòu)建與AOC作戰(zhàn)應(yīng)用
為了解決上述各項(xiàng)技術(shù)挑戰(zhàn),“今夜就戰(zhàn)”項(xiàng)目將開發(fā)一個(gè)綜合系統(tǒng)并在現(xiàn)實(shí)軍事環(huán)境中對(duì)其進(jìn)行評(píng)估。整體項(xiàng)目分為兩個(gè)階段,第一階段將側(cè)重于構(gòu)建令人信服的“今夜就戰(zhàn)”系統(tǒng)技術(shù)演示,第二階段旨在將開發(fā)的能力過渡到AOC的作戰(zhàn)使用。由此產(chǎn)生的規(guī)劃系統(tǒng)將需要在固定時(shí)間段內(nèi)解決規(guī)劃和分析的固有挑戰(zhàn),同時(shí)還要完成對(duì)人類引導(dǎo)自動(dòng)化的集成,以考慮到指導(dǎo)規(guī)劃過程的人類認(rèn)知需求。為了促進(jìn)與大型行業(yè)平臺(tái)(例如Kessel Run實(shí)驗(yàn)室)的可能集成,需要一個(gè)強(qiáng)大的軟件架構(gòu)來確保“今夜就戰(zhàn)”數(shù)據(jù)和元數(shù)據(jù)能夠被其它應(yīng)用程序和服務(wù)所獲取和使用。
階段一(30個(gè)月):“今夜就戰(zhàn)”的第一階段將側(cè)重于確保TA1和TA2中正在開發(fā)的可用數(shù)據(jù)和技術(shù)是全面和現(xiàn)實(shí)的,可以滿足空戰(zhàn)規(guī)劃人員的需求和要求,并且其所依據(jù)的數(shù)據(jù)和知識(shí)按照合理預(yù)期能夠被“今夜就戰(zhàn)”應(yīng)用所獲取。此階段的TA1和TA2開發(fā)將側(cè)重于確保該項(xiàng)目滿足AOC規(guī)劃人員的實(shí)際作戰(zhàn)需求。此處重點(diǎn)主要在集成能力演示上,并著重強(qiáng)調(diào)對(duì)于可擴(kuò)展和靈活接口和數(shù)據(jù)標(biāo)準(zhǔn)的定義。這包括確定戰(zhàn)略和作戰(zhàn)規(guī)劃部門工作人員的需求之間的差距(差距確定將通過戰(zhàn)略規(guī)劃用戶組進(jìn)行,所有執(zhí)行者都參與)和TA1和TA2中正在開發(fā)的能力(通過規(guī)劃接口工作組)。還應(yīng)高度重視人為因素系統(tǒng)設(shè)計(jì),以確保用戶能夠通過戰(zhàn)略和作戰(zhàn)規(guī)劃能力保留當(dāng)前手動(dòng)規(guī)劃流程提供的洞察力和控制力。所有的工作重點(diǎn)都將集中在框架設(shè)計(jì)和架構(gòu)原型設(shè)計(jì)、測(cè)試內(nèi)部接口規(guī)范以及“今夜就戰(zhàn)”系統(tǒng)內(nèi)部和外部組件之間接口的識(shí)別上。
此計(jì)劃階段將為執(zhí)行者開發(fā)數(shù)據(jù)構(gòu)件和執(zhí)行場(chǎng)景(由政府領(lǐng)導(dǎo)的評(píng)估團(tuán)隊(duì)),以評(píng)估其獨(dú)立于其它“今夜就戰(zhàn)”組件的能力表現(xiàn)。AFRL正在計(jì)劃以用戶為中心的一系列迭代評(píng)估(如圖6所示)。在每次評(píng)估結(jié)束時(shí),將根據(jù)不斷發(fā)展的測(cè)試場(chǎng)景和數(shù)據(jù)集評(píng)估所有TA1和TA2功能,目標(biāo)是確保TA1和TA2功能的輸入/輸出要求一致。此過程旨在確保TA1和TA2執(zhí)行者了解潛在用戶的需求,他們的輸入/輸出假設(shè)是現(xiàn)實(shí)的,并且正在開發(fā)的場(chǎng)景足以支持每個(gè)TA1和TA2執(zhí)行者的研發(fā)和評(píng)估要求。這種迭代改進(jìn)過程還反映了這樣一種預(yù)期,即需要大量的工程工作才能為TA1和TA2執(zhí)行者提供他們開發(fā)和改進(jìn)其技術(shù)所需的數(shù)據(jù)。
“今夜就戰(zhàn)”項(xiàng)目將側(cè)重于在現(xiàn)實(shí)空軍環(huán)境中部署的功能原型中的能力集成和評(píng)估,對(duì)于支持規(guī)劃人員快速制定、預(yù)演和評(píng)估作戰(zhàn)計(jì)劃的各組成部分的能力進(jìn)行評(píng)估。
階段二(24個(gè)月):該項(xiàng)目的最后階段目的是能夠令人信服地展示“今夜就戰(zhàn)”在空軍主要評(píng)估背景下支持空中作戰(zhàn)規(guī)劃的能力,包括作為聯(lián)軍之一對(duì)數(shù)千個(gè)目標(biāo)進(jìn)行作戰(zhàn)規(guī)劃的能力。該集成原型將與必要的外部系統(tǒng)相連接,以支持與空軍內(nèi)部作戰(zhàn)和采購部門代表合作開發(fā)和實(shí)施的全尺寸想定。
項(xiàng)目進(jìn)展
美國空軍研究實(shí)驗(yàn)室 (AFRL) 于2021年12月28日啟動(dòng)“今夜就戰(zhàn)”(Fight Tonight)項(xiàng)目,預(yù)計(jì)項(xiàng)目周期近五年,分為兩個(gè)階段(分別為30個(gè)月和24個(gè)月)展開,總項(xiàng)目經(jīng)費(fèi)為9900萬美元。
根據(jù)2022年11月9日消息,“今夜就戰(zhàn)”項(xiàng)目授予BAE系統(tǒng)公司一份價(jià)值 1700 萬美元的合同,將人工智能 (AI) 引入交互式游戲環(huán)境,以徹底改變對(duì)抗環(huán)境的空中作戰(zhàn)規(guī)劃。作為“今夜就戰(zhàn)”項(xiàng)目的一部分,該公司將為空中作戰(zhàn)規(guī)劃人員提供他們所需的工具,以顯著加快規(guī)劃復(fù)雜空襲行動(dòng)的過程。根據(jù)該項(xiàng)目技術(shù)領(lǐng)域2(TA2)(規(guī)劃游戲與結(jié)果分析)合同的條款,BAE系統(tǒng)公司的FAST Labs研發(fā)團(tuán)隊(duì)以及分包商未知領(lǐng)域軟件公司(Uncharted Software)和Kestrel研究院將開發(fā)一種解決方案,以快速生成和審查多個(gè)方案并從中選擇最優(yōu)項(xiàng)。
雷神BBN于2022年12月6日宣布,雷神BBN領(lǐng)導(dǎo)的團(tuán)隊(duì)最近獲得了一份合同,該合同在三年內(nèi)的潛在價(jià)值為2500萬美元,用于美國空軍研究實(shí)驗(yàn)室的“今夜就戰(zhàn)”項(xiàng)目。雷神BBN領(lǐng)導(dǎo)的團(tuán)隊(duì)成員包括Breakaway Games游戲公司、雷神導(dǎo)彈與防御公司和雷神情報(bào)與太空公司。
啟示
在現(xiàn)代戰(zhàn)爭(zhēng)中,作戰(zhàn)概念和軍事科技發(fā)展的目標(biāo)之一就是盡可能縮短“OODA”循環(huán)周期以占據(jù)先機(jī)、克敵制勝。當(dāng)前各項(xiàng)科學(xué)技術(shù)尤其是人工智能技術(shù)的飛速發(fā)展,利用“機(jī)器速度”取代“人類速度”以主導(dǎo)戰(zhàn)局的理念在“觀察”、“行動(dòng)”甚至是“判斷”環(huán)節(jié)都得到了廣泛的體現(xiàn)。然而“決策”這一環(huán)節(jié)則充分體現(xiàn)了“戰(zhàn)爭(zhēng)藝術(shù)”之所以為藝術(shù)的原因,智慧和智能之間有著難以跨越的鴻溝。“今夜就戰(zhàn)”項(xiàng)目遵循了另一種思路,即利用人類引導(dǎo)的人工智能,在充分發(fā)揮人類洞察力的同時(shí)高效地產(chǎn)生無數(shù)詳細(xì)的潛在行動(dòng)方案,并結(jié)合成熟的商業(yè)技術(shù)以優(yōu)化作戰(zhàn)員的作戰(zhàn)體驗(yàn),允許其對(duì)各作戰(zhàn)方案進(jìn)行充分的探索、挑選與評(píng)估,最終達(dá)到讓部隊(duì)能夠深入了解和適應(yīng)未來戰(zhàn)場(chǎng)的目的。
聯(lián)系客服