精品伊人久久大香线蕉,开心久久婷婷综合中文字幕,杏田冲梨,人妻无码aⅴ不卡中文字幕

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
AI不是萬靈神藥!看看普林斯頓大學的這份“假AI防騙報告”

來源:cs.princeton.ed

編輯:小芹、大明

【新智元導讀】普林斯頓大學教授最新報告《如何區分AI“萬靈假藥”》近日火了,很多宣稱采用AI算法預測社會后果的技術,實際不比線性回歸模型好多少。你怎么看AI“萬靈假藥”?來新智元 AI 朋友圈和AI大咖們一起討論吧。

AI不是萬靈藥,但越來越多的人把它說成是萬靈藥,在這些人的鼓吹下,更多的人可能真的會把AI當成萬靈藥。

那么,如何在周圍人都在吹的氛圍下冷靜下來,分辨真假?近日,普林斯頓大學計算機系Arvind Narayanan副教授撰寫了一份報告,題目就是《如何區分AI“萬靈假藥”》

報告全文要點如下:

1、有很多與AI無關的東西都被打上AI標簽,目前已經誕生的真正的、有社會影響力的AI技術無意間充當了這些冒牌貨的保護傘。

2、很多宣稱采用AI算法的技術涉及對社會后果的預測。事實是,我們并不能預測未來,但當涉及AI時,這個常識似乎就我們無視了。

3、在風險行為預測上,手動評分要比AI評分靠譜得多。比如違規駕駛,人工計分,到一定程度吊銷駕照,這個計分還是要交給人來做。

作者首先舉了個例子。下邊這個網站宣稱,只用一段30秒的短視頻,就能評估出你的職業前途和工作的穩定程度。聽起來是不是很神奇?只要拍一段視頻傳上去,網站就會自動評估出多個指標,可視化呈現后給出一個綜合評分。

它聲稱,評估分數結果和視頻中的你說的內容甚至都沒關系,完全是AI算法根據肢體語言、講話的方式和風格這些東西得出的。

而實際上,這只是個加了外殼的“隨機數生成器”。你的職業是否穩定,全看運氣。

為什么這種包裝成AI的假貨這么多?

第一、  現在的“AI”是個時髦的保護傘,和AI沾邊可以提升身價。

第二、  一些AI技術確實實現了真正的、獲得大眾認可的巨大進步。

第三、  大部分群眾不懂AI,企業可以把任何東西貼上AI標簽,再賣出去。

這個例子只是說明在HR領域的問題,實際上在其他領域內,這種對AI技術的故意夸大的現象可能更嚴重。在這份報告中,作者將現在的AI應用模式大體分為3類。

第一類:認知類AI技術。主要包括內容識別(包括反圖片搜索)、人臉識別、基于醫療影像的輔助診斷、文本-語音轉換,以及DeepFake等。作者認為,這類技術基本上屬于貨真價實的快速技術進步,甚至DeepFake的過于逼真表現還引發了人們在道德上的擔憂。

作者認為,這類AI技術造假或吹牛空間不大的主要原因是結果和判斷標準的確定性。無論是人臉識別還是文本-語音轉換,其對錯標準是非常明確的。

第二類:自動化判斷類AI技術。包括垃圾郵件檢測、盜版內容檢測、論文自動評分、內容推薦等。這類應用盡管還遠遠稱不上完善,但是正在進步,應用前景在逐步拓寬。

對于這類AI來說,判斷標準開始變得有些模糊,一篇文章寫得好不好,一封電郵是不是垃圾郵件,對于這些問題,不同的人可能會有不同的看法,AI會逐步學習人類的判斷和推理方式,但往往免不了犯錯。

第三類:社會后果預測類AI。包括職業表現預測、慣犯行為預測、政策預測、恐怖襲擊預測等。作者認為,這類AI基本上其真實性都是值得懷疑的。

作者認為,在我們自己尚且不能預測未來的情況下,卻要把這個任務交給AI,并根據結果來制定政策,這種選擇有違常識,而且很可能造成不良后果。

AI預測社會后果?效果比線性回歸好不了多少

第三類AI應用有關預測社會后果,它們大多數時候從根本上就是可疑的

  • 預測犯罪慣犯

  • 預測工作表現

  • 預測警務

  • 預測恐怖主義風險

  • 預測問題兒童

本文也主要集中在第三類AI應用,因為這部分騙子最多。
前面展示了一些工具,聲稱可以用來預測工作適合性。同樣,保釋決定是基于對累犯的算法預測做出的。此外,依據一種分析社交媒體帖子并預測恐怖主義風險的算法,有人在邊境被拒之門外。
這些問題很難,因為我們無法預測未來。這應該是常識。但當人工智能涉足其中時,人們似乎決定要擱置常識。

真實、快速進步的:
  • Shazam(一款音樂識別應用)

  • 反向圖片搜索

  • 人臉識別

  • 基于醫學成像的醫療診斷

  • 語音轉文本

  • Deepfakes

不完美、但正在改進的:
  • 垃圾郵件檢測

  • 版權侵犯

  • 自動論文評分

  • 仇恨語音檢測

  • 內容推薦

基本上可疑的:
  • 預測累犯

  • 預測工作成功

  • 預測警務

  • 預測恐怖主義風險

  • 預測問題兒童

當然,這與AI的用途(所有的機器人技術、游戲……不在此列)相去甚遠。然而,重點是說明對于不同類型的任務,精度的限制在數量和質量上是如何不同的。
接下來將展示,第三類應用中不管投入多少數據,都并沒有真正的改進

案例:社會后果能被預測嗎?


普林斯頓大學社會學家Matthew Salganik等人此前發布《脆弱家庭與兒童福利研究》,涉及457名研究人員,并形成了一個數據集,開展機器學習挑戰賽。
“脆弱家庭(未婚家長與孩子組成的家庭)與孩子福利”項目跟蹤研究了1998-2000年出生在美國大城市的近5000名兒童(大約四分之三是未婚父母所生),這些兒童所在的“家庭”比普通家庭面臨更大的分裂和貧困的危險。研究圍繞四個方面展開:(1)未婚父母,尤其是父親的條件和能力是什么?(2)未婚父母關系的本質是什么?(3)這些家庭出生的孩子是怎樣生活的?(4)政策和環境條件如何影響這樣的家庭和兒童? 該項目的人口研究數據檔案辦公室公開提供六組相關數據。
據我所知,這是衡量社會結果可預見性的最嚴格的努力。

他們收集了關于每個孩子和家庭的大量數據,這些數據是基于多年來的深入訪談和多次重復的家庭觀察得出的。
脆弱家庭挑戰賽(FFC)的設置與許多其他機器學習競賽類似。任務是基于訓練實例學習背景數據與結果數據之間的關系。比賽期間以準確性排行榜進行評估,并在比賽結束后基于留存數據進行評估。
從出生到9歲的所有背景數據,以及15歲的一些訓練數據,他們的任務是準確預測以下關鍵類別的結果:
  • 孩子的平均成績(學業成績)

  • 孩子們的勇氣(激情和毅力)

  • 家庭的物質困難(衡量極端貧困的程度)

  • 驅逐家庭(不支付租金或抵押)

  • 照顧者的裁員

  • 工作培訓(如果主要照顧者將參加工作技能計劃)

完美預測對應于決定系數R^2趨近于1。預測每個實例的平均值對應于R^2趨近于0(即模型根本沒有學會區分實例)。
大多數人的直覺認為R^2的值在0.5到0.8之間。許多組織這次挑戰的專家都抱有很高的期望。


然而,實際結果卻令人大失所望R^2的值介于0.03到0.23之間
要知道:數百名專業的的AI/ML研究人員和學生參與了挑戰,他們被激勵去最大化預測的準確性,而且,每個家庭都被賦予了1.3萬個特征。這些是表現最好的模型。

相比之下,只有4個變量的線性回歸模型,所得到的結果并不比AI模型差多少(上圖綠色線)。
換句話說,“AI”比簡單的線性公式好不了多少!
這是癥結所在。回歸分析已經有一百年的歷史了。

同樣的發現在其他許多領域都有。
上圖是一個“預測再次犯罪”的AI。注意這是正確率,而不是R^2,所以65%只比隨機稍好一點。實際的準確性可能更低,因為雖然這個工具聲稱可以預測累犯,但實際上它預測的是再次被逮捕,因為這是有數據記錄的。因此,至少算法的一些預測性能來自于能夠預測的警務偏差。

觀點:在預測社會后果方面,人工智能并不比僅使用幾個特征的人工評分好多少。
這是一個可以證偽的觀點。當然,如果出現相反的證據,我愿意改變我的想法,或者給這個說法加上適當的說明。但鑒于目前的證據,這似乎是最謹慎的觀點。

駕照上的扣分可以被看作是預測事故風險的一種方法。一些研究發現,這樣的系統校準得相當好。我們早就知道,在很多領域,如果我們真正想做的只是預測(通常不是),那么簡單的公式比人類的預測更準確,即使是經過多年訓練的專家。
Daniel Kahneman 解釋說,這是因為人類的預測往往是“嘈雜的”:給定相同的輸入,不同的人(甚至是同一個人在不同的時間)會做出截然不同的預測。使用統計公式則消除了噪音。
人工智能在預測社會后果方面的危害:
  • 對個人數據的需求

  • 權力從領域專家大規模轉移到不負責任的科技公司手中

  • 缺乏可解釋性

  • 影響干預

  • 準確性流于表面

  • ……

與人工評分規則相比,人工智能預測有很多缺點。
最重要的是缺乏可解釋性。想象一下這樣一個系統,當你每次被交警攔下時,交警將你的數據輸入電腦,而不是從駕照上扣分。大多數時候你可以自由駕駛,但突然某天,黑盒系統告訴你,你不能再開車了。不幸的是,我們今天在很多領域都有這樣的系統。
總結
  • 人工智能擅長某些任務,但無法預測社會后果。

  • 我們必須抵制意圖混淆這一事實的巨大商業利益。

  • 在大多數情況下,手動評分規則同樣準確,更加透明,值得考慮。

本站僅提供存儲服務,所有內容均由用戶發布,如發現有害或侵權內容,請點擊舉報
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
普林斯頓計算機教授炮轟“偽AI”:精心炮制的隨機數生成器罷了
AI=機器學習²,我們在去往²的路上 | 普林斯頓范劍青教授
她如何用一個申不到經費、被稱作學校之恥的項目,革新了整個研究領域、掀起了如今的AI浪潮?
世界首款AI魔鏡:一照識別你性格
什么是機器學習以及它與人工智能的區別
AI人工智能是否可以精確冠心病與生死?
更多類似文章 >>
生活服務
分享 收藏 導長圖 關注 下載文章
綁定賬號成功
后續可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點擊這里聯系客服!

聯系客服

主站蜘蛛池模板: 黄浦区| 临汾市| 孝感市| 芷江| 巍山| 上栗县| 武定县| 新绛县| 灵寿县| 阿合奇县| 珠海市| 西盟| 泌阳县| 通化市| 小金县| 武陟县| 临海市| 都安| 金川县| 穆棱市| 和龙市| 镇江市| 德令哈市| 岐山县| 高州市| 仙居县| 遂溪县| 澄城县| 花垣县| 大连市| 宜州市| 永济市| 瑞昌市| 冷水江市| 洛扎县| 金门县| 高清| 枣阳市| 鄯善县| 灌南县| 浪卡子县|