它是以前的GoogleRefine,OpenRefine是一款數(shù)據(jù)清理軟件,可以對(duì)準(zhǔn)備好的一切數(shù)據(jù)進(jìn)行分析。例如最近我清理了一個(gè)含有化學(xué)名 稱(chēng)的數(shù)據(jù)庫(kù),并且各行有不同的拼寫(xiě)、大小寫(xiě)、空格等,用計(jì)算機(jī)來(lái)處理非常困難,幸運(yùn)的是, OpenRefine包含許多聚類(lèi)算法,對(duì)這個(gè)問(wèn)題可以快速解決。
KNIME可以通過(guò)可視化編程的方式來(lái)操作、分析和建模。不僅可以寫(xiě)代碼。你還可以在操作中建立聯(lián)系節(jié)點(diǎn)。基本上你只需要將功能模塊拖拽到工作區(qū), 并將模塊按照運(yùn)行流程連接起來(lái),就可以實(shí)現(xiàn)以往編程才能實(shí)現(xiàn)的工作。更重要的是,KNIME可以擴(kuò)展到運(yùn)行R, python, text mining,chemistry data等等,這可以讓你選擇用更先進(jìn)的編碼來(lái)分析。
Tip:讀取CSV文件時(shí)需要用“File Reader”代替CSV閱讀器。
和KNIME類(lèi)似, RapidMiner通過(guò)可視化編程操作,建模和分析數(shù)據(jù)。最近,RapidMiner贏得kdnuggets的軟件調(diào)查。
這是針對(duì)數(shù)據(jù)分析、大數(shù)據(jù)集的可視化和映射的一個(gè)非常強(qiáng)大的工具,谷歌的地圖軟件在其中起著重要作用。拿下面這張圖來(lái)說(shuō),這是一張墨西哥灣石油生產(chǎn)平臺(tái)的圖,我只需要上傳數(shù)據(jù),Google Fusion Tables確認(rèn)維度和經(jīng)度的數(shù)據(jù)之后就開(kāi)始工作了。
NodeXL是針對(duì)網(wǎng)絡(luò)和關(guān)系的可視化分析軟件。想想科技巨頭地圖上代表LinkedIn或Facebook的連接,NodeXL提供了進(jìn)一步精確的計(jì)算。如果你在不需要那么先進(jìn)的東西,你可以看看Google Fusion Tables,或者嘗試用Gephi。
從網(wǎng)上抓取網(wǎng)頁(yè)和信息曾經(jīng)是技術(shù)人員的專(zhuān)利,現(xiàn)在用import.io,每個(gè)人都可以從網(wǎng)站和論壇獲取數(shù)據(jù)。簡(jiǎn)單提出你想要的數(shù)據(jù),幾分鐘之后import.io就可以通過(guò)你的搜索知道你在找什么,從而會(huì)挖掘、提供數(shù)據(jù)用于你的分析或輸出。
不可否認(rèn)谷歌最初是一個(gè)強(qiáng)大的資源和搜索公司,運(yùn)營(yíng)商可以讓你快速過(guò)濾掉谷歌的結(jié)果得到的最有用的和相關(guān)的信息。比如說(shuō),你正想從ABC咨詢(xún)里尋找一個(gè)今年的數(shù)據(jù)科學(xué)報(bào)告。如果我們認(rèn)為該報(bào)告可能是PDF格式的,可以搜索
“數(shù)據(jù)科學(xué)報(bào)告”網(wǎng)站::ABCConsulting.com Filetype:PDF
然后在下面的搜索欄,使用“搜索工具”來(lái)屏蔽去年的結(jié)果。這在發(fā)現(xiàn)新的信息或市場(chǎng)研究方面非常有用。
Solver是一個(gè)在excel中做優(yōu)化和線性規(guī)劃的工具,允許你設(shè)置一些約束條件(例如不超過(guò)什么價(jià)格,要在哪天之前完成之類(lèi))。雖然更有效的優(yōu)化可能會(huì)需要另一個(gè)程序(例如R的優(yōu)化包),但是Solver應(yīng)用范圍比較廣。
Wolfram Alpha的搜索引擎是一個(gè)隱藏的寶石,可以媲美蘋(píng)果的Siri。WolframAlpha類(lèi)似于不那么智能的Google,對(duì)科技搜索提供詳細(xì)的回復(fù),對(duì)微積分作用也能快速的搜索。對(duì)企業(yè)用戶(hù)來(lái)說(shuō),它提供了信息圖表,對(duì)歷史價(jià)格、商品信息、主題概述。
雖然這些工具使得分析更簡(jiǎn)單,但他們只是把信息放進(jìn)去然后進(jìn)行分析,這些你自己也可以做到。所以用一點(diǎn)時(shí)間來(lái)學(xué)習(xí)新的技巧,用這些工具來(lái)提高自己完成工作。
在不久的將來(lái),多智時(shí)代一定會(huì)徹底走入我們的生活,有興趣入行未來(lái)前沿產(chǎn)業(yè)的朋友,可以收藏多智時(shí)代,及時(shí)獲取人工智能、大數(shù)據(jù)、云計(jì)算和物聯(lián)網(wǎng)的前沿資訊和基礎(chǔ)知識(shí),讓我們一起攜手,引領(lǐng)人工智能的未來(lái)!
聯(lián)系客服