市面上的數據分析軟件非常多,但這并不意味著它們都適合你的企業。在本文中,我們將從對可拓展性和高性能的支持、團隊合作功能、供應商規模和產品整合、購買及維護預算4大要點出發,評測以下市場上常用9大數據分析軟件:Alteryx Inc.,IBM, KNIME AG,Microsoft,Oracle,RapidMiner Inc.,SAP,SAS Institute Inc.和Teradata Corp。希望今天的分享,能幫您的企業挑選到最適合的數據分析軟件。
要點一:對可拓展性和高性能的支持
企業的數據量和分析需要驅動了對可拓展性能的需求。數據量小的小企業可能可以忍受那些不能隨著可獲得資源來拓展性能的產品,比如低端工具的入門級版本,包括RapidMiner、KNIME,、Microsoft R Open和Alteryx Designer,它們可以在PC端運行而且不需要額外的服務器組件。
規模大點的企業更有可能有一個更大體量的數據進行分析,以及更廣泛的用戶群體。這帶來了兩個額外的要求——高性能和方便合作。產品對高性能架構的適應性體現餓了可拓展性,大部分產品可以適應Hadoop的并行處理或采用其他來達到更高速計算的方式。
評測中的所有產品都有對Hadoop的支持,包括IBM SPSS Modeler和SPSS Statistics;RapidMiner的商業組件Radoop連接了Hadoop中存儲的數據到Studio前端和Server分析引擎;Oracle的Big Data Discovery和ORAAH工具;KNIME的Big Data Extensions和Cluster Execution加載項。
IBM SPSS現在也提供對一些多線程分析算法的增強支持來提高速度性能。Teradata Aster Analytics通過它的Massively Parallel Processing架構解決了高性能需求。SAP BusinessObjects Predictive Analytics的SAP Expert Analytics版本可以執行內存數據挖掘來高效處理大體量數據分析。Microsoft R Server利用它的ScaleR模塊——支持并行化的完整大數據分析算法庫。使用SAS Enterprise Miner執行的打分算法可以在Hadoop環境中部署和執行。
另外,與Apache Spark的整合越來越被重視。SPSS、KNIME、Oracle、RapidMiner和SAP都能接入Apache Spark庫來支持在數據體量大爆炸的情況下所需的分析應用。這讓成熟的應用能夠獲得高性能集群平臺的優勢來跨集群分配工作流。
要點二:團隊合作功能
如上所述,企業的規模越大就越有可能需要在不同小組和分析師中分享分析、模型和應用。那些有很多分散在各部門的分析師的企業會想要找到更多方式來分享模型并合作解讀結果。
IBM的SPSS Modeler Gold版本提供了合作功能,RapidMiner的Server產品提供了對分享和合作的支持。Alteryx Analytics Gallery提供了與企業成員在云端分享復雜分析應用的機制。KNIME提供了商業拓展來支持團隊合作以及運營合作如執行遠程計劃、生成報告、共享數據空間和工作流庫。SAS Enterprise Miner的客戶服務器架構使得企業用戶和數據分析師通過分享模型和其他工作產品來共同工作。
Alteryx、KNIME和Teradata Aster增加了幫助管理分析工作流的功能。同時,一些供應商開始嘗試讓他們的工具能與其他人的進行整合,從而來互相填補一些功能上的空白。例如Teradata Aster現在有個能與KNIME整合的拓展應用,來讓用戶能使用KNIME工作流編輯器并包含Aster Analytics功能在這些工作流中。
要點三:供應商規模和產品整合
我們還可以以供應商規模進行比較。稱之為巨型供應商的企業的數據分析工具只是大型工具庫中的一個產品。
大型供應商提供的數據分析工具是一個更大的工具生態系統中的一部分。一般來說,巨型供應商的產品至少是有一定整合度且是可以一起使用的。除此之外,有些人由于穩定性和一致的客戶服務而選擇規模大的供應商。從另一方面來說,你可能只能通過購買一個更大的軟件來獲得這些數據分析工具。
小規模供應商如KNIME、Alteryx和RapidMiner通常通過授權和支持一小部分的數據分析產品來盈利。你可能會能與他們產品管理和創新團隊密切聯系,從而能夠影響產品規劃或提高功能性。
小規模供應商可能對包含在服務合同中的價格和功能更加靈活。不過必須要認識到與小供應商合作會有穩定性、資源支持資源、被收購方面的風險,影響客戶關系。
大規模供應商明顯對與其他系統整合的用戶需求反應迅速,盡管通常專注于各自的產品庫中的產品。比如,SAP Predictive Analytics優化了與SAP HANA和BusinessObjects Cloud的整合。SAS Enterprise Miner增加了節點以在開放SAS、云端就緒和內存Viya環境中執行代碼。Microsoft提供SQL Server R Services,這個R程序能
與SQL Server并列運行并能使用戶整合Microsoft R Server數據到SQL Server以及Microsoft其他的商業洞察工具。
要點4:購買及維護預算
幾乎所有的供應商都提供產品的不同版本,采購成本和運營成本各不相同。IBM、Oracle、RapidMiner、Teradata和Microsoft提供不同版本的產品,費用與功能、性能和限制(被分析的數據量或能被使用的進程節點)相關 。
KNIME和RapidMiner提供免費和開源的產品版本,在支持服務或是在支持企業級應用的版本上收費。KNIME、RapidMiner和Alteryx相比較而言對數量少的用戶收費更低。而SAS或SAP必須通過聯系他們來詢問價格選項。
結語
數據分析軟件的選擇非常多,希望通過本篇文章,你了解到了數據分析軟件能為企業帶來的優勢以及如何區分所列的這些工具。記得挑選數據分析軟件的時候,一定要參考以上4大要點哦!