python數據分析 | 重新認識數據分析中的三劍客?
數據分析三劍客
數據分析就是讓數據數據產生價值,通過數據的篩選、匯總等等操作從而分析或預測出事件的變化規律。python語言在數據分析領域同樣扮演者比較強大的角色,其中被樹枝的主要有三個擴展庫用來做數據分析,分別是:pandas、numpy、matplotlib,其中,pandas主要是用作提煉數據使用、numpy則提供強大的科學計算、matplotlib負責數據可視化的操作,三者并成為python數據分析界的三大劍客。pandas數據提煉庫
在之前操作excel數據時已經接觸過了pandas進行數據提煉的使用,它可以直接將excel文檔中的數據讀取過來并轉換成python中的dataframe對象。直接對dataframe對象進行操作便可以完成對數據的操作,同時他也支持除excel之外的一些文件格式的數據讀取、提煉的操作等,比如csv文件格式的數據提煉。提取符合條件的數據供后續的分析使用。numpy科學計算庫
numpy是一個處理數組模塊、更是數據分析過程的核心,并且可以支持二維數組、實現矩陣等。1)數組的創建
2)有關數組的屬性和函數
3)數組元素的獲取--普通索引、切片、布爾索引和花式索引
4)統計函數與線性代數運算
5)隨機數的生成matplotlib數據可視化庫
matplotlib是數據可視化重要的工具,將分析的數據通過折線圖、直方圖、散點圖等可視化的方式直接將數據的變化展示在用戶的面前,給用來帶來更直觀的感受。總結
對數據分析三劍客有一個簡單的認識,后續將逐步在編程實例中引入pandas,numpy,matplotlib的使用。
本站僅提供存儲服務,所有內容均由用戶發布,如發現有害或侵權內容,請
點擊舉報。