很多做數據分析或者剛接觸數據分析的小伙伴,不知道怎么做數據分析?一點思維都沒有,今天小編給大家盤點2萬名數據分析師常用的數據分析方法有哪些?希望看完此文的小伙伴,有一個清晰的數據分析思維。
數據分析思維混亂的小伙伴,需要宏觀的方法論和微觀的方法來指導。
方法論和方法有什么區別?
方法論是從宏觀角度出發,從管理和業務的角度提出的分析框架,指導我們接下來具體分析的方向。方法是微觀的概念,是指我們在具體分析過程中使用的方法。
數據分析方法論
數據分析的方法論很多,這里我給大家介紹一些常見的框架。
①PEST分析法:PEST 為一種企業所處宏觀環境分析模型,從政治(Politics)、經濟(Economy)、社會(Society)、技術(Technology)四個方面分析內外環境,適用于宏觀分析。四點因素也被稱之為“pest有害物”,PEST要求高級管理層具備相關的能力及素養。PEST分析與外部總體環境的因素互相結合就可歸納出SWOT分析中的機會與威脅。PEST/PESTLE、SWOT 與 SLEPT 可以作為企業與環境分析的基礎工具。
②SWOT分析法:從優勢(Strength)、劣勢(Weakness)、機遇(Opportunity)、威脅(Threat)四個方面分析內外環境,適用于宏觀分析。SWOT分析法是用來確定企業自身的競爭優勢、競爭劣勢、機會和威脅,從而將公司的戰略與公司內部資源、外部環境有機地結合起來的一種科學的分析方法。運用這種方法,可以對研究對象所處的情景進行全面、系統、準確的研究,從而根據研究結果制定相應的發展戰略、計劃以及對策等。
③5W2H分析法:從Why、When、Where、What、Who、How、How much 7個常見的維度分析問題。廣泛用于企業管理和技術活動,對于決策和執行性的活動措施也非常有幫助,也有助于彌補考慮問題的疏漏。
④4P理論:經典營銷理論,認為產品(Product)、價格(Price)、渠道(Place)和促銷(Promote)是影響市場的重要因素。
⑤AARRR:增長黑客的海盜法則,精益創業的重要框架,從獲取(Acquisition)、激活(Activition)、留存(Retention)、變現(Revenue)和推薦(Referral)5個環節增長增長。AARRR在應用推廣運營各個層次(各個階段)需要關注的一些指標。在整個AARRR模型中,這些量化指標都具有很重要的地位,而且很多指標的影響力是跨多個層次的。及時準確地獲取這些指標的具體數據,對于應用的成功運營是必不可少的。
數據分析的方法論很多,這里不能一一列舉;沒有最好的方法論,只有最合適的。
從數據分析方法論也可得知,數據分析的意義在于將雜亂無章的數據轉化為清晰可見的可視圖,從而進行精準決策。“大數據時代,技術和分析哪個更重要”一文中也闡述了分析的重要性。
數據分析的七個方法
趨勢分析是最簡單、最基礎,也是最常見的數據監測與數據分析方法。通常我們在數據分析產品中建立一張數據指標的線圖或者柱狀圖,然后持續觀察,重點關注異常值。
在這個過程中,我們要選定第一關鍵指標(OMTM,One Metric That Metter),而不要被虛榮指標(Vanity Metrics )所迷惑。
以社交類APP為例,如果我們將下載量作為第一關鍵指標,可能就會走偏;因為用戶下載APP并不代表他使用了你的產品。在這種情況下,建議將DAU(Daily Active Users,日活躍用戶)作為第一關鍵指標,而且是啟動并且執行了某個操作的用戶才能算上去;這樣的指標才有實際意義,運營人員要核心關注這類指標。
多維分解是指從業務需求出發,將指標從多個維度進行拆分;這里的維度包括但不限于瀏覽器、訪問來源、操作系統、廣告內容等等。
為什么需要進行多維拆解?有時候一個非常籠統或者最終的指標你是看不出什么問題來的,但是進行拆分之后,很多細節問題就會浮現出來。
舉個例子,某網站的跳出率是0.47、平均訪問深度是4.39、平均訪問時長是0.55分鐘。如果你要提升用戶的參與度,顯然這樣的數據會讓你無從下手;但是你對這些指標進行拆解之后就會發現很多思路。
下面展示的是一個產品在不同操作系統下的用戶參與度指標數據。
仔細觀察的話,你會發現移動端平臺(Android、Windows Phone、IOS)的用戶參與度極差,表現在跳出率極高、訪問深度和平均訪問時長很低。這樣的話你就會發現問題,是不是我們的產品在移動端上沒有做優化導致用戶體驗不好?在這樣一個移動互聯網時代,這是非常重要的一個問題。
用戶分群主要有兩種分法:維度和行為組合。第一種根據用戶的維度進行分群,比如從地區維度分,有北京、上海、廣州、杭州等地的用戶;從用戶登錄平臺進行分群,有PC端、平板端和手機移動端用戶。第二種根據用戶行為組合進行分群,比如說每周在社區簽到3次的用戶與每周在社區簽到少于3次的用戶的區別,這個具體的我會在后面的留存分析中介紹。
正如前面所說的,用戶行為數據也是數據的一種,觀察用戶在你產品內的行為路徑是一種非常直觀的分析方法。在用戶分群的基礎上,一般抽取3-5個用戶進行細查,即可覆蓋分群用戶大部分行為規律。
我們以一個產品的注冊流程為例:
用戶經歷了如下的操作流程:【訪問官網】-【點擊注冊】-【輸入號碼】-【獲取驗證碼】。本來是非常流暢的一個環節,但是卻發現一個用戶連續點擊了3次【獲取驗證碼】然后放棄提交。這就奇怪了,用戶為什么會多次點擊驗證碼呢?
這個時候我建議您去親自體驗一下您的產品,走一遍注冊流程。你會發現,點擊【獲取驗證碼】后,經常遲遲收不到驗證碼;然后你又會不斷點擊【獲取驗證碼】,所以就出現了上面的情況。
絕大多數產品都或多或少存在一些反人類的設計或者BUG,通過用戶細查可以很好地發現產品中存在的問題并且及時解決。
漏斗是用于衡量轉化效率的工具,因為從開始到結束的模型類似一個漏斗,因而得名。漏斗分析要注意的兩個要點:
第一,不但要看總體的轉化率,還要關注轉化過程每一步的轉化率;
第二,漏斗分析也需要進行多維度拆解,拆解之后可能會發現不同維度下的轉化率也有很大差異。
某企業的注冊流程采用郵箱方式,注冊轉化率一直很低,才27%;通過漏斗分析發現,主要流失在【提交驗證碼】的環節。
經過了解發現,郵箱驗證非常容易出現注冊郵箱收不到郵件的情況,原因包括郵件代理商被屏蔽、郵件含有敏感字被歸入垃圾郵箱、郵件送達時間過長等等。既然這么多不可控因素影響注冊轉化率,那就換一種驗證方式。換成短信驗證后,總體轉化率提升到了43%,這是非常大的一個增長。
留存,顧名思義就是新用戶留下來持續使用產品的含義。 衡量留存的常見指標有:次日留存率、7日留存率、30日留存率等等。我們可以從兩個方面去分析留存,一個是新用戶的留存率,另一個是產品功能的留存。
第一個案例:以社區網站為例,“每周簽到3次”的用戶留存率明顯高于“每周簽到少于3次”的用戶。簽到這一功能在無形中提升了社區的用戶的粘性和留存率,這也是很多社群或者社區主推這個功能的原因。
第二個案例:首次注冊微博,微博會向你推薦關注10個大V;首次注冊LinkedIn,LinkedIn會向你推薦5個同事;申請信用卡時,發卡方會說信用卡消費滿4筆即可抽取【無人機】大獎;很多社交產品規定,每周簽到5次,用戶可以獲得雙重積分或者虛擬貨幣。
在這里面“關注10個大V”、“關注5個同事”、“消費4筆”、“簽到5次”就是我想說的Magic Number,這些數字都是通過長期的數據分析或者機器學習的方式發現的。實踐證明,符合這些特征的用戶留存度是最高的;運營人員需要不斷去push,激勵用戶達到這個標準,從而提升留存率。
A/B測試是為了達到一個目標,采取了兩套方案,一組用戶采用A方案,一組用戶采用B方案。通過實驗觀察兩組方案的數據效果,判斷兩組方案的好壞。在A/B測試方面,谷歌是不遺余力地嘗試;對于搜索結果的顯示,谷歌會制定多種不同的方案(包括文案標題,字體大小,顏色等等),不斷來優化搜索結果中廣告的點擊率。
這里需要注意的一點,A/B測試之前最好有A/A測試或者類似準備。什么是A/A測試?A/A測試是評估兩個實驗組是否是處于相同的水平,這樣A/B測試才有意義。其實這和學校里面的控制變量法、實驗組與對照組、雙盲試驗本質一樣的。
三、流程——宏觀、中觀和微觀
① 宏觀
1.中國古代樸素的分析哲學
其實數據分析自古有之,中國古代很多名人從事的其實就是數據分析的工作;他們的名稱可能不是數據分析師,更多的是“丞相”、“軍師”、“謀士”,如張良、管仲、蕭何、孫斌、鬼谷子、諸葛亮。
他們通過 “歷史統計”-“經驗總結”-“預測未來” 為自己的組織創造了極大的價值,這是中國古代樸素的分析哲學的重要內容。
2.精益創業的MVP理念
風靡硅谷的精益創業,它推崇MVP(最簡化可行產品)的理念,通過小步快跑的方式來不斷優化產品、增長用戶。
在運營工作中,我們要大膽嘗試,將想法轉化成產品和運營方法。然后分析其中的數據,衡量產品或者運營的效果。如果好的話保持并大力推廣,如果不好的話總結問題及時改進。在“構建-“衡量”-“學習”的不斷循環中逐漸優化,這個流程是非常適合運營工作的。
② 中觀
例如,具體的分析流程:1.明確分析目的和思路 →2.數據收集 →3.數據處理 →4.數據分析 →5.數據展現 →6.報告撰寫。這個流程只是從“數據”的角度闡述了前后的流程,并未結合業務實際;而且它將數據分析的落腳點定位于“報告撰寫”是具有誤導性的,因為數據分析的最終目的是為了指導實踐,而不是寫一份報告。
但是這個流程仍具有參考價值,尤其是 “明確分析目的和思路” 對于新手入門具有一定的指導意義。
③ 微觀
下面介紹的是一個非常詳細的分析流程,借助于一定的分析工具,我們可以按照這個思路對您的網站/APP進行細致入微的分析。它的前提是用數據分析工具做好數據采集和監控工作,把精力集中在業務分析上。
這個流程的核心是“MVP”的理念,“發現問題”-“設計實驗”-“分析結果”,通過數據來不斷優化產品和運營。
四、應用——統計和分析
案例1:搭建數據分析體系
小張今年剛畢業,在某公司從事新媒體工作,負責微信的日常運營。小張并不清楚微信運營的核心目的,嘗試了很多方法,原創、翻譯、改寫了很多文章發布在微信上,但是閱讀量時高時低,總體一般。
經理讓小張想辦法改進一下微信運營,提高微信的粉絲數和閱讀數;但是張三毫無頭緒,無從下手。這是很多運營真實的寫照,瑣碎的工作容易讓人忘記思考,這很可能就發生在你我的身邊。
我們從數據分析的角度對這個案例進行了診斷,總結了小張存在的這些問題:
不清楚自己需要關注哪些核心指標;
不清楚目標用戶的特征(用戶屬性、用戶畫像等);
對自己過往工作缺乏系統分析(數據采集、監測和分析)。
從業務增長的角度出發,我給小張量身定做了一套數據分析體系,配合其內容工作的開展。
第一點,內容定位。
運營需要明確知道自己的目標或者KPI,然后選擇一個核心關鍵指標(OMTM)進行監測。如果是創業公司,初期可能需要拉新,那么核心指標是注冊用戶數或者新訪問用戶數。如果是資訊媒體,注重影響力和覆蓋面,那么核心指標應該是微信閱讀數或者網頁PV。
第二點,用戶畫像。
無論是哪一種運營崗位,都需要明確知道自己的(目標)用戶是那些人?這些人都有哪些特征,他們的關注點和痛點是什么?如果你的用戶是產品經理,那么可以嘗試爬蟲抓取產品經理網站上有關的問題,然后做文本分析:這是定量層面的分析。
同時,通過調查訪問和問卷調研,獲取更加深入的用戶特征信息:這是從定性層面的分析。
第三點,持續監測。
借助數據分析工具,對核心關鍵指標(OMTM)進行持續監測。對于指標異常情況,我們需要及時分析和改進。
第四點,數據分析。
統計和分析過往內容的數據,找出哪些內容、哪些標題、哪些形式、哪些渠道的效果更好,然后朝這方面不斷優化。
案例2:分析業務核心指標
電子郵件營銷是現在很多企業仍在采用的營銷和運營方式,某互聯網金融企業通過EDM給新用戶(有郵件地址但是未注冊用戶)發送激活郵件,一直以來注冊轉化率維持在20%-30%之間,8月18日注冊轉化率暴跌,之后一直維持在10%左右。這是一個非常嚴重的衰退,需要立即排查原因。
EDM渠道注冊轉化率涉及到太多的因素,需要一個一個排查,數據分析師幫運營羅列了可能的原因:
技術原因:ETL(數據抽取、轉化、載入)出現問題,導致后端數據沒有及時呈現在BI報表中;
宏觀原因:季節性因素(節假日等),其余郵件沖擊(其余部門也給用戶發郵件稀釋了用戶的注意力);
微觀原因:郵件的標題、文案、排版設計,CTA設計,注冊流程設計。
一個簡單的業務指標,會影響到它的因素可能是多種多樣的,所以我們需要對可能涉及到的因素進行精細化衡量才能不斷優化。最后發現,產品經理在注冊環節添加了『綁定信用卡』,導致注冊轉化率大幅度下降。
五、學習——業務、工具和資源
業務層面
數據分析并沒有想象中的高不可及,掌握好相應的概念、思路、流程,運營都可以做好數據分析。這里要著重強調一點,數據分析的目的是指導業務實踐;脫離實踐的數據分析、為分析而分析的數據分析都是在耍流氓。
不同于職業的數據分析師和數據科學家,運營人員做好數據分析的前提是嫻熟的業務理解。從業務的角度來說,數據不是數字,它是用戶的心聲。運營人員要從數據中發現問題,不斷優化,提升用戶體驗、為用戶創造更多的價值。
工具層面
磨刀不誤砍柴工,做好數據分析工具必不可少。我匯總了下面幾種工具,運營可以結合自己的實際需要采用。
Excel 是最常見、最基礎的數據分析工具,Excel 里面的圖表、函數、透視表能滿足大家基本的需求。Access 是微軟 office 系列套裝的一部分,是一種小型的關系數據庫;當excel數據量很大、表格之間各種關聯、查詢、更新頻繁的時候,Access就是一種非常不錯的選擇。
Python是一種高級的編程語言,近年來發展很快,它可以用來做數據分析、編程或爬蟲;R語言是一種數據分析工具,在統計學中廣泛使用。目前,Python被廣泛用來編寫爬蟲程序,獲取網上的信息,這是對運營人員非常有幫助的。
Google Analytics、百度統計是常見的網站流量分析工具
Mixpanel、Heap 、Datatist 屬于用戶行為數據分析工具,較前者功能更加豐富、分析更細致。
資源層面
運營入門數據分析,并不需要學習多么復雜的數學知識理論,更多的是將業務操作和數據分析結合起來。CPDA數據分析師課程設計初衷便是透過數據,決策企業戰略,是數據分析“高段位”課程,CPDA數據分析課程也是多年數據分析項目經驗老師的精華結晶。