數據分析師需要掌握哪些技能
發布時間:2021-06-01 14:04:09 已幫助:117人 來源:北京AAA教育
SQL基礎之所以重要,是因為數據分析師分析的數據大多都是從數據庫中提取而來的。有良好的SQL功底并能熟悉使用,不僅能提取到需要的數據,還能大大提高效率。盡管有部分數據可以通過報表等其他途徑獲得,但絕大多數的數據仍需要通過自己寫SQL語句。
創建分析型數據庫比精通多種算法更為重要。
如何創建分析基礎是數據分析師需要培養的最重要技能之一。將事務性數據轉換為可以分析的數據,需要真正了解我們正在處理的業務。這一點,加上批判性思維,是正確界定問題的基礎。
數據分析師經常需要target來訓練他的模型,但是事務性數據庫通常沒有準備好target。數據分析師必須明確客戶何時需要放棄服務,以便創建客戶流失模型。并且需要定義什么是不良付款行為,即使難以預測到。創建目標和分析數據一致性并不是那么容易,它需要一個長期的調查過程。
事實上,數據分析的價值遠大于將數據輸入模型并評估性能指標的即插即用過程。同時對專業業務的理解和分析是做好一組數據分析的關鍵因素!
要熟練使用Excel
Excel可以進行各種數據的處理、統計分析和輔助決策操作,作為常用的數據處理和展現工具,數據分析師除了要熟練將數據用Excel中的圖表展現出來,還需要掌握為生成的圖表做一系列的格式設置的方法,如:系列格式美化、三維格式美化,以及坐標軸和網格線設置等,圖表可以與函數或宏等功能一起聯用,制作出模擬圖表或帶有交互效果的高級圖表,比如在中國地圖上標注各省的人口分布等,實現這些能得到更好地數據分析和查看效果。
Excel里面自帶的數據分析功能,很大程度上能完成專業統計軟件(R、SPSS、SAS、Matlab)的數據分析,這其中括描述性統計、相關系數、概率分布、均值推斷、線性、非線性回歸、多元回歸分析、時間序列等內容。熟悉使用Excel的各項功能對一名優秀的數據分析師來說非常重要。
要有統計學基礎
統計學是收集、處理、分析、解釋數據并從數據中得出結論的科學,其中的理論及依據就是數據分析的理論和依據。統計學是數據分析的理論基礎,可以使數據分析更加系統化,以系統的數據科學作為數據分析的指導,才會更好地為數據分析服務。
沒有統計學基礎的分析師的職業發展之路不會長遠,因為其在中可能會常常遇到不知道該用什么方法找尋數據規律的瓶頸,因此掌握數據分析的統計學基礎知識是成為一名優秀數據分析師的基礎,這也是在招聘數據分析師崗位時要求應聘者具有統計學知識的原因。當然,如果不是統計或數學專業,分析師還可以通過自學統計學相關書籍的方法學習。
統計學知識主要含:用于集中趨勢分析的平均數、中數、眾數;用于離中趨勢分析的全距、四分差、平均差、方差、標準差;研究現象之間是否存在某種依存關系的相關分析;確定兩種或兩種以上變數間相互依賴的定量關系的回歸分析;揭示同一個變量的各個類別之間的差異,以及不同變量各個類別之間的對應關系的關聯分析、R-Q型因子分析;研究從變量群中提取共性因子的因子分析;用于兩個及以上樣本均數差別的顯著性檢驗的方差分析;概率及分布、參數估計、假設檢驗等經典統計學內容。
至少熟悉并精通一種數據挖掘工具和語言
以R語言為例,R編程語言在數據分析與機器學習領域已經成為一款重要的工具。R作為腳本語言憑借其良好的互動性和豐富的擴展資源可以方便地解決大部分數據處理、變換、統計分析、可視化的問題,并可以重現所有的細節。
R的優勢在于有羅萬象的統計函數可以調用,特別是在時間序列分析方面,無論是經典還是前沿的方法都有相應的可以直接使用。
因此,掌握R語言可以提高整體的生產力。然而,要成為一名優秀的數據分析師,僅使用一門語言遠遠不夠,還需要修改數據挖掘語言的程序或模型,因為現有的程序或模型有局限性,在前期數據處理上還是不夠自由,如異常值的處理、變量處理等,而自己寫代碼編程也可以根據自己的需求進行編寫,實現更多的個性化需求。
一名優秀的數據分析師,還應該主動熟悉業務。
以游戲機構為例,如果不熟悉游戲產品制作流程、系統架構、基本運營思路,不知道游戲玩家的基本游戲行為和情感訴求,那么數據分析就相當于空中樓閣,所以要多了解策劃人員的游戲設計理念、運營人員的版本計劃,抓住一切機會多觀察和學習其思路和方法,并參與其具體的實施過程,這樣才能逐步積累真正的游戲業務經驗。
現實情況中很多數據分析師都沒有這樣的經歷,也就沒有相關的經驗積累,所以他們大多數的產出主要是一些非產品相關的平臺數據分析內容和結論;當然,筆者相信并非他們不愿意去積累,而是受限于企業中的一些機制,比如大多數數據分析師是在技術部門或平臺部門,而非具體的產品部門,少有切實深入到業務現場的機會。
在這種環境下,更需要自己主動去了解業務,多主動和產品部門聯系,若脫離行業認知和業務背景,即使有很好的統計學功底,分析的結果也往往只能停留在數據解讀層面,甚至出現因為不了解業務背景而使結論錯誤的情況。
從另外一個角度來說,懂業務也是數據敏感的體現,不懂業務的數據分析師,看到的只是一個數字。反之,懂業務的數據分析師,則看到的不僅僅是數字,他明白這個數字代表什么意義,更能針對數據分析結論提出有針對性的建議,對產品或者企業來說都是非常有價值的。
懂業務是做數據分析師的基本要求,這種觀點對任何其他行業也是一樣的道理。優秀的分析師不僅要懂業務,而且要非常熟悉業務。
撰寫報告的能力對成為一名優秀的分析師來說也非常重要。
即便有嚴謹的分析思路和有價值的數據資料,如果不能將其寫成報告,或者寫的報告未能準確清楚地表達出數據中隱含的規律,那數據的價值將大打折扣。一份好的分析報告,數據資料是功底,報告的框架是支柱,報告的格式是軍裝,獨特見解是亮點,預測方法是刀槍,正確的判斷是見證。
在撰寫報告時,深入地思考,深入分析,邏輯嚴謹,結論有說服力,能提前預測數據趨勢,能從問題中引申出解決方案,提出有指導意義的分析建議,這些都是一名優秀的分析師所體現的特質。
除了以上的硬實力,數據敏感力、邏輯思維能力、歸納能力、批判性思維能力、交流溝通能力、責任力這些軟性的技能也是優秀分析師必須具備的素質。另外,如果分析師能站在更高的角度思考問題,有管理者的思維,則能在眾多分析師中能脫穎而出。
以上就是本章的全部內容,希望對大家有所幫助。如果感興趣的話,可以咨詢我們的在線老師了解報名哦!