工欲善其事,必先利其器。 – 孔子
想要做好數據分析,除了具備數據分析的知識,還要透過工具軟體與程式的協助,才能達成目標。此篇主要是要分享在商業智慧(BI)軟體中,為什麼要選擇Power BI。但在這個問題之前,我們需要知道數據分析到底需要會多少工具軟體與程式語言?
數據分析到底需要會多少工具軟體與程式語言?
根據Dax個人的工作實務見解,你可能需要會:
Excel:企業最常見到的表格文件,不會使用是不行的。
SQL(資料庫):想從資料庫拿資料出來? SQL是一定需要具備的,常見的關聯式資料庫如MySQL、Oracle與MSSQL。
Power BI 或 Tableau (自助式商業智慧軟體):在企業中會經常需要製作資料視覺化的日常性報表,以追蹤數據指標(KPI),隨時關注企業的營運狀況。我們需要發佈與分享報表給相關的業務人員,並且進行週期性的更新,最還需要隨時根據需求改變數據儀表板所觀察的指標。常見的商業智慧軟體有Power BI與Tableau,在這段任務中都是最適合的工具軟體。
Python 或 R (程式語言):實務中若數據儀表板的指標發生了問題(如為什麼本月會員流失率比上個月會員流失率還多?),Dax會先使用自助式BI軟體進行簡單的分析,在無法找出原因的情況下,會再使用Python與R去使用更進階的方法來分析,如統計檢定、關聯法則、集群分析、決策樹、隨機森林、SVM、KNN…等,來找出導致問題發生的根本原因。程式語言除了使用在進階分析外,Dax也會使用Python來進行網路爬蟲,從網頁上爬取資料,以進行後續的分析。
Spark 與 Hadoop(分散式處理語言):當資料量過於龐大時,一般的資料處理運算方式已無法負荷日常性的數據分析任務,這時候可能還需要會使用Spark與Hadoop,才能像平時一樣解決日常的數據分析問題。
從哪一個環節入門
註1:SQL是必學的語言,所以不在上述圖表中(為何資料科學家需要學習 SQL)
註2:Dax未學習過Spark與Hadoop,不誤人子弟,所以也不在上述圖表中
註3:SPSS、SAS這些套裝軟體的功能,大部分都可以被R與Python取代,所以就沒有放在上述圖表中
竟然有這麼多種工具軟體與程式語言需要學習,至少還是要先選一種入坑吧! Dax將自己學習這些工具軟體與程式語言的時間與實際為工作帶來的價值,用圖表的方式分享給大家! 若大家有持不同的意見與看法,非常歡迎一起討論。
一般數據分析的階段有四種,分別是現況分析、原因分析、預測分析,指示分析,根據Dax小小的企業實戰經驗中,最常使用到的分析是現況分析與原因分析,也就是藉由一些指標(KPI)來監控企業營運的狀況,當指標不正常時,我們就要透過簡單數據分析方式來找出改變這些指標的原因。
在上述提到的兩個階段中,Excel、Power BI與Tableau是非常適合的工具軟體,學習Excel的時間相當短,可能幾周到幾個月就可以上手,因此CP值相當高。
然而Excel處理的資料有限(100萬筆以內),且在數據分析的流程中都需要手工進行,非常的不智慧。若想學習VBA來自動化的朋友,我自己是比較推薦乾脆就直接學Python或R了,學習成本是很接近的,況且微軟有在考慮將Python納為Excel的正式腳本語言。( Microsoft Considers Adding Python as an Official Scripting Language to Excel | How can we improve Excel for Windows (Desktop Application)? )
綜合以上觀點,不彷也可以從Power BI或Tableau開始學習,透過拖拉點選的方式來操作,上手速度更快,在有數據分析的基礎知識下,更快的為企業帶來價值。
一般數據分析的流程會從資料獲取、資料清理、資料建模到資料分析與資料視覺化,Tableau在資料清理的部分較弱,雖然在2018年推出Tableau Prep後,補強了資料清理的部分,但資料清理能力還是無法與Power BI 比較,且最重要的是Power BI Desktop是免費的(功能全開放,除了雲端的部分服務),Tableau是需要付費的(免費版限制許多功能)。所以初步篩選之下,我們選擇了Power BI當作是進入數據分析領域的入門磚,然而選擇Power BI的優勢不止如此,以下我們再看看更多選擇Power BI的理由。
為什麼選擇Power BI | 選擇Power BI的五大理由
多達150種的自定義圖表
在Gartner的評選中,是BI產品的領導者
看了以上的觀點,大家可能多多少少可以理解為什麼要選擇Power BI了,如果大家有持不同的看法,歡迎一起討論,讓我們一起從數據迷霧裡跳出來!
更多閱讀
Magic Quadrant for Analytics and Business Intelligence Platforms
2017 Planning Guide for Data and Analytics – Gartner
認識Power BI系列文章
- 什麼是Power BI ? | 為數據分析而生的軟體工具!
- 為什麼選擇Power BI? | 數據分析需要選擇的工具與程式語言
- Power BI 的組成有哪些? | 從本地端到雲端的數據分析軟體
- 自助式BI的時代來臨,人人都將與數據為伍!
我該去哪裡學習Power BI?
Power BI數據分析實戰-邏輯與資料視覺化 (Power BI 數據工坊所推出的課程)
這堂課將會是一堂融合商業思維、數據分析心法與 Power BI 實際操作的課程,將會帶大家用Open Data完成3個數據儀表板,目前已經上線了,若對課程有興趣歡迎一起加入學習!
Microsoft Power BI 引導式學習 (官方學習文件)
目前市面上比較少Power BI的教學,官方的教學算是入門級別完整的課程,缺點就是比較深澀不好懂,是以功能為導向的教學方式,而且沒有中文字幕阿,不過還是建議若是聽的懂英文,也可以去聽聽看,熟悉一下Power BI的操作方式。
Taiwan Power BI User Group (Facebook社團)
目前台灣也沒有相應的Facebook社團讓Power BI的使用者可以一起討論使用過程中問題,因此Dax建立了Taiwan Power BI User Group,歡迎大家一同加入,有任何關於Power BI的事情都可以在上面討論。
One Reply to “為什麼選擇Power BI ? | 數據分析需要選擇的工具與程式語言”
Comments are closed.