數據分析, 職涯點滴

數據分析的3大陷阱,跳脫無效努力的工作循環

數據分析的3大注意事項,避免無效努力

這一篇來聊聊我的工作日常:數據分析專案。專案沒有想像中的複雜,簡單來說就是為了解決一些商業上遇到的問題,所以需要數據分析師幫忙用數據來找到問題、提出洞察、發掘可能的解決方案。

簡單的數據專案可能是機動性的,例如說,最近一週公司營收下滑10%,那麼原因會是什麼?會建議後續怎麼處理?可能是需求單位想問最近公司的商品銷售跟庫存狀況怎麼樣?哪些品項可能需要特別留意是不是會滯銷?。比較複雜的數據專案可能是推動一個系統導入 、API開發,或是與第三方合作推動數據整合等,比較複雜的專案下次有機會再來分享。

這篇文章主要想分享的是商業問題的數據分析,來分享新手數據分析師容易踩到的陷阱。

數據分析陷阱1:埋頭苦做卻做白工

這個狀況常發生在數據分析前,因為沒有和需求單位溝通清楚,所以沒有讓數據分析報告發揮應有的價值,這也是我剛擔任數據分析師時常踩到的地雷之一,分享幾個我曾經犯過的錯誤:

  1. 沒有確認維度、指標的詳細定義
    以計算成效的例子來說,光是產品的銷售金額,不同單位就會有不同的銷售金額定義,有些單位會想看到以原價計算的銷售金額、有些單位會想看到公司實收的銷售金額是多少,而以財務的角度又可能要看到未稅的銷售金額是多少。從銷售金額的例子就可以發現,光是一個欄位,不同單位就有不同的計算方式,這也就是當沒有確認需求時,就很容易做白工。

  2. 沒有確認任務的執行先後順序
    做數據分析就跟所有工作一樣,不免還是會面臨分析需求量大,遇到不同需求部門同時都要數據分析報告的時候遇到這種狀況我的作法原本是先提需求的先做,但常會發生先提需求的單位不一定比較急迫,反倒是後提需求單位因為比較急著要資料分析,而頻頻被後提需求的單位催促。這種狀況難免會讓人覺得有點強人所難,畢竟如果很急,那怎麼不早一點開需求呢?

    隨著接觸的數據專案愈來愈多,我也發現每個急迫數據需求的背後可能都伴隨著「成長機會」或是「公司損失」,例如說產品單位想知道最近為什麼轉換率變大幅下滑,一來是問題是即時發生的,所以他們可能過去沒預想到,所以沒辦法提早提需求,二來則是這需求的背後,牽涉到的影響可能是每天幾百萬的損失,不可能等到一兩週後才來應對。
    所以,面對各種不同的任務,怎麼樣辨別並協調優先順序,也是數據分析師很重要的任務之一。

  3. 忽略 Step by Step 的問題聚焦
    有時候會遇到一些需求很模糊的大問題,例如說:怎麼讓營收提升20%、怎麼讓總體庫存商品數可以降低15%,怎麼讓退貨率可以減少10%等。這些問題本身很大,要達成這些成果有百百種方式可以達到,所以在還沒有聚焦具體問題前,貿然跳下去分析資料細節,就很可能做白工。例如說我曾經幫忙分析了退貨率高居不下的原因,我以產品品質出發,細節分析到所有退貨原因跟個別產品,最後才發現需求單位想先從消費者的角度處理。

    會發生這樣的問題不一定是誰對誰錯,只能說觀點不同、對於問題處理的優先順序也不同。所以,遇到這種「大議題」我都更傾向先分析大方向、大趨勢,列出幾個可能可以往下鑽研的數據分析方向,最後等待和需求團隊開會後,再往下鑽研細部的資料,以免花費太多時間在需求單位現階段不需要的資料分析上。

總結來說,數據分析的第一個陷阱,我認為是數據分析前的「需求溝通」,不論是沒有清楚定義要解決的問題、沒有確認好分析的資料範圍,或是沒有溝通好執行順序,都可能導致最後做白工。「數據分析始終是為了解決商業問題而存在」,既然要解決商業問題,就更需要花時間了解第一線的業務需求、確認分析的方向能不能幫助到需求單位。

最後,持續要問自己:數據是給誰看的?這份數據真的對需求單位有價值嗎?這樣就比較能避免只有辛勞而沒有功勞的囧境了。

數據分析陷阱2:在數據對齊上鑽牛角尖

這種情況比較常發生在剛進一家公司,還不熟悉產業數據、資料庫的資料表、資料表間的關聯時最容易發生。以我自己的經驗來說,我服務過的公司就有分正式機的資料、備份機的資料、系統的原始資料、經過調整規則後的資料,甚至不同需求單位、不同數據分析需求都會有不同的資料表。

為什麼要分這麼多不同的資料呢?主要原因是因為資料備份以及符合需求單位的數據使用需求,例如說系統的原始資料可能是未經整理的 RAW DATA,不能直接拿來使用,又或者系統原始資料定義和需求單位的慣用定義不一樣,所以需要調整。至於為什麼不同數據分析需求需要不同資料表呢?因為資料存放與計算空間有限,,不太可能所有資料都是使用所有欄位的資料,可能會移除掉一些不需要使用的資料欄位或是讓資料先做完加總計算再提供給需求單位使用。

這也就是為什麼,在不同資料表裡面可能有同樣的欄位,但是計算完後數字卻對不齊,遇到這種狀況,與其自己陷入計算驗算的小圈圈,自己瞎猜要使用哪一份資料,都不如直接找負責處理資料表的工程師確認會更有效率和準確。例如說,到底資料底的資料範圍是什麼?資料計算的區間是什麼時候到什麼時候?各個欄位又是怎麼定義的,資料更新的時間是什麼時候等,都是常見需要和工程團隊討論確認的問題。

直白的詢問求助,一來可以減少在不必要的環節消耗太多時間,二來則是可以正確的理解資料計算方式,讓數據處理的過程更加順利。當然,如果你有系統權限可以看到最原始的製表程式碼,那也是非常推薦的解決辦法。

數據分析陷阱3:數據分析後,然後呢?

最後,當數據分析完後,不是提交數據結果、把 BI 數據儀表板的共享連結傳出去就沒事了,如果要讓數據發揮價值,適當的簡報說明、互動式儀表板的使用教學,都比起做完數據分析本身更重要!

為什麼這樣說呢?因為我就曾經遇過需求單位不會使用BI報表,錯誤的解讀BI報表的數字的情況。例如說,我就曾經被問過,為什麼 Tableau (BI Dashboard)算出來的營收金額和我在 Google Analytics 裡面看到的營收金額不一樣呢?沒錯,當數據儀表板的數據沒有好好解釋,沒有統一數據核對的基準,就非常容易發生這種拿蘋果去比較橘子的溝通囧境。

所以怎麼讓需求單位知道 BI Dashboard 的效益?為什麼要用 BI Dashboard 當作數據統一計算的基準?以及為什麼解釋不可以拿 BI Dashboard的數據去跟外部數據比較?怎麼使用BI 儀表板的各種功能?數據什麼時候更新等,這些問題看似微小,但是都是影響需求單位會不會真正用上數據分析結果的關鍵。

比起自動化的儀表板,在各單位的數據分析解讀文化建立前,每月的數字說明,數字背後的意涵、後續可能需要採取的行動方案,都是需要數據分析師與第一線的執行人員開會、討論、了解第一線需求單位的各主業務分析痛點,才有辦法持續深入的合作和解決問題。否則,如果數據分析結果需求單位看不懂,互動式儀錶板需求單位不會使用,那麼數據分析師再怎麼做出精美好用的儀表板、充滿洞察與建議方案的數據分析報告,都沒辦法影響到商業決策,帶來數據的價值。

總結

這篇文章會分享三種數據分析師可能會踩到的陷阱,包括:數據分析前的需求溝通、數據分析過程的資料查詢與處理,以及完成數據分析結果或是建立儀表板後的報告與教育,這些陷阱一不注意,就會大大降低一個數據分析專案的價值,下一次執行數據分析專案的時候,不妨試試注意這3個小細節吧!

Sharon


Buy me a coffee  用行動支持我的內容創作

如果我的文章對你有幫助,歡迎用行動支持我的內容創作,小額贊助請我喝咖啡、留言或是寄信來跟我分享你的收穫,都會讓我持續有動力分享更多內容唷~