Microsoft Power BI, 數據分析

用 POWER BI 自動更新數據,解決重複性資料整理

用 POWER BI 自動更新數據,解決重複性資料整理

你有每週要固定產出的報表或是資料處理嗎?與其每一次都重頭開始整理原始資料,不妨試試 POWER BI 來進行資料處理與更新,讓我們不必花大把的時間在做重複性的資料整理,只要更換資料來源就能快速完成!

如果對 POWER BI 這項工具是什麼還不熟悉,可以先看看這篇: Microsoft Power BI是什麼?談Power BI 的應用場景與功能簡介

前言

我學習 POWER BI 的原因是因為我上一份工作有頻繁且即時需要進行的交叉分析,例如產品銷售要分成不同的產品分類來看,組合商品業績要拆分單品業績來看每個產品的銷售狀況、客戶消費要區分成會員等級、會員消費頻率、會員是新舊客狀態等不同維度來看。

這些需求聽起來容易,但是資料彙整的過程卻特別不容易,光是數據處理與比對就需要花費我大部分的工作時間,常常讓我在資料處理完後就沒有時間深入挖掘數據背後的意義。這是我學習 POWER BI 的起因,起初是希望減少重複性工作內容,後來愈學愈覺得 POWER BI 有更多層面的應用,也希望透過文章的分享,讓現在還深陷於資料處理苦海的你,有一個提升工作效率的方向,那就開始囉!

這篇文章我以銷售數據為例,分享如何用 POWER BI 的 Power Query 進行資料處理與自動更新。

假設我有一份從ERP可以固定下載的訂單資料,每週都需要固定做資料整理,分析每月的區域營業額、每個區域的販售品項,產出固定的數據表格與報告圖表,告訴生產部門哪些區域需要需要生產哪些商品。我一開始的做法就是每月都從ERP下載一次原始資料,然後針對原始資料進行資料處理,接著將處理好的資料在EXCEL裡面進行樞紐分析、圖表製作,每月持續做一樣的步驟。

上述的步驟當然沒問題,但如果能更有效的使用BI工具,將能節省掉 80%以上的資料處理時間,花更多的時間了解數據背後的成因以及提出後續的行動方案。

什麼情況適合用 POWER BI 進行資料更新?

如果你平常在整理的資料有下特點,那就非常適合使用 POWER BI 來進行資料處理與更新:

  1. 資料格式一致
    資料格式一致代表資料的存檔種類是一樣的,例如說下載下來的檔案都是CSV檔、JSON檔,又或是固定放在資料庫裡,都可以將資料串接進 POWER BI 裡。
    POWER BI 可以串接的資料格式可以參考官方文件:Power BI Desktop 中的資料來源

  2. 資料欄位名稱與欄位數一致
    資料欄位其實就是資料的維度,以訂單資料來說,如果你第一份處理的資料共有6個欄位,欄位名稱分別是:訂單成立日期、訂單ID、客戶ID、產品名稱、消費金額、數量,那麼下一份資料也必須是6個欄位,而且欄位名稱需要和上一次的資料欄位名稱一樣。

  3. 資料檔案的檔案夾位置一致
    同樣需要更新的資料需要存在同一個電腦的同個檔案夾裡,且檔案夾原始存放位置假設是 「D:/Desktop/訂單資料」,那麼新的資料也需要存放在 「D:/Desktop/訂單資料」裡。

以上的條件不難達成,一般來說如果是固定從ERP或資料後台下載資料,資料的欄位跟格式大部分都是固定的,比較需要注意的是,如果你下載資料的欄位是可以自己篩選,那就需要留意資料欄位的數量跟欄位的順序是否和首次資料一致。

如何用 POWER BI 進行半自動更新資料

以下將示範如果固定匯出EXCEL或CSV檔的話,如何進行POWER BI 的資料匯入與後續資料更新。

建立半自動更新資料的 POWER BI 報表

  1. 下載原始資料檔案,放置在一個資料夾內

    資料夾放置位置需要固定,在建立資料夾時就需要想清楚要放在哪個電腦路徑。

  2. 開啟 POWER BI 與匯入資料

    開啟應用程式之後,點擊「取得資料」,用此選取檔案位置。因為後續希望可以做到自動更新資料,所以資料匯入方式選取「資料夾」,這樣以後將新的資料放在同一個資料夾時,就能讀取到新的資料內容了。

  3. 資料預覽與載入

    載入資料前建議都先進行資料的格式、合併處理,所以先點擊「轉換資料」,就可以進到POWER QUERY 的系統進行資料整理。

  4. 資料合併與分析前處理

    第一次讀取資料夾時,因為我只有放一份Excel檔案,所以可以看到畫面就只有一列的資料列,假設我放了3份檔案,那畫面就會出現3份資料列。這個步驟是需要將放在資料夾裡面的檔案資料展開、合併起來,並進行資料欄位調整。

    首先在Content的區塊按下右鍵,選擇「移除其他資料行」,接著就可以將Content標題右側的向下箭頭點下去之後展開資料,展開的過程也同步會進行資料合併。這也就是為什麼前面提到資料的欄位名稱、欄位數必須跟首份資料一致的原因,因為如果不一致的話,在合併的過程中系統就會因為欄位名稱無法核對到而出錯。

  5. 建立需要的報表格式

    我先簡單建立一個月份的區域銷售數量表格、業績佔比圓餅圖以及產品銷售數量的表格,這個就是第一個月的資料處理流程與建表。

  6. 下次下載與更新資料

    等到了下一次需要再度分析同樣的銷售狀況的時候,這時候只要下載新的一個時間段的資料,然後把新的資料移動到上次建立的資料夾即可。以這篇文章的範例則是我在原本的資料夾(圖1)加入了2015年12月的最新資料(圖2)。



  7. 開啟 POWER BI 重新整理資料

    在移動完最新一筆的資料檔案後,開啟 POWER BI ,在POWER BI 按下「重新整理」,接著2015年12月的資料就會進到報表,並且裡面了。


用POWER BI 的這個工具,還是免不了第一次的資料處理和表格、圖表設計步驟,但他的最大優點在於,同一份資料處理和分析報表只需要做一次,下一次就能直接透過更新資料來源與重新整理,快速產出例行性的分析報告,是不是快速很多了呢?下次再處理同樣一份的例行報告的時候,不妨試試看POWER BI 這個工具吧!

最後也提供我整理過的原始資料檔案以及 Power BI 實作檔案給看過文章的你自由使用,歡迎動手實作看看,下篇文章見啦~

原始資料來源:https://community.tableau.com/s/question/0D54T00000CWeX8SAL/sample-superstore-sales-excelxls
資料下載連結:https://pse.is/4jrfdb,雲端連結中共包括兩份檔案:
1. Power BI 示範檔案:data_automation.pbix
2. Excel 營收資料檔案:每月銷售數據

Sharon


Buy me a coffee  用行動支持我的內容創作

如果我的文章對你有幫助,歡迎用行動支持我的內容創作,小額贊助請我喝咖啡、留言或是寄信來跟我分享你的收穫,都會讓我持續有動力分享更多內容唷~

Sharon