上篇文章分享怎麼利用 Microsoft Power BI 進行資料更新,讓我們可以透過移動檔案到指定資料夾以及重新整理,達到半自動資料更新的效果。
不過啊,Power BI之所以可以大量節省時間,不僅僅是因為可以自動更新資料,更重要的是,當我們把所有資料處理的流程建立在 POWER BI 時,同樣的資料處理步驟就可以不必再重做一次,也就能省去大把的資料處理時間。
這一篇延續聊聊常見幾種 Power BI 資料處理方式,也建議大家在整理資料欄位、格式的時候,不要急著在匯入 POWER BI 前就整理,把整理的過程留在匯入資料以後,POWER BI 才能幫我們紀錄資料處理的每一個步驟,讓我們能在每一次匯入一樣的資料欄位一鍵套用,更聚焦在數據觀察與分析上!
這篇文章的資料範例是信用卡交易的資料,詳細的資料來源與檔案放於文章的最後,這次要分享的是如何把經過樞紐處理過的寬資料轉換成長資料,同時介紹 5 個在資料處理過程中常常需要使用到的功能,包括:資料標題處理、解樞紐分析表、資料切割與合併、資料格式調整與欄位刪減。
資料處理類型1:將資料列抬升為標題
一開始匯入資料的時候,會發現資料欄位名稱是:Data.Column1、Data.Column2、Data.Column3、……、Data.Column1,但是我們需要「產業別」、201401、201402等資料列當作資料標題。
調整的步驟很簡單,只要點選「使用第一個資料列作為標題」就可以了。以這份資料的例子來說,因為我們想要當作標題的列是第二列,所以需要點選兩次「使用第一個資料列作為標題」的按鈕。
當我們在POWER BI 裡面的POWER QUERY進行資料處理時,所有的調整步驟都會被記錄在右側的「套用的步驟」,一來是可以讓我們隨時回顧針對原始資料做過哪些資料處理步驟,另外一方面,當我們不小心操作錯誤時,也可以在「套用的步驟」區塊點選要選取的步驟,按下步驟列最前方的X就可以了。
資料處理類型2:長寬資料轉換
確認好原始的資料標題跟樞紐表格之後,接著要進行的就是解樞紐分析表的操作,又常常被稱為將寬數據整理成長數據。轉換寬數據的第一個步驟是先選取要解開樞紐分析的範圍,以這份資料來說就是所有年月的信用卡交易筆數數據。
接著將畫面切換到「轉換」工具區,點選「取消資料行樞紐」。
就完成了將寬數據轉換成長數據的結果了。
資料處理類型3:資料分割與合併
資料解樞紐之後,會發現年月的那一欄是日期格式,但是直接轉換成日期格式又會出現錯誤,原因是因為我們直接看可以判斷這個欄位的資料是想表達年份+月份,但是對於系統來說卻沒辦法,對於系統來說只是一個6位數的數字,沒有符合系統預設的日期表達方式,所以沒辦法直接轉換成日期格式。
接下來我們就需要幫助這個欄位更改成日期格式,以下示範以資料分割以及新增欄位方式調整成日期格式的做法。
將工作列切換到「轉換」的工作區,點選「分割資料行」,分割資料行的方式有非常多種,以這份資料的資料數共6位數字,可以依「字元數」或是「依位置」分割。
如果是依字元數分割資料行的話,輸入想要分割的字元數即可,像是這份資料我們想把年份跟月份切分開來,所以字元數就輸入「4」。
切割完資料欄位之後,就可以透過新增資料欄位來合併年份、月份、並新增日期以符合日期格式。
日期的資料我們先預設為每月1日,輸入公式:[年月.1]&”/”&[年月.2]&”/1″。
資料處理類型4:資料格式更改
建立完新的年月日資料欄之後,我們就可以將這個欄位更改成日期格式了。
資料處理類型5:資料欄位刪除
最後,針對用不到的「年月.1」、「年月.2」進行資料行刪除。
POWER BI 常見的5種資料處理方式就分享到這裡,下一篇會再分享另外 5 種常用的資料處理功能,下一篇文章見~
原始資料來源:https://data.gov.tw/dataset/38319
資料下載連結:https://pse.is/4jy9gr,雲端連結中共包括兩份檔案:
1. Power BI 示範檔案:信用卡資料解樞紐_資料預處理(上篇)
2. Excel 營收資料檔案:各年齡層信用卡持卡人於六都消費樣態
Sharon
Buy me a coffee 用行動支持我的內容創作
如果我的文章對你有幫助,歡迎用行動支持我的內容創作,小額贊助請我喝咖啡、留言或是寄信來跟我分享你的收穫,都會讓我持續有動力分享更多內容唷~