今天想要分享的是 Miscrosoft Power BI (簡稱:Power BI )的功能:資料串接,如果你常常使用 EXCEL VLOOKUP公式或是大量的使用樞紐分析做不同的數據觀測,那 Power BI 絕對可以讓你事半功倍!那就開始囉!
用 Power BI 連結資料有什麼好處?
在說明如何用 POWER BI 連結資料來取代 Excel Vlookup 公式前,先來談談用 POWER BI 連結資料有什麼好處,我歸納了總共有以下四個優於 Excel Vlookup 的特點
- 系統會自動連結不同資料表相同名稱的欄位
當資料匯入 Power BI 後,如果你的資料的欄位名稱一樣,讓系統可以判讀兩個欄位是有相關的欄位,就會自動幫你把欄位做連結,而我們需要做的就是檢查即可。 - 一鍵拉取比對欄位,不需要寫公式
如果你匯入的資料欄位名稱不一樣,或是說系統沒有自動連結起來也沒關係,在 Power BI 內資料連接是以拖拉的方式連結,使用起來非常直覺且快速。 - 可以處理一對多的資料比對
使用 Excel Vlookup 公式的你應該不陌生, Vlookup 雖然方便,但是當我們需要回傳不只一筆比對資料的時候,每個公式都需要重寫一次,不過在 Power BI 上卻相當彈性,只需要第一次將相關欄位串接,就可以把兩張表的資料互相使用,而且不僅可以處理一對一的資料、一對多的資料也沒問題。 - 新增資料之後,數據也會跟著變動
這個我認為是 Power BI 相當強大好用的功能,意思是當我們匯入的資料如果做資料新增或修改,只要原始檔案的檔名、存放位置不做更動,那麼只要在 Power BI 內按下重新整理,資料就會自動更新到 Power BI ,當然,資料串接也不需要重新做一次。
至於什麼時候我會建議直接使用 Excel Vlookup 就好呢?以下幾種情況我就會不建議把資料拉到 Power BI 來進行,例如說你處理的只是一次性使用的資料,資料量比較少又或是比對欄位需求少的資料,這些分析需求相對簡單的時後,用 Excel 其實就綽綽有餘。而當你遇到資料量比較大,資料分析需求比較複雜的時候,我就建議可以改用 Power BI 減少繁瑣或例行的資料清理流程。
如何用 Power BI 取代 Excel Vlookup?
以下示範以電商常見的訂單資料與客戶資料比對做範例。通常訂單資料會有客戶的ID、購買商品、購買金額、消費國家地區等,初步的訂單資料就可以讓我們分析很多題目,例如說:哪些商品賣的比較好?消費者習慣的配送方式是以哪個居多,這個配送方式還有沒有加速配送抵達的機會?又或是哪些國家或城市的訂單最多?以這些地區投入的廣告成本來說,有沒有投入多,但是賺回的營收少又或是投入少,但是報酬超高的地區需要做資源的配置等。
雖然訂單資料已經可以讓我們看到很多分析角度,但實務上企業也很常以客戶輪廓的角度來分析營收狀況,例如說,會買商品的客人性別佔比、年齡分佈,有沒有某個族群是高貢獻族群,不同客群喜歡的商品偏好等。
接下來我就用電商常見的訂單資料與客戶資料來做範例,示範如何利用 Power BI 來串接兩份資料,做出更深入的資料串接、歸納與拆解,當然你也可以依照下列資料串接的原則串接兩份以上的資料,讓數據分析更深入有效。
- 開啟 Power BI
目前 Power BI 有提供免費的版本,只要到 Power BI 官方的網頁下載就可以使用囉,唯一的限制是,目前 Power BI 僅提供 Windows 作業系統使用,是目前比較可惜的部分。下載之後打開就會呈現如下圖的畫面。
- 選擇匯入的資料類型
在第一個畫面上點擊「取得資料」,就可以挑選想要匯入的資料類型,這篇文章先以匯入Excel 資料為例。
- 預覽資料並挑選要匯入的工作表
在選擇好想要匯入的Excel之後,會有一個可以預覽資料內容的畫面,如果你想要匯入的 Excel 資料在不同的工作表的話,也可以像下圖這樣,一次把想要匯入的資料一次勾選起來。
在這個步驟,我會建議在選擇好匯入的工作表資料後,不要直接點選「載入」,建議可以點選「轉換資料」,原因是因為資料常常會需要整理後才能使用,所以點選「轉換資料」的話就可以在資料匯入 Power BI 之前做資料處理跟檢查,例如說檢查有沒有缺漏值、缺漏值有多少比例,會不會影響到資料的可分析性,又或是將資料的欄位格式更改成對的格式,確保欄位讀取到正確的欄位名稱等,這是在做所有數據分析之前必備的檢查流程。 - 資料檢查與預處理
資料處理比較不是本篇文章的重點,這邊簡單說一下常見的資料處理類型,等下次有機會再來細細分享怎麼操作。除了在第三個步驟講到的缺漏值、格式、欄位名稱外,也會檢查數據量、確認有沒有需要新增或是刪減的欄位、進行長寬資料的轉換(取消樞紐),又或是統整同一個欄位的資料,像是統一大小寫、統一全形半形等。都沒有問題後就會按下左上角的「關閉並套用」。
- 成功匯入資料後會先進到畫布後,選擇左側到模組串接資料
當資料匯入後,會先進入到一個空白的畫布,這個區塊就是讓我們可以任意拉報表與圖表的地方,但在拉報表前,要先確認我們需要使用到的資料有沒有做好了相關性連結。這時候需要點選左側欄的第三個小圖示「模型」。
- 確認相關資料是否建立連結
Power BI 非常智能,如果你匯入的資料的欄位名稱一樣,系統就會自動幫你做好資料連結,就像下圖一樣,我們需要做的就是檢查欄位連結有沒有錯誤就好。那遇到欄位名稱不一樣怎麼辦?例如說一份資料銷售日期可能是寫OrderDate,另外一份資料則是寫訂單成立日期,這也沒關係,我們只要手動拉取相關聯的資料欄位,用拖拉的方式進行資料連結即可。 - 拉取報表:初步了解
資料處理完也做完兩份資料的連結後,就可以開始建立我們想要分析的項目了。我先以常見的表格為例,如果我想知道現在消費客戶的性別組成,我就可以在CustomerID資料表拉取gender當作資料列,然後在值的地方放入Sales跟Quantity,簡單的性別貢獻度就出來了,就像是Excel的樞紐分析功能一樣,如下圖所示。
但看了這份表格,我們可能會有疑惑,為什麼性別為 None 貢獻度還不少呢?是因為客戶都沒有填寫性別欄位的資料嗎?是因為資料有異常嗎?還是有其他的原因呢? - 拉取報表:深入探索
當對數據有疑問時絕對不要放過,因為如果連資料分析的負責人都不知道數據呈現帶來的價值,那也很難對於部門或公司有實際的數據分析價值。
這時候,除了回頭去看原始資料外,我們也可以把其他客戶維度的資料拉進來幫助我們做判斷,像我因為熟悉資料,所以我就清楚知道是所有訂單中不僅僅有個人消費,也有公司消費跟家庭戶消費,這兩類的消費族群是團體,所以才會沒辦法以性別分類。
知道這些資料組成的細節,我們也會更知道怎麼在分析前先歸類分群,當我們想要分析客戶輪廓的時候,就知道一般客人與公司行號這類團體需要分開分析,這些從數據表面往下探究的的過程都會幫助我們更能提供貼近真實且有價值的分析內容。
那如何用 Power BI 建立資料連結的分享就到這裡了,希望這篇文章可以幫助到花費很多時間在使用 Excel Vlookup 公式中的你,文章最後也提供我整理過的原始資料檔案以及 Power BI 實作檔案給看過文章的你自由使用,歡迎動手實作看看,下篇文章見啦~
原始資料來源:https://community.tableau.com/s/question/0D54T00000CWeX8SAL/sample-superstore-sales-excelxls
資料下載連結:https://pse.is/4k9ujh,雲端連結中共包括兩份檔案:
1. Power BI 示範檔案
2. Excel 電商資料檔案(這份資料的原始是從上面提供的原始資料來源而來,為了讓資料更貼近本篇文章的分析說明範例,所以有略為做客戶資料的新增跟標註)
Sharon
Buy me a coffee 用行動支持我的內容創作
如果我的文章對你有幫助,歡迎用行動支持我的內容創作,小額贊助請我喝咖啡、留言或是寄信來跟我分享你的收穫,都會讓我持續有動力分享更多內容唷~