Google Analytics, 數據分析

GA 篩選器是什麼?GA篩選器怎麼用?

上篇文章講完 GA 區隔,接下來想跟大家分享功能類似,但非常容易和區隔搞混的「GA篩選器」。如果對於 GA 區隔還沒有概念的朋友,歡迎先閱讀:GA 區隔是什麼?談GA區隔的基礎應用與限制(上)以及 GA自訂區隔怎麼設定?談GA區隔的進階應用(下)這兩篇文章複習一下。這篇文章想來跟大家談談什麼是 GA 篩選器,以及 GA 篩選器和區隔的使用差異與優劣比較,最後會跟大家分享幾個我常常會使用的篩選器設定方式,那麼我們就開始囉!

什麼是GA篩選器?

Google 官方的解釋篩選器其實就是「篩選器可用來修改資料檢視中的數據或只讓某些資料顯示」,這個定義可能會讓人有點不理解什麼情況下可以 GA 篩選器可以幫上忙,舉幾個實際的情境來說明。

我們可以試想一下,什麼時候我們會想要修改想要看的數據?又有哪些時候我們會只想看某些數據?其實這些問題背後都有個核心關鍵,那就是我們發現了一個問題,想要透過「聚焦某些數據,找到問題發生的可能原因」。

但預設的 GA 針對所有進站的行為都會做數據記錄,但數據這麼多,當我們想要排除掉會影響判斷的數據,又或是只想拉出某部分的數據來看的時候,該怎麼辦呢?這時侯 GA 篩選器就能透過「條件篩選」幫上忙。

GA 篩選器與進階區隔有什麼差別?

講到資料篩選,可能有些讀者就會有疑惑,GA 區隔不是也能做資料篩選嗎?那這兩者具體的差別又是什麼呢?什麼時候該用篩選器?什麼時候又該用區隔呢?

什麼時候用篩選器,什麼時候用區隔其實沒有絕對答案,舉例來說,如果只是想拉出「台灣的網站數據」,查看台灣流量的來源媒介分佈狀況,那麼不論是使用區隔,又或是使用篩選器都能達到一樣的效果。但是某些情況下的數據分析情境可能只能用區隔,某些情境下可能就只能用篩選器。

舉例來說,如果是想做數據間的比較,例如說,我想比較付費來源的網站流量與自然搜尋的流量,那麼用區隔就會是比較好的做法。換個例子來說,因為區隔沒辦法篩選特定情境,例如說排除特定IP,也沒辦法運用在多管道報表,所以當想要做到上述提到的條件設定,那麼就必須使用篩選器來設定。

所以要選擇哪項工具來做資料篩選其實沒有標準答案,端看需要達到的數據分析需求是什麼,以及哪個工具更符合當下所需的情境。除了使用情境和兩個工具之間各自的功能之外,這兩個工具還有三個根本上的差距:

1. 篩選器資料不可回溯 v.s.區隔資料可回溯
首先是資料能不能回溯的問題,GA 篩選器的資料是在建立24小時後才開始套用篩選器設定的篩選條件,而 GA 區隔則是不論是什麼時候建立,只要搭配報表的日期調整,所以即便是現在才建立起區隔,也可以利用區隔條件找出過去的數據資料。

2. 篩選器資料為全部資料 v.s. 區隔可能以抽樣呈現數據
其次的差異是篩選器是套用所有的網站資料,而區隔則可能在資料量大的 GA 帳戶中產生抽樣的數據結果,所以在數據量大的情況下,很有可能稍微影響數據的準確定。

3. 篩選器會造成資料破壞 v.s. 區隔不影響原始資料
最後 GA 篩選器與 GA 區隔最大的區別是資料套用的方式, GA 篩選器就像一個濾網,符合條件的數據資料就會被留下,至於不符合的資料則會永久被篩掉,所以如果我設定的條件是「排除特定IP」,那麼我套用的 GA 篩選器的資料檢視就會只看到「非特定IP」的網頁數據資料,後續就算想要看到「特定IP」的網頁數據資料也沒辦法,資料會直接在設定篩選器之後,不符合條件的資料會被破壞(刪除)。

至於區隔就不會有影響原始資料的問題,區隔的篩選只是暫時遮住不符合篩選條件的數據資料,隨時都可以取消區隔看到完整的原始資料。

使用 GA 篩選器的注意事項

總結來說,GA 篩選器可以很有效的幫助我們做資料聚焦以及汰除掉不必要的數據資料,但使用需要特別小心,接下來就來跟大家分享建立 GA 篩選器的時候需要注意的事情。

首先,因為 GA 篩選器是在建立之後才開始套用,所以建立前後的數據觀察非常重要,建議可以使用表單或是 GA 的註記功能做紀錄,以避免建立篩選器之後的數據判讀錯誤。舉個例子來說,如果我們今天使用篩選器是用來做桌機版流量,從6月1日開始套用,而原始桌機版流量是佔全站網站流量的50%,在套用 GA 篩選器之後,網站流量會立刻少了一半(數據會沒有手機版與平板的流量)設定完當下當下可能會記得是因為套用篩選器導致流量下降,但是如果未來數據回溯分析又或是工作由他人交接,都有可能因為沒有妥善註記而錯判流量變化的原因。

其次要注意的是 GA 區隔是以「破壞原始資料的原始性」來讓報表符合篩選器的條件,所以原始資料直接被破壞移除的。舉例來說,假設我在 6/1 設定了桌機流量的篩選器,即便 6/5 把將篩選器移除,6/2 – 6/4 手機與平板的數據資料還是一樣無法復原,所以為了避免破壞原始資料,又或是篩選器不小心設定錯誤的問題,非常建議大家在一開始設定篩選器之前,都先建立起新的「資料檢視層級*」,在新的資料檢視層級建立篩選器,記得保留最原始的資料檢視層級。

最後是很多人會忽略的「篩選器有套用順序之別」,所以套用的順序需要特別小心,順序愈上面的篩選器就會愈優先被套用,所以當你想要篩選的條件不只一個的時候,例如說你想挑選 google 的來源流量,並且要是隨機搜尋的流量,那麼來源篩選器就需要放在第一順位,接著才是媒介為 organic。

常用的 GA 篩選器設定

1. 排除公司或特定IP位址

GA 常常是行銷人拿來觀察真實網站訪客的判斷工具之一,不過品牌網站其實除了真實的網站訪客之外,也會有一群經常進入網站的人,那就是「公司的員工」,而當我們希望網站數據可以只留下有價值的真實網站訪客的時候,就會需要做公司IP位址的排除,以排除掉對分析網站訪客沒有幫助的流量。

如果公司的IP位址是固定的(只有一組,不會更換的話),那麼只要在搜尋引擎搜尋「我的IP位址查詢」,搜尋引擎的第一個頁面就可以查詢到。

如果公司的IP位址是浮動的IP位址,例如說會有132.158.12.001、132.158.12.002、132.158.12.003以此類推,那麼就需要針對浮動的IP位址寫上規則運算式來抓取所有浮動的IP位址。以上述例子示範,因為前三個數字不變,所以我們僅需要針對第四個會變的數據寫上規則運算式*:132.158.12\.* 即可。(此處\代表後方的.非規則運算式代碼;.代表可與任何單一字元比對;*則代表比對前接字元 0 或多次)。

接著進入 GA 的篩選器頁面,將 IP 位址依照下方示意圖輸入到對應的區塊即可。

*規則運算式:Google 官方延伸閱讀文件

2. 篩選子網域資料

有些網站的子網域會是不同的市場網站或是與主網域的資料不同需要做區分。舉例來說 https://aderlab.com/是這個網站的網域,若未來網站想要往國際話走,我可能就可以用 https://en.aderlab.com/ 來做英文網站。不過因為主要觀看網站的客群不一樣,所以我可以將兩個網站的流量用篩選器做區分,具體作法就是將子網域的流量獨立出來,就可以選包含主機名稱為「en\.aderlab\.com」的流量。

3. 篩選特定國家資料

篩選特定國家的資料只要在篩選器挑選「包含」國家/地區,接著輸入國家的名稱即可。這邊唯一要注意的是「國家/地區」的名稱必須要 GA 報表內呈現的名稱一致,才有辦法篩選到正確的資料。

4. 篩選特定來源或媒介流量

篩選特定的來源或媒介一樣使用「包含」,選擇「廣告活動媒介」,假設想要依照來源來篩選流量,那麼只需要在篩選器欄位做更改即可。以篩選隨機搜尋流量為例,只要輸入 organic 就可以找到所有的自然搜尋流量,這邊要注意的是,因為條件只有設定「organic」這個媒介,所以這邊抓取的資料不僅僅是Google的自然流量,也會包括Yahoo、Bing、百度等自然搜尋流量。

5. 整理網址參數

有時候因為網站條件設置或是外部連結來源參數,會導致進到GA的網址數據變得非常凌亂(補圖)。舉例來說,前者就想是網站有時候會設定銷售量排序參數,後者則像是臉書來源通常會夾帶fbclid這類的參數,這些參數會導致報表將同一個頁面的資料拆分開來(如下圖),導致我們在計算特定網頁時,可能會遺漏部份數據。所以這時候,使用GA篩選器篩選掉會影響判斷的網址參數就顯得格外重要。

這邊使用到的是篩選器的「搜尋與取代」的篩選功能,透過把「fbclid」的參數替代,移除掉不必要的參數,清理有參數的雜亂網址資料。以臉書參數整合的範例來說,可以選擇「自訂」>「搜尋與取代」,並且在篩選器欄位選擇「請求URL」,搜尋字串以規則運算式「 ([?|&]?fbclid=[^&]*&?) 」找出 fbclid 參數並取代為空白值。

那麼 GA 篩選器就先分享到這裡啦!我們下篇文章見:)

ADer Sharon

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *