本頁面由 Cloud Translation API 翻譯而成。

以使用者為中心的成效指標

Philip Walton

我們都聽說成效的重要性。但說到提升網站效能，我們說的具體是什麼？

事實上，效能是相對的：

因此談到效能時，請務必提供精準，並以可量化評估的客觀條件表示成效。這些條件稱為「指標」metrics。

然而，即使指標是以客觀條件為基礎，並且能夠量化評估，並不一定表示這些測量數據非常實用。

定義指標

過去，網站效能是使用 load 事件來評估。不過，雖然 load 是網頁生命週期中明確定義的時刻，但該時刻不一定是使用者關注的任何內容。

舉例來說，伺服器可以在回應中提供最少的網頁回應，隨即「載入」網頁，接著將擷取內容及顯示頁面任何內容，直到 load 事件觸發的數秒為止。雖然這類網頁在技術上可能具有快速的載入時間，但該時間並不一定對應使用者實際體驗網頁載入的情形。

過去幾年來，Chrome 團隊成員不斷與 W3C Web Performance Working Group 合作，攜手將一組新的 API 和指標標準化，以更準確地評估使用者體驗的網頁效能。

為確保指標與使用者息息相關，我們會針對幾個重要問題制定指標：

一般而言，成效指標的評估方式有兩種：

這兩種選項都不見得優或更差，因為您通常會想同時使用兩者來確保效能良好。

開發新功能時，在研究室中測試效能至關重要。在功能在實際工作環境中發布前，無法評估實際使用者的效能特性，因此在功能發布前於研究室中進行測試，是避免效能迴歸的最佳方法。

另一方面，雖然在研究室中測試對效能相當合理，但不一定能反映所有使用者在野外的網站體驗。

網站的效能可能會因使用者的裝置功能及網路狀況而有極大差異。但也可能因使用者與網頁的互動 (或方式) 而不同。

此外，網頁載入可能不是很確定的。舉例來說，載入個人化內容或廣告的網站對使用者之間的效能差異可能大不相同。研究室測試無法掌握這些差異。

要確實瞭解網站在使用者體驗上的成效，唯一的方法就是實際評估使用者載入及與網站互動時的效能。這種評估類型通常稱為「真實使用者監控」，簡稱 RUM。

還有幾種其他類型的指標，都與使用者感受到的效能有關。

鑒於上述所有類型的成效指標，我們認為沒有單一指標足以用來擷取網頁的所有效能特性。

首次顯示內容所需時間 (FCP)：測量從網頁開始載入到畫面顯示任何部分內容的時間。(研究室、欄位)
最大內容繪製 (LCP)：測量從網頁開始載入，到畫面顯示最大文字區塊或圖片元素所需的時間。(研究室、欄位)
首次輸入延遲時間 (FID)：測量從使用者首次與網站互動 (點選連結、輕觸按鈕或使用自訂的 JavaScript 輔助控制項) 到瀏覽器實際可以回應該互動所需的時間。(欄位)
與下一個顯示的內容 (INP) 互動：評估使用者每次輕觸網頁、點選或鍵盤互動時的延遲時間，根據互動次數選取網頁回應次數最差的互動延遲時間，(研究室、欄位)
總封鎖時間 (TBT)：測量 FCP 和 TTI 之間的總時間。過程中，主執行緒封鎖時間足以防止輸入回應的時間。(研究室)。
累計版面配置位移 (CLS)：測量從頁面開始載入，到生命週期狀態變更為隱藏之間，所有非預期版面配置位移的累計分數。(研究室、欄位)
首次位元組時間 (TTFB)：評估網路透過資源的第一個位元組回應使用者要求所需的時間。(研究室、欄位)

雖然這份清單包含評估使用者相關各種效能層面的指標，但並不涵蓋所有項目。舉例來說，目前執行階段回應與流暢度並未涵蓋在內。

在某些情況下，我們會導入新指標來涵蓋遺漏的區域，但在某些情況下，最適合的指標就是專為您的網站量身打造。

上述效能指標有助於大致瞭解網路上大多數網站的效能特性。也很適合建立一組通用指標，以便比較網站與競爭對手的成效。

不過，有時候特定網站可能具有特殊性，就需要使用額外指標才能掌握完整的成效概況。舉例來說，LCP 指標是用來測量網頁主要內容完成載入的時間，但在某些情況下，最大元素並不屬於網頁主要內容，導致 LCP 不相關。

為因應這類情況，網路效能工作小組也已標準化的較低層級 API，可協助您實作自己的自訂指標：

請參閱自訂指標指南，瞭解如何使用這些 API 評估您網站特有的效能特性。