此页面由 Cloud Translation API 翻译。

以用户为中心的效果指标

Philip Walton

我们都听说过性能非常重要。但是，当我们谈论性能以及提高网站“快速”的速度时，具体指的是什么呢？

事实上，性能是相对的：

因此，在讨论性能时，必须保持精确性，并按照可通过量化衡量的客观标准来指代性能。这些条件称为“指标”。metrics

但是，仅仅因为指标基于客观标准并且可以进行定量衡量，并不一定意味着这些衡量结果有用。

定义指标

过去，网站性能一直通过 load 事件来衡量。不过，虽然 load 是页面生命周期中一个明确定义的时刻，但该时刻不一定与用户关心的任何内容相对应。

例如，服务器可以使用一个立即“加载”的最小页面进行响应，但之后会延迟提取内容并显示该页面上的任何内容，直到 load 事件触发几秒后才显示。虽然从技术层面来讲，此类网页的加载时间可能较快，但该时间与用户实际获得的网页加载体验不符。

在过去的几年中，Chrome 团队的成员与 W3C Web 性能工作组合作，一直致力于对一组新的 API 和指标进行标准化，从而更准确地衡量用户的网页性能体验。

为确保指标与用户相关，我们在设计这些指标时要围绕几个关键问题：

通常，我们会通过以下两种方式之一来衡量效果指标：

这两个选项并不一定优劣，实际上您一般希望同时使用这两者以确保获得良好性能。

开发新功能时，在实验室中测试性能至关重要。在功能在生产环境中发布之前，无法衡量其在真实用户方面的性能特征，因此在发布该功能之前在实验室中对其进行测试是防止性能下降的最佳方法。

另一方面，虽然在实验室中进行测试是性能的合理代理，但并不一定能反映所有用户实际使用您网站时的体验。

网站的性能可能会因用户的设备功能和网络状况而发生显著变化。它还可能会根据用户是否（或如何与页面互动）而有所不同。

此外，网页加载次数可能并不确定。例如，加载个性化内容或广告的网站可能会因用户而异。实验室测试无法捕捉这些差异。

要想真正了解网站给用户带来的效果，唯一的方法就是实际衡量网站在用户加载网页并与之互动时的性能。这种类型的衡量通常称为实际用户监控（简称 RUM）。

还有一些其他类型的指标与用户感受到的性能相关。

鉴于上述所有类型的性能指标，很明显，没有哪一种指标足以捕获网页的所有性能特征。

首次内容绘制 (FCP)：用于衡量从网页开始加载到网页任何部分的内容呈现在屏幕上所用的时间。（lab，字段）
Largest Contentful Paint (LCP)：衡量从网页开始加载到屏幕上呈现最大的文本块或图片元素所用的时间。（lab，字段）
First Input Delay (FID)：衡量从用户首次与您的网站互动（点击链接、点按按钮或使用由 JavaScript 提供支持的自定义控件）到浏览器实际能够响应该互动的时间。（字段）
Interaction to Next Paint (INP)：用于衡量与网页进行的每一次点按、点击或键盘互动的延迟时间，并根据互动次数选择网页的最差互动延迟时间（或接近最高延迟时间）作为单个代表性值，以描述网页的整体响应速度。（lab，字段）
总阻塞时间 (TBT)：测量 FCP 和 TTI 之间的总时间，在此期间主线程处于阻塞状态的时间足够长，足以阻止输入响应。（实验）
Cumulative Layout Shift (CLS)：衡量从页面开始加载到其生命周期状态更改为隐藏期间发生的所有意外布局偏移的累计得分。（lab，字段）
首字节时间 (TTFB)：测量网络使用资源的第一个字节响应用户请求所需的时间。（lab，字段）

虽然此列表包含用于衡量与用户相关的性能的很多方方面面的指标，但并未涵盖所有方面。例如，运行时响应和流畅性目前不涵盖在内。

在某些情况下，我们会引入新指标来涵盖缺失的方面，但在其他情况下，最佳指标是专门针对您的网站量身定制的指标。

上面列出的性能指标有助于大致了解网络上大多数网站的性能特征。它们还非常适合为网站提供一组通用指标，以便将其与竞争对手的效果进行比较。

不过，有时特定网站可能在某种程度上是与众不同的，需要额外的指标才能全面反映性能。例如，LCP 指标旨在衡量网页主要内容何时完成加载，但可能会出现以下情况：最大的元素不属于网页的主要内容，因此 LCP 可能不相关。

为了解决此类情况，网络性能工作组还对较低级别的 API 进行了标准化，对实现您自己的自定义指标很有用：

请参阅有关自定义指标的指南，了解如何使用这些 API 来衡量特定于您网站的性能特征。