虽然我们很容易将 GA4 视为查看报告的网页界面,但实际上,该工具的功能远不止于此。屏幕背后是一个高度复杂的数据捕获和建模系统。然而,我们日常使用的其实是它的报告系统。乍一看,它可能包含维度、指标、受众群体、细分、关键事件、渠道和转化等内容,让人眼花缭乱;但如果组织得当,它实际上非常简单实用。
GA4 的报告生态系统有点混乱。有些内容类似,有些内容在不同的地方重复出现,但需要查看的领域太多,而且同一数据版本太多。这是因为 GA4 实际上没有一个统一的报告系统:它不只有一个查询引擎,而是有多个查询引擎可以共存于同一类型的报告中。
GA4:超越界面,包含 3 个关键部分的报告系统
正如我们提到的,GA4 是一个捕获、建模和组织用户数据的系统,然后通过各种机制呈现这些数据。GA4 提供三种报告系统:
- 聚合系统:
标准报告的基础,也是 GA4 中最简单、最快的引擎。 - 粒度系统:
更详细且用途极其广泛,但也有一些额外的限制,并不总是允许使用它。 - 导出到 BigQuery:
不受其他系统的限制,可以访问原始数据,但它会缺少一些我们有时会错过的数据。 - 汇总系统:
标准报告中的效率和速度
GA4 中大多数报告的引擎都由汇总系统支撑。演示老虎机游戏成功的秘诀 该系统灵活高效,因为它与我们所谓的“汇总表”协同工作,而“汇总表”正是其所有优势和问题的根源。
从技术角度来看,汇总表系统相当于一个分析型数据库,它是一个动态立方体系统,可以汇总 GA4 捕获的信息,并大大加快数据检索以及维度和指标的细分速度。几乎所有分析工具都使用这种类型的数据库,这与传统的 SQL 表略有不同。它们需要进行更多的数据处理,最终缩小了使用范围。
GA4 并非一次性处理所有数据,而是生成简单的“多维数据集”,为了清晰起见,我们将其称为“汇总表”。这些汇总表是对通常作为整体参考的信息进行预先计算的结果。例如,当您进行“媒体”分析时,通常也会同时处理“来源”、“广告系列”和“渠道”,因此 Google Analytics(分析)会准备一个包含预处理数据及其所有指标的汇总表,这非常合理。这样,您在请求这些报告时,无需回头查看收到的每个事件和会话对应的广告系列。
这些汇总表非常重要,因为:
- 它们速度很快,优化了数据查询。
- 他们没有进行抽样,这保证了数据 100% 代表现实情况。
- 无论过了多久,它们都会保留完整的数据历史记录。
然而,并非所有事物都是完美的,它也会在使用中产生严重的限制。
- 聚合系统的主要限制之一是基数,它指的是汇总表可以处理的最大行数。如果您查询的维度中存在太多唯一值,则可能会遇到可怕的“(其他)”值,该值会将不太常见的数据分组,并将其从报告中排除。
- 数据积累意味着我们无法交叉引用某些维度,因为没有任何表格可以协同工作。随着 GA4 的演进,这个问题变得越来越明显,这是由于系统效率的提升。商业 带领 限制越多,表格就越少;表格越少,一切运行得就越快。
- 该系统的最后一个限制在于过滤:GA4 提出的聚合系统不支持复杂的过滤条件。我们无法在此系统中创建细分或序列。
现在我们了解了 GA4 查询引擎的工作原理,我们需要看看它在 GA4 中的哪个位置。该系统可以在以下位置找到:
- 主要在标准查询中。当我们从 GA4 菜单请求报告时,几乎总是会使用标准系统。
- 在查询 API 中。流行的 GA4 API 使用聚合系统,因此提供的结果与 GA4 报告库中的标准报告类似。
- 因此,所有与 GA4 连接的产品:Looker Studio、Google Sheets、Make、
代码集成。所有从 GA4 提取数据的功能,主要都是通过这个系统进行的。
粒度系统:深度和精度,但带有采样
该系统使用与 GA4 相同的信息和技术,但它不会累积大量信息,而是以更详细的方式存储信息。它仍然使用多维数据集、维度和技术技巧来简化查询,但细粒度系统优先挖掘细节。在这里,数据以更具体的方式存储,从而可以更深入地洞察事件和会话。
我们发现它的优点包括:
- 它不受基数的影响,即使在有问题的维度下也能实现更高的报告准确性。
- 它允许您更轻松地交叉引用数据,甚至允许创建动态表。
- 它提供高级分割,例如使用序列和会话或用户过滤器。
但是,它也存在一定的缺点:
- 最明显的一个:采样。由于我们拥有所有数据,因此在这个系统中我们找不到“(其他)”。但作为回报,GA4 通过将提取的数据限制在大约 1000 万个独立事件,来保护自己免受非常昂贵的查询的影响。如果您请求更多数据,它会进行采样,这就像只提取 1000 万个事件,并对总数执行“三的规则”。
- 另一个不太明显但非常关键的问题:数据保留。我们可以在 GA4 管理员中配置它,但免费帐户的保留期最多只有 14 个月。保留期指的是存储精细数据的时间长度。也就是说,在这个系统中,如果您的保留期为 2 个月(所有帐户的默认保留期,您需要更改),那么您将永远无法请求 3 个月前的数据报告。
- 处理时间。在小账户中你不会注意到这一点,但当你有大量数据时,你会发现使用这个系统会很累,等待它显示数据。
- 缺乏完善的 API。虽然我们可以使用这个系统,但通常无法在分析界面之外使用,这非常局限。
我们可以在哪些地方使用这个系统:
- 尤其是在 Explorer 报告中。这些报告旨在充分利用 GA4 的细粒度查询系统,因此在使用这些报告时,我们通常会使用该系统(除非我们的查询非常简单)。
- 在漏斗 API 中。出于某种原因,GA4 仅创建了此类探索报告的 API(预计未来会提供更多 API,但我们很久以前就只提供这种 API)。因此,如果您想在 GA4 之外使用这些报告,只能通过创建漏斗来实现。
其他地方都没有。正如你所见,这个系统功能强大,但使用的地方却较少。