Google Analytics Alternatives:如何继续使用 Google 技术堆栈并符合 GDPR
已发表: 2022-11-17在过去几年中,营销分析领域发生了重大事件,影响了数据质量和营销报告的准备。 由于 GDPR、同意模式和对 cookie 使用的限制,许多公司现在正在寻找 Google Analytics 的替代品。 他们担心他们通常使用的谷歌技术堆栈不能保证收集的数据将仅存储在欧盟位置。
然而,改变技术堆栈是痛苦且昂贵的:
- 巨大的学习曲线和学习新技术的需要会减慢流程并需要新员工。
- 开发人员和分析师需要在网站上重新实施新标记。 这不仅需要大量资源,还会延误其他紧急任务。
好消息是,公司不必改变他们的技术堆栈。 他们只需要正确设置一切。
在本文中,您将了解企业在使用 Google 技术堆栈时应采取哪些措施才能符合 GDPR。
借助 OWOX BI,您可以确保在处理敏感数据时遵守 GDPR。 不要将时间和资源浪费在重新处理数据或学习和采用新的技术堆栈上。
目录
- 数字分析的美好时光
- 2022 年的数字分析
- 如何继续使用 Google Tech Stack 并遵守 GDPR
- 具有同意模式的 Google BigQuery 数据模式
- 数据报告从数据沿袭开始
- 简短的结论
数字分析的美好时光
几年前,所有从事数据分析工作的人都将未来几年想象成一个美丽的世界,数据和个性化无处不在,广告技术堆栈迅速发展。

我们对那些美好的过去了解多少?
数据采集
- 99.5% 的专家使用 Google 跟踪代码管理器将数据发送到他们想要的任何地方。
- 85.7% 的专家使用 Google Analytics 收集网站数据。
数据处理
- 几乎每个人都使用 ETL 和 DWH 进行数据处理。
- 定义键并使用它们连接数据和构建您想要的任何报告真的很容易。
数据上报
各种数据可视化工具,包括无缝连接到数据存储的 Google Data Studio 和 Google Sheets。
简而言之,在没有当今所有外部需求的情况下处理数据肯定要容易得多。
2022 年的数字分析
今天,我们必须付出额外的努力来处理用户数据。 我们没有飞行汽车,数据个性化也并非无处不在。 取而代之的是,我们的要求和限制会引起更多的担忧。
浏览器限制第三方 cookie 的使用
浏览器和平台限制第三方域设置的第三方 cookie 的生命周期。 这会影响分析系统重要标识符的显示,例如 Google Analytics 中的客户端 ID。 因此,未来将无法获得有关广告渠道有效性的大量信息:
- 新访客的转化份额将会增加。 然而,这些实际上并不是“新”访问者,而是分配了新 cookie 的前“回访”访问者。
- 直接/无转化的份额将会增加。
- 报告中付费广告的投资回报率会有 10% 到 20% 的误差。 大多数情况下,它会在较低的一侧。
Google Analytics 不符合 GDPR
欧盟通用数据保护条例 (GDPR) 生效后,欧洲的 Google Analytics 用户面临一个问题。 由于欧洲数据保护机构的决定,Google Analytics 不符合 GDPR,因此网站运营商在多个国家/地区使用 Google Analytics 是非法的。
现在,企业必须从其网站中删除 Google Analytics,否则将因违反 GDPR 而面临罚款。 在欧盟运营或为欧盟国家客户提供服务的 Google Analytics 用户应立即采取行动,确保没有个人数据被传输到美国的服务器,或寻找符合 GDPR 的替代分析平台。
此外,为符合 GDPR 要求,网站必须使用同意模式。 也就是说,网站不得识别不想共享 cookie 的用户。 这会导致以下问题。
同意模式减少了可以识别流量来源的转化次数
广告商将继续收集用户活动数据,但他们无法确定哪些与广告的互动会带来转化。 在实施同意模式的网站上拒绝 cookie 的用户平均比例为 30%。 根据网站类型的不同,这个份额可以达到 40%。
营销报告中的在线转化量将保持不变,但转化不会与 CRM 中的点击来源和已完成订单相关联。 因此,您将无法将大部分转化归因于广告活动,并且会获得较低的投资回报率。

今天,当分析师开始考虑收集、处理和转换数据时,他们必须回答以下棘手的问题。
数据采集
- 由于 GDPR、同意模式和 cookie 使用限制导致的数据缺失,我该怎么办?
- 我该如何处理同意的用户和不同意的用户? 我如何区分它们并在我的报告中获得可信的数据?
- 我必须征求什么样的同意才能跟踪 UTM 参数? (必须跟踪 UTM 参数,以便将会话/网站转化与您的广告系列相匹配。)
- 我可以将用户数据发送到哪些端点? (在向那里发送数据之前,请仔细检查您使用的服务类型。)
- 对于未同意的用户,我可以跟踪哪些类型的数据?
数据处理
- 我如何确保欧洲客户的数据在欧盟位置得到处理和存储?
- PII 数据如何流经我所有的数据管道和转换?
那些已经与他们的法律团队进行过对话的人都知道,就 PII 数据在最终报告的过程中发生的情况提供一个明确的答案是多么令人沮丧。
数据上报
- 如果所有区域都有不同的法律法规和不同的服务器,您如何为所有区域构建汇总报告?
- 为什么直接流量和新用户的份额意外增加?
让我们尽最大努力解决上述所有问题,让分析师在接下来的几周、几个月甚至几年里过得更轻松。
如何继续使用 Google Tech Stack 并遵守 GDPR
几乎每个营销团队都有一个成型的谷歌技术栈,每个人都习惯了,并且多年来一直完美无缺。 然而,上述限制和创新迫使公司寻找其他工具来处理数据。 好消息是,只要您遵循这些指南,您就可以继续使用熟悉的 Google 技术堆栈。
数据采集
1. 查看 Google Analytics 中的地理报告
您必须了解网站访问者来自哪些地区。 有多少来自美国和欧盟? 您肯定必须开始与访客最常来自的国家/地区合作。 我们相信每个人都知道在哪里可以找到他们的地理报告。 查看它们并定义大多数访问者来自的国家/地区列表。

2. 了解访客所在地区的数据保护法
哪些法律适用于来自这些县的访客? 感谢上帝,有一个很棒的网站,它结合了世界各地的所有法律和法规,可以很容易地确定您必须遵守哪些法律法规才能合规。

3.删除重复项并确定需求的优先级
完成第一步和第二步后,您必须对来自不同国家/地区的所有这些要求进行重复数据删除。 咨询律师,将法律英语翻译成数据分析师的英语。
在这个阶段结束时,无论您要将数据发送到哪个平台,您都会弄清楚所有隐私限制。 这不仅与谷歌有关。

4.正确实施同意模式。
最后,您必须实施同意模式。 借助第三方标签或与 GTM 集成的第三方产品,实施这些规则真的很容易。 按照这些链接查找 GTM 模板,以请求您的访问者同意将他们的数据发送到分析服务。

数据处理
最后,我们进入数据处理阶段。 虽然在前一阶段您意识到可以在何种同意下收集何种数据,但现在您可以开始捕获并处理这些数据。
每个人都知道,我们不能再像以前那样将 PII 数据发送到 GA——即使来自 GA 的数据随后被导出到 GBQ,并且 GBQ 的位置设置为 EU。 这是因为欧盟法律规定,如果没有适当的设置,您不能将 PII 直接发送到 GA。

1. 配置 Google Analytics 和 Google Tag Manager

这不是最难的任务。 您需要做的就是仔细检查此清单,接受新的 Google DPA,并禁用数据共享设置。 最重要的是,幽灵命中和谷歌信号也必须被禁用。

完成上述操作后,您可以通过防止未经同意收集 PII 来使 GA 在隐私和所有法规方面合规。
然而,一旦您在 GA 中调整了所有这些设置,您就会发现真正重要的数据在 GA 中找不到,因此在 Google BigQuery Export 中找不到。
我们正在谈论粒度位置数据、某些报告所需的一些 PII 数据,以及一些用作连接它的键的自定义维度,例如,与 CRM 数据。
显然,这种情况对您来说是行不通的,因为归根结底,作为一名分析师,您想要构建一个可操作的报告,并且您想要处理 SQL 可访问的数据。 幸运的是,您可以实施另一种解决方案:服务器端跟踪。
2.设置无cookie服务器端跟踪
您可以使用 OWOX 解决方案或构建您自己的解决方案。

注册演示以了解有关 OWOX BI 服务器端跟踪的更多信息
无论哪种方式,服务器最重要的是它必须位于欧盟。 这就是您如何确保在将所有 PII 数据发送到任何其他服务之前对其进行过滤。
根据我们的经验,服务器端跟踪可将收购活动跟踪的准确性提高 20%。 因此,迁移到服务器端跟踪有商业原因,而不仅仅是法律原因。
3.设置服务器端标签管理器
第三部分是设置服务器端标签管理器。 它为什么如此重要? 因为您希望控制您发送给分析服务以及所有第三方广告服务(Facebook、Bing)的所有数据。

此时,您可以在欧盟位置托管您的服务器端标签管理器,并过滤掉所有 PII 字段,例如 IP 地址。 您可以只发送每个广告服务所需的数据。
这就是您如何以符合 GDPR 要求的方式导出数据。
如果您仍然面临法律团队的反对,请说:嘿,我们如何确保没有人可以访问 Google BigQuery 中访问者的 PII 数据?
这时候,也是有解决办法的。 您可以打开客户管理的云 KMS 密钥并加密您的数据,以防止任何人访问它,我是说任何人。
老实说,我们还没有遇到任何组织在遵循所有这些建议后仍然对使用 GCP 存有疑问。
具有同意模式的 Google BigQuery 数据模式
现在让我们跳到一些更实用的建议。 同意模式是什么样的?
一旦您开始发送同意数据(例如,使用 OWOX BI),您将获得一个包含此同意模式的专用参数。
这是一个会话表。 如您所见,它有一个专用的 ConsentMode 字段,其中包含在网站上授予的同意值。

为了收集数据用于分析目的,您必须获得同意,并且您可以使用此 ConsentMode 参数的值找出同意选项。 符合分析需求的 Google Analytics 值是 G101 和 G111。 如果 gsc 参数具有这些值之一,您可以收集您的数据用于分析目的。
然而,如果您的网站访问者没有同意,您仍然可以存储他们的数据,但没有任何个人身份信息——就像您的网络服务器日志包含 IP 地址和用户代理但没有唯一的用户 ID 一样。
让我们来看看它是如何工作的。
想象一下,您尚未获得同意。 现在,每次点击都会有一个新的客户 ID 和 OWOX 用户 ID。
最重要的是,粒度位置数据将不可用。 这背后的想法如下:
您不能收集任何可以直接或间接识别个人身份的数据。 那是什么样的数据? 城市、纬度、经度、浏览器(即次要版本号和用户代理)、任何可用于指纹识别的信息,包括设备品牌/型号等。
但是,您可以存储非 PII 数据,例如没有任何可用于识别个人身份的 PII 的页面浏览量。 下面,您将了解为什么需要这些数据。
最明显的想法是获取总数,对吧? 我们相信每个人都希望在页面浏览量和转化次数方面有准确的总数,这些指标来自哪个特定用户并不重要。
数据报告从数据沿袭开始
现在,让我们转到数据报告,从数据沿袭开始。 一旦您收集了所有数据,您可能无法避免回答您的 PII 数据如何流动,如何设置和控制所有数据转换、连接、清理。
如果有一个专用工具可以显示所有这些转换以及您如何以最清晰和最可审计的方式得出最终报告,那就太好了——一个可以帮助您了解您的 PII 是否正确流动的工具。
例如,一旦您从不同地区收集数据,您就需要加入它以构建汇总。 或者说,用户同意和不同意的数据是分开存储的,需要在一份报告中计算整体指标。 为此,您需要了解数据模式。 您将需要在脑海中保留数十种转换。 如果计算中突然出现错误,没有清晰易懂的数据沿袭,您将花费大量时间搜索和消除错误。 当您需要数据沿袭时,这些只是数百个用例中的几个。
为了解决我们的客户经常面临的这个问题,我们在 OWOX BI 中创建了一个清晰的转换图,可以清楚地显示您的数据移动的方式、位置和原因。 有了它,你可以很容易地看到计算逻辑并影响它:
- 跟踪数据如何从连接器移动和更改到仪表板。
- 在每个报告中设置和控制数据转换和指标计算逻辑。
- 单击几下即可管理 SQL 转换。
- 安排数据更新以保持数据最新。
- 立即查看更新数据的任何错误或延迟。

1.创建数据目录
首先,数据目录是一种组织数据资产清单的方式,尤其是那些包含 PII 数据的资产。 您必须清楚地标明它是什么类型的 PII 数据。 例如,您可以对数据进行加密、散列或解密。 这取决于您将如何使用它。
2. 为每个数据资产分配一个所有者
其次,您必须为每个数据资产分配一个所有者。 例如,您可以将自己设置为访问者的所有者,以便轻松了解谁拥有数据以及哪些类型的字段与 PII 数据相关。
3. 以列为基础定义 PII 安全性
最后但同样重要的是,您甚至可以在列的基础上定义 PII 数据安全性,以确定您是要加密数据还是散列数据。

好消息是 GC 提供了一种使用列键加密的简单方法,无需从头重写所有 SQL 查询。
简短的结论
通过遵循本文中的建议,您将能够:
- 在 Google BigQuery 中获取所有数据
- 过滤非同意用户的所有 PII 数据
- 避免丢失未经同意的 PII 数据以获得总数和构建汇总报告
- 告诉您的法律团队您的数据如何流经所有管道


谷歌技术堆栈和 GDPR | 合规检查表
下载