数据传输报表文件会提供来自广告系列的非汇总事件级数据。从本质上说,此类数据是 Ad Manager 广告服务器日志中的原始内容,其中包含针对每类事件生成的单独文件。数据传输文件包含的事件数据精确到秒,而且您可选择在此类文件中添加其他信息,以查看与事件相关的设备、地理位置和其他信息。合作伙伴需要先在 Ad Manager 中批准广告单元,才能使它们显示在他们的数据传输文件中。
开始
使用数据传输报表文件需要支付额外费用。 首先,您必须在高级功能下启用数据传输功能。您还可以在该页面上查看价格详情。请注意,如要通过高级功能启用数据传输功能,您需要拥有管理员权限。
之前是否已启用数据传输功能?对于之前通过线下附页在“高级功能”之外启用了数据传输功能的广告资源网,请注意以下详细信息:
- 系统会要求您通过“高级功能”重新接受相关条款,具体请参阅以下步骤。通过高级功能启用数据传输功能将使线下附录协议失效。如有任何疑问,请与您的客户经理联系。
- 之前已启用的所有受管理的 360 广告资源网都需要联系其客户经理,以获取有关通过“高级功能”启用数据传输功能的帮助。
如需了解更多信息,请与您的客户经理联系。
启用“数据传输”报告
如果您的组织无法管理 ETL(提取、转换和加载)处理、支持大文件、操控文本文件、设计和管理中型数据存储以及设计和实现脚本,请考虑与已获批准的 Google Marketing Platform 合作伙伴合作。
- 登录 Google Ad Manager。
- 依次前往管理和高级功能。
- 在“功能”下,找到“数据传输报告”。
- 在“费率”下,查看数据传输报告的价格详情。
- 如需启用“数据传输”报告,请在“状态”下,将相应按钮切换为开启状态
,然后查看并接受相关条款及条件。
启用此功能后,您便可设置数据传输配置。Google Ad Manager 提供两种数据传输输出文件类型,即 CSV 和 Parquet。
可用的数据传输报表文件
每个数据传输文件都包含有关不同事件的信息。您可以向每种文件类型添加字段,以查看与这些事件相关的背景信息。
Backfill 文件,Network 文件中就不会包含 Ad Exchange 或 AdSense 通过动态分配投放的展示次数。也就是说,使用 Backfill 文件可获得与动态分配的展示次数相关的信息。关于数据传输文件中包含的数据
- 数据延迟
比记录的时间最多延迟 15 小时是正常现象,但数据传输文件的处理时间有时会比平常稍长一些。如果数据延迟,则相应的数据会显示在下一个按小时进行批量处理的文件中,并会带有准确的时间戳。举例而言,如果发生了处理延迟,则可能意味着:文件中的大部分时间戳都会是上午 8 点到上午 9 点,但也会包含一小部分更早的时间戳。 -
无活动的小时
如果某个小时内未发生任何活动,系统会发布只包含标题数据的空白数据传输文件。 - 日期和时间的界限
与给定日期第一个小时对应的文件通常会包含太平洋时间零点到凌晨 1 点之间发生的事件,但事件时间戳采用的是发布商广告资源网所在的时区。例如,如果发布商的时区设为美国东部时间,那么发布商在与当天第一个小时对应的文件中会看到凌晨 3 点到凌晨 4 点之间发生的事件。在此前的 3 个小时内发生的事件实际上会包含在前一天的文件中。因此,时间戳上的日期可能与文件名所显示的日期不同。请务必参阅文件中事件的时间戳,而不是文件的发布时间或文件名。 - 数据传输文件中的主广告素材/随播广告素材报表
数据传输文件会同时显示主广告素材和随播广告素材的展示信息,而查询工具仅会针对主广告素材/随播广告素材集统计一次投放的展示(而不是针对每个广告素材统计一次展示),除非按主广告素材/随播广告素材细分相关信息。
对于随播广告素材的展示,IsCompanion为“TRUE”。CreativeId字段包含各个主广告素材和随播广告素材的广告素材 ID,而不是广告素材集 ID。数据传输文件中没有与广告素材集 ID 相关的额外字段,所以无法将随播广告素材展示数据与主广告素材展示数据关联。 - 与 Ad Manager 报表的差异
系统会定期从 Ad Manager 报表/API 生成的报表中移除劣质流量数据(网络垃圾数据)。由于要兼顾数据传输文件的发布时间表,系统可能不会反映某些这样的清理操作。这就可能会导致数据传输文件中显示的展示次数、点击次数或其他事件要略多一些。差异程度通常约为 1%。您的
CodeServes数据传输文件显示的值可能会高于 Ad Manager 报表中的“代码调用次数”指标,这是因为数据传输会针对已投放广告的每次展示统计一次代码调用,而报表只会针对每次请求统计一次代码调用。某些广告素材格式(例如 Google Ads 文字广告)可能会在单项请求中包含多次展示。按KeyPart字段值对数据传输文件进行分组,找出唯一身份展示次数以便进行比较。请注意,您的“请求数”和“展示次数”数据传输文件显示的值可能会低于 Ad Manager 报告中的“广告空缺的展示次数”指标,这是因为数据传输只会统计未匹配的广告请求,而报告会同时统计未匹配的广告请求和未匹配的中介请求。数据传输中广告空缺的展示次数将与报告中的“未匹配的广告请求总数”指标更加接近。
NetworkBackfillBidsJoinable文件包含来自广告资源网管理的代码广告的出价。这些出价的 BidSourceType 值为 4,不会显示在 Google Ad Manager 报告中。在比较“数据传输”与 Google Ad Manager 报告之间的出价总额时,请排除BidSourceType = 4。
“CSV”和“Parquet”输出格式的利弊
| CSV(逗号分隔值) | Parquet(列式存储) | |
|---|---|---|
| 可读性和可访问性 | 人类高度可读;可使用基本文本编辑器或电子表格软件轻松打开和修改。 | 需要使用专门的工具查看和编辑;对非技术用户而言,不太容易上手。 |
| 通用性和兼容性 | 几乎所有数据分析和处理工具都能提供广泛支持。 | 可能需要额外的库或软件才能实现完全兼容,尤其是在旧版系统中。 |
| 简单性和易用性 | 结构简单;易于理解和使用,特别适合处理较小的数据集或进行快速的临时分析。 | 最初的实现可能较为复杂,尤其是对于不熟悉列式存储的用户。 |
| 性能和效率 | 由于是行式存储且缺少压缩,在处理大型数据集时速度可能会较慢。 | 由于是列式存储且采用高效的压缩技术,在进行大规模数据处理和分析时性能卓越。 |
| 存储效率 | 存储效率较低,因为缺少内置压缩功能且可能会存储冗余数据。 | 由于是列存储且采用高级压缩算法,存储效率很高,从而降低存储费用。Parquet 文件可能比 CSV 文件小 50-75%,尤其是对于大型数据集。 |
如果您已启用 CSV 格式的数据传输,请联系您的客户经理以获取对 Parquet 的访问权限。
下载示例文件
您可以下载这些示例文件(采用 CSV 或 Parquet 格式),以便预览各个数据传输报告文件中包含的数据和字段。
| 事件类型 | 文件名和类型 | 文件内容 | 示例文件 |
|---|---|---|---|
| 可参与竞价的出价 | NetworkBackfillBidsJoinable |
出价相关信息。可与其他数据传输文件联接。 每小时一次。 |
|
| 代码调用 | NetworkCodeServes |
用于记录 Ad Manager 的每次响应,无论系统是否下载了广告。 每小时 2 次。 注意:请求文件和 CodeServe 文件包含在展示文件中,无需额外付费。 |
|
| 展示 | NetworkImpressions |
已下载广告的展示次数的相关信息。 每小时 2 次。 |
|
| 请求 | NetworkRequests |
用于记录 Ad Manager 收到的每项广告请求,无论相应广告资源是否填充了广告。 每小时 2 次。 注意:请求文件和 CodeServe 文件包含在展示文件中,无需额外付费。 |
|
| Active View | NetworkActiveViews |
符合 Active View 条件的 Ad Manager 展示次数的相关信息。 每小时 2 次。 |
|
| 出价 | NetworkBackfillBids (Beta 版) |
Authorized Buyers 竞价和“公开出价”型竞价中的出价相关信息。 每小时一次。 |
|
| 点击 | NetworkClicks |
有关点击的信息,包括 TrueView 的完整观看点击。 每小时 2 次。 |
|
| 能胜出的最低出价 | NetworkMinimumBidToWin (Beta 版) |
用于报告当有至少 1 个补余订单项参与竞争时,买方为在竞价中获胜而需给出的最低出价。 每小时一次。 |
|
| 富媒体转化 | NetworkRichMediaConversions |
Studio 事件的相关信息,包括标准和自定义操作次数(例如播放次数和暂停次数)、操作时长,等等。 每小时 2 次。 |
|
| 视频转化 | NetworkVideoConversions |
视频特定事件的相关信息,包括操作(例如点赞、播放和暂停)、内容 ID、广告连播位置,等等。查看所有视频事件。 每小时 2 次。 |
如何传输文件
数据传输文件会按每小时一次的频率推送到 Ad Manager 云端存储分区。我们建议您定期轮询以查看是否有更新。系统会递送大部分数据并会在所记录的那一小时后的 5-15 个小时之间准备好相应数据,但某些延迟事件的数据可能需要长达 8 天(自事件发生之日起算)才能就绪。Ad Manager 不会将数据传输信息递送给第三方服务器。
文件名包含事件的起始小时,该时刻使用美国太平洋时区(会遵循夏令时),但该文件中的时间戳始终采用 Ad Manager 广告资源网时区(可能不遵循夏令时)。这可能会导致生成空文件或文件被跳过,也可能会导致文件包含超过一个小时的数据,具体取决于这些时区设置之间的相互影响。
在夏令时转换期间,系统会传送所有展示数据。
文件名
数据传输文件名遵循以下可预测性惯例:
- CSV:
[类型]_[广告资源网 ID]_[YYYYMMDD]_[HH].gz - Parquet:会提交到名为
[Type]_[Network ID]_[YYYYMMDD]_[HH]/的文件夹内,其中包含名为[Type]_[Network ID]_[YYYYMMDD]_[HH]-[分区索引]-of-[分区总数].parquet的分区文件
YYYYMMDD表示年、月、日。HH表示 24 小时制的起始小时。HH每个文件名中指定的小时数值(01、02、03)均采用美国太平洋时区,但发布商可根据数据传输文件中包含的时间戳获取采用广告资源网时区的数据。请在考虑文件传送时注意这种差异。
[分区索引]文件所属的分区,相对于已创建的文件总数(分区数),从零开始计数。[分区总数]是指用于创建文件的文件数(分区数)。
对于 Parquet 格式,我们会发布一个“_corrected”文件夹,并将“_corrected”文件放置在该文件夹内。
使用数据传输报告文件
如果您已设置“数据传输”功能,文件就会保存在 Ad Manager 云端存储分区中。您可以借助命令行工具或通过 API 在线访问这些文件。详细了解如何访问 Ad Manager 云端存储分区
如果您依据文件名中的起始小时选择一组特定数据传输文件以用于数据提取和分析,则可能会因夏令时、数据收集延迟或其他类似情景而忽略后续文件中提供的数据。最好将所有数据传输文件都读取到一个独立的系统(例如数据仓库或查询引擎)中,然后根据事件时间戳来选定数据分析范围。
数据传输文件有两种格式:CSV 文件或 Parquet 文件。
用户可以为每个文件选择 CSV、Parquet 或这两种输出格式。Parquet 是数据仓库用例和提取情形的最佳格式,而 CSV 文件可在电子表格编辑器中使用,具体取决于文件大小。以下是您可选择用来应用数据传输信息的一些常用方法示例:
- 获取事件和活动的维度级用户汇总(例如,按广告素材汇总)
- 将用户与客户数据库进行匹配
- 针对用户地理位置和受众特征信息生成报告
您可以使用匹配表基于名称和 ID 的对应关系查找数据传输文件中包含的值,从而将广告投放信息(如广告单元或订单项)与存储在数据库中的预分配值匹配起来。
在本地存储文件
推荐做法是:确保压缩文件中的每个事件占用 25-35 个字节。这样,如果压缩的 CSV 文件中包含 1000 万个展示事件,就需要占用约 300 MB 的磁盘空间。使用 Parquet 输出格式时,文件大小应该会更小。请注意,这些只是估算值,实际文件可能略大。此外,由于这是数据压缩后的大小,因此您必须有额外的存储空间来解压和使用这些文件。
存储时间超过 60 天的数据传输文件将被从 Ad Manager 中清除。如果您希望文件的存储时长超过规定的 60 天,我们建议您在本地存储文件,或改用永久性云端存储解决方案(这可能需要一个完全由您控制的独立 Google Cloud Storage 账号)。