在 Data Studio 中构建和激活数据集
上次更新时间: 2025年9月4日
请注意:如果您是超级管理员,请了解如何将您的账户选入测试版。
HubSpot Data Studio整合外部客户数据,为技术堆栈的同步、整合和激活提供统一平台。用户可以从 Google Sheets、Snowflake 和数据同步应用程序等外部来源建立数据集,然后将它们集成到列表、工作流和报告中,以实现高效的数据驱动决策。
开始使用前
- 要查看、编辑和同步数据集,您必须拥有Data Studio权限。
- 查看和编辑权限默认已打开。超级管理员必须为数据集用户打开同步权限,才能让他们使用数据工作室的HubSpot Credits。
什么是数据集?
数据集是整个HubSpot账户的数据集合,可以由HubSpot和/或外部数据源组成。数据集可包括CRM对象和HubSpot资产的属性、外部数据源的字段以及计算数据的公式。
在术语表中了解有关数据集定义的更多信息。
数据工作室的使用案例
下面的主要使用案例展示了如何利用外部数据集来增强 CRM 记录、优化工作流、创建动态客户列表以及使用数据集构建报告。
从第三方应用程序同步数据
您可以将第三方应用程序的数据集直接同步到 HubSpot CRM。这样您就可以
- 使用外部数据集更新 CRM 记录
- 从计算公式字段生成新属性
- 只需单击一下,即可将数据写入 CRM
例如,您可以将产品使用平台(如 Mixpanel)的数据与公司数据集混合,在 HubSpot 中创建强大的产品参与度评分属性。
了解如何从第三方应用程序同步数据。
将数据同步到 HubSpot 的 CRM
您可以将数据同步到 HubSpot 的 CRM,以便:
- 改进受众细分
- 发送更个性化的营销电子邮件
- 根据从数据中获得的信息改进您的销售推广工作
例如,您可以创建一个数据集,跟踪不同渠道的客户行为。通过将这些数据同步回客户关系管理,您可以完善受众细分,从而识别出高意向的潜在客户。利用这些洞察力,您可以发送针对客户偏好的个性化电子邮件营销活动,从而提高参与度和转化率。
了解如何将数据同步到 HubSpot 的 CRM。
在工作流程中使用您的数据集
您可以在工作流中使用数据集,以便
- 为主要数据集记录建立一次性或周期性工作流
- 将数据集字段纳入工作流操作中
例如,利用参与度评分数据集构建一个工作流,针对潜在升级或流失风险自动发出客户警报。该工作流还可以主动联系非常适合升级的客户。
了解如何在工作流中使用数据集。
使用数据集创建细分市场
您可以使用数据集创建分段:
- 将产品使用情况、销售线索评分和客户数据导入并合并到 Data Studio 中
- 将 HubSpot 联系人数据与外部来源相结合,利用筛选器完善洞察力
- 生成符合特定条件的数据集联系人筛选列表
例如,利用目标客户数据集生成动态细分市场,推动自动营销活动,大规模提供个性化客户体验。
了解如何使用数据集创建细分市场。
在报告中使用数据集
您可以在报告中使用数据集:
- 结合多个数据源,利用来自客户关系管理、外部应用程序和分析平台的信息创建统一的报告
- 通过应用筛选器动态地细分数据,以关注特定群体、行为或趋势
- 使用公式字段建立自定义指标和计算,生成独特的性能指标。
例如,您可以创建一个字段,根据交易金额属性计算每年的经常性收入,然后在报告中使用数据集中的这些数据来跟踪收入趋势、预测未来收益并分析随时间推移的客户保留率。
了解如何在报告中使用数据集。
将数据集导出到 Google Sheets 和 Office 365 Excel
您可以将数据集导出到 Google Sheets 和 Office 365 Excel:
- 为存档或提高安全性保留外部副本。
- 即使没有互联网连接也能使用数据。
- 与团队成员轻松共享数据集,以获得实时编辑和反馈。
例如,将HubSpot数据集导出到Google Sheets或Office 365 Excel中,企业就可以完善数据,清楚地了解收入趋势和客户获取情况,然后在不授予HubSpot访问权限的情况下与外部利益相关者安全地共享数据。
了解如何导出数据集。
创建数据集
创建数据集
- 在你的 HubSpot 帐户中,导航到数据管理 > Data Studio。
- 单击右上角的创建数据集。
数据源
数据源是数据集的基础。在术语表中了解有关不同数据源的更多信息。
- 在 "来源"选项卡上,在 "选择 主要数据源"下单击 "选择数据源"。

- 在 "选择数据"屏幕上,选择主要数据源:
- 在 "同步来源"选项卡上,单击 HubSpot 数据源或来自第三方应用程序的数据源。要添加新源,请单击+ 新源,然后按提示操作。
- 在CSV选项卡上,单击要用作数据源的CSV文件。要添加 CSV 文件,请单击+ 上传新 CSV,然后按提示操作。
- 要添加辅助源,请单击+ 添加辅助源,然后按照上述步骤操作。根据需要继续添加辅助源。
- 要加入其他数据源以构建更复杂的数据集,请单击 使用高级源配置。
高级源配置
连接另一个数据源:
- 单击加入另一个数据源,或数据源查看器中的+ 图标。
- 在HubSpot 数据源或外部数据源选项卡上,选择一个数据源。
- 单击继续。
- 在 "预览你的加入"屏幕上,配置以下内容:

-
- 在左表框中,将显示你选择的主数据源。
- 在右表框中,将显示您选择的附加源。
- 单击左侧下拉菜单,选择左连接或内连接。
- 左连接:返回来自[主数据源]的所有记录和来自[辅助数据源] 的任何匹配记录。
- 内连接:返回[主数据源]和[辅助数据源] 中具有匹配值的记录。
- 单击使用关联标签或使用匹配键。
- 使用关联标签:为连接选择关联标签。
- 使用匹配键:为左表和右表选择匹配键。
- 在匹配行为下,指定所选数据源之间的关系:
- 多个匹配:左表中的一条记录可以匹配右表中的多条记录。
- 只匹配一次:左表中的一条记录最多只能匹配右表中的一条记录。不会包含其他行。
- 单击添加自定义连接。
列
- 在 "列"选项卡上,拖放列以自定义其顺序。

- 要选择要在数据集中显示的列,请单击选择列,然后单击要显示的列旁边的复选框。
- 要创建新列,请单击+ 创建新列。探索以下不同的列创建选项:
数据代理
使用数据代理进行研究并生成新数据:
- 单击展开数据代理。然后,单击创建智能列。

- 在智能列名称文本框中,键入列名称。
- 在 "描述您想知道的内容 "文本框中,写入您想从智能列中生成和提取的数据的描述。
- 单击+ 插入列标记,以引用数据集中的其他属性。
- 点击数据来源下拉菜单,选择数据来源。
- 网络研究:来自互联网搜索的数据。
- 公司研究:来自公司主要网站的数据。
- 数据集列:数据集中另一列的数据。
- 单击数据类型下拉菜单,指定单元格中的信息类型(如数字、文本或日期)。
- 字符串
- 数字
- 布尔
- 单击预览。
- 现在表格中将出现智能列。
丰富
使用 "丰富 "功能填补空白或验证数据:
- 单击展开Enrichment。然后,单击丰富[主要数据源]列或丰富[次要数据源]列。
- 单击[数据源] [属性] 列 下拉菜单,选择要丰富的列属性。
- 在"选择要创建的列"下,单击属性旁边的复选框。也可以使用搜索栏查找属性。
- 单击预览或创建 [#] 列。
公式
使用公式创建基于其他列的计算:
- 单击展开公式。然后,单击以下其中一个:
-
- 应用开关情况
- 比较日期
- 查找和替换
- 公式生成器(高级)
- 摘要测量
- 在底部面板中,填写公式字段。

- 然后点击保存。
修改器
使用修改器应用格式更改和规范化:
- 单击应用大写,然后执行以下操作:
- 单击引用列下拉菜单选择列。
- 在新列名文本框中键入名称。
- 在"选择大小写"下单击 "标题大小写"、"大写"或 "小写"。
- 单击创建列。
- 单击修整空白,然后执行以下操作:
- 单击 "引用列"下拉菜单选择列。
- 在新列名称文本框中键入名称。
- 单击创建列。
汇总和非汇总视图
有两种视图可用于查看数据集:
- 汇总视图:当数据集有多个数据源,并且主数据源和辅助数据源之间可能有多个匹配时创建的数据集视图。该视图将显示按主要数据源分组的数据,并将在 CRM 同步、工作流和列表中使用。只有汇总视图中可用的列才能在 CRM 同步、工作流和列表中使用。
- 未汇总视图: 显示未分组数据的数据集视图。它用于报告。在只有一个数据源或不同数据源之间存在 1:1 关系的情况下,报告、CRM 同步、工作流和列表中只能使用未汇总视图。
过滤器
对数据集应用过滤器。
- 在 "筛选器"选项卡上,对数据集应用行级筛选器、汇总筛选 器和组汇总筛选器。
- 单击 "如果匹配则包括数据"下拉菜单,然后选择以下所有筛选器、以下任意筛选器或自定义筛选器规则。
- 单击+ 添加筛选器,然后从弹出框中单击筛选器。根据需要继续添加筛选器。
查看数据集
完成数据集定制后,您可以执行以下操作:
- 查看表格,确保数据集显示正确。
- 单击汇总视图下拉菜单,选择以下其中一种:

-
- 汇总视图:显示按主要来源分组的数据。用于 CRM 同步、工作流和列表。
- 未汇总视图:显示未分组的数据,包含所有来源的行。
- 如果对数据集满意,请单击 保存。单击 " 在其中使用 " 以创建报告、工作流、列表、进行 CRM 同步或导出数据集。
术语表
数据源
数据源包括要报告的 CRM 对象(如联系人、自定义对象)、资产(如网站页面、电子邮件)和活动(如对话、销售)。每个数据集最多可选择五个。
主数据源是数据集的锚,所有其他数据源都链接到它。HubSpot 使用最短路径将它们连接起来,自动加入联系人和交易等相关数据,无需额外步骤。
其他数据源需要中间连接进行整合。例如,如果 "交易"是主要数据源,而需要博客文章数据,HubSpot 会通过 "联系人"和"网络活动"将它们连接起来,自动选择必要的数据源。
其他数据源
你可以在数据集中添加辅助数据源,将信息整合到单一视图中。一些数据源会自动集成,而其他数据源则可能需要额外输入才能建立连接。
自动连接
自动连接适用于常见的 HubSpot 数据组合(如公司 + 交易)以及与同步应用程序的集成(如联系人 + Stripe 发票)。
选择这些源对时,会使用默认列(通常是电子邮件地址或公司域)自动匹配行。
要自定义匹配列,可以在源面板中管理连接。
自定义连接
在整合来自具有灵活列结构的数据源(如 Google Sheets、AirTable、CSV 和仓库)的数据时,必须提供额外的详细信息,才能实现数据合并。
如果需要自定义连接,则需要从每个数据源中选择匹配的列。这样可以确保数据正确对齐,使用通用标识符,如电子邮件地址、ID 或公司域。
语法
在一个函数中,你可以使用来自属性和字段的数据或字面数据。属性和字段数据将根据各个数据源而动态变化,而字面数据则是恒定的。例如
2021-03-05
是字面日期,是恒定的。[CONTACT.createdate]
是基于属性的日期,对于每条联系人记录都是动态的。
只要数据类型与函数所需的参数兼容,函数既可以包含字面数据,也可以包含属性/字段数据。例如
DATEDIFF("MONTH", "2021-01-01", “[CONTACT.createdate]”)
下面将介绍字面数据和属性/字段数据的语法,以及如何将它们纳入公式。
字面语法
使用文字在计算中添加特定的静态文本字符串、数字、真假值和日期。
- 字面字符串: 用引号包围的文本。例如,
“My cool string”
.
- 数字字面:不带引号的数字。例如:
42
。 - 布尔字面:
true
或false
。 - 日期字面: 格式为
"YYY-MM-DD"
的字符串,或日期时间戳数字(如1635715904
)。
属性语法
通过属性引用,可以直接包含所选数据源属性中的值。您无需将属性添加为数据集字段即可引用该属性。
在引用属性时,请使用以下语法:
- 引用表达式总是用方括号 (
[
和]
) 包围。 - 属性引用指定对象或事件名称,后面跟句号和内部属性名称。例如
[CONTACT.lifecyclestage]
[COMPANY.name]
[e_hs_scheduled_email_v2.__hs_event_native_timestamp]
字段引用语法
在公式中引用字段时,可在字段名周围加上方括号。例如
-
[Field 1]
[My awesome custom field]
只要公式的运算符和函数接受字段的数据类型,就可以在公式中引用字段。例如,如果创建了一个包含字符串的新字段,就可以在接受字符串的函数中引用该字段:
- 如果字段 1 是
[DEAL.name]
,它包含一个字符串值(交易名称)。 CONCAT([Field 1], "Q4")
将是有效的,因为它包含两个字符串值。CONCAT([DEAL.name], 2012)
则无效,因为它包含一个字符串和一个数字值。
操作符
操作符可以与字面值和属性/字段值一起使用,操作符按照标准 PEMDAS 运算顺序进行运算。这样就可以使用括号嵌套操作符。例如
- 将数字与属性引用相加:
1 + [DEAL.amount]
- 使用括号嵌套操作:
(1 + 2) * (3 + 4)
操作符 | 说明 | 使用示例 |
|
数字相加。返回一个数字。 |
|
|
减去数字。返回一个数字。 |
|
|
数字相乘。返回一个数字。 |
|
|
除数。返回一个数字。 |
|
|
否定一个数。 |
|
|
检查两个布尔值是否均为真。返回一个布尔值。 |
|
|
检查两个布尔值中是否有一个为真。返回一个布尔值。 |
|
|
否定一个布尔值。返回另一个布尔值。 |
|
|
等式运算符。返回一个布尔值。 |
=true = 真 |
IF
IF 逻辑是在满足特定条件时执行的一组规则。您可以使用 IF 逻辑来区分数据。例如,您可以使用 IF 逻辑来
- 根据交易规模计算不同的佣金(例如,交易规模越大,佣金越高)。
- 将交易分级,以便在报告中进行分析和采取行动。
- 将反馈回复转化为类别(例如,标签 1-6 为减分者)。
- 根据联系人被标记为 "线索"的天数确定其优先级。
标签
LABEL 函数可将枚举属性区间值转换为用户友好的值。一些 HubSpot 定义的属性(如交易和联系人所有者)表示为内部值。这给分析带来了困难。当与支持翻译的 HubSpot 定义属性一起使用时,LABEL 函数将根据门户设置而非用户设置提供翻译。例如,你可以使用 LABEL 函数来
-
直接在字段中访问联系人或交易阶段名称
LABEL([DEAL.dealstage]) = "Closed Won"(10)
- 在字段中直接引用 HubSpot 所有者的名称
LABEL([DEAL.hubspot_owner_id]) = "John Smith"
数字功能
函数 | 定义 | 参数 | 使用示例 |
|
计算一个数字的绝对值。返回一个数字。 |
number:要计算绝对值的数字。 |
|
|
将十进制数值四舍五入为最接近的整数。返回一个数字。 |
number:取上限的数字。 |
|
|
除以一个数字,但当被除数为 0 时返回 0。返回一个数字。 |
除数:除法运算中用作除数的数字。 除数:除法运算中用作除数的数字,除数为零时,总值为零 |
|
|
计算机欧拉数提升到一个值。返回一个数字。 |
指数:欧拉数的指数。 |
|
|
将十进制数值向下舍入为最接近的整数。返回一个数字。 |
number:欧拉数的指数。 |
|
|
计算数值的自然对数。返回一个数字。 |
number:数值的自然对数。 |
|
|
计算一个数值在指定基数内的对数。返回一个数字。 |
base:计算数值的对数时使用的基数。 值:要取对数的数字。 |
|
|
将基数提高到指定的幂。返回一个数字。 |
基数:要计算幂的数值。 指数:基数的幂级数。 |
|
|
取非负数的平方根。返回一个数字。 |
number:要取平方根的数字。 |
|
|
将数值分成宽度相等的桶。返回数值所在桶的编号。 如果返回值低于最小值,则返回 0。如果返回值高于最大值,则返回桶数 +1。 |
value:要计算的数值,以桶为单位。 minValue:开始分选的最小值。 maxValue:分选到的最大值。 bucketCount:在minValue和maxValue之间进行分选的等宽桶数。 |
|
字符串功能
函数 | 定义 | 参数 | 用法示例 |
|
判断字符串是否包含区分大小写的子串。返回布尔值。 |
string:要测试的字符串值。 substring:字符串中要检查的值。 |
|
|
连接两个字符串。返回一个字符串。 |
string1:字符串值,string2 将附加到该字符串。 string2:要追加到 string1 的字符串值。 |
|
|
计算字符串的长度。返回一个数字。 |
string:要计算长度的字符串值。 |
|
|
删除字符串的首部和尾部空白。返回字符串。 |
string:要删除空白的字符串值。 |
|
日期函数
函数 | 定义 | 参数 | 使用示例 |
|
用年、月、日创建日期值。返回日期。 |
年: 所需日期的年部分。 月:所需日期的月部分。 日:所需日期的日部分。 |
|
|
返回指定时间单位内第一个日期值和第二个日期值之间的时间单位数。返回一个数字。 |
datePart:差值计算中要使用的年、季、月、周或日单位。 date1:从 date2 减去的起始日期值。 date2:从 date1 减去的终止日期值。 |
|
|
从日期值中提取年、季、月、周或日。返回一个数字。 |
datePart:要提取的年、季、月、周或日单位。 date:要提取日期部分的日期值。 |
|
|
将日期值截断为年、季、月、周或日。 |
datePart:要截断的年、季、月、周或日单位。 date:要截断的日期值。 |
|
|
根据年、月、日、小时、分钟和秒创建时间戳值。返回日期时间值。 |
年:所需日期的年部分。 月:所需日期的月部分。 日:所需日期的日部分。 |
|
|
计算日期在一年内的周数。返回一个数字。 |
date:用于计算一年内星期数的日期时间值。 |
|
|
根据账户时区返回当前时间。返回日期时间值。 |
|
|
|
返回两个日期之间的周天数(周一至周五)。 |
value1:起始日期时间值。 value2:结束日期时间值。 |
|