在 Data Studio 中构建和激活数据集
上次更新时间: 2025年12月3日
Hub
Spot
Data Studio整合外部客户数据,为您的技术栈提供统一的同步、集成和激活平台。用户可从Google表格、Snowflake及数据同步应用等外部来源构建数据集,将其整合到列表、工作流和报告中,实现高效的数据驱动决策。
开始使用前
- 需具备数据工作室权限方可查看、编辑及同步数据集。
- 查看和编辑权限默认开启。超级管理员需为数据集用户开启同步权限,方可使用HubSpot 积分在 Data Studio 中操作。
- 更多订阅限制详见HubSpot 产品与服务目录。
什么是数据集?
数据集是整合自整个HubSpot账户的数据集合,可包含HubSpot及/或外部数据源。数据集可包含CRM对象属性、HubSpot资产属性、外部数据源字段以及用于数据计算的公式。
在词汇表中了解数据集定义。
Data Studio 应用场景
以下关键应用场景展示如何利用外部数据集增强 CRM 记录、优化工作流、创建动态客户列表,并构建数据集报告:
同步第三方应用数据
可将第三方应用数据集直接同步至 HubSpot CRM,从而实现:
- 使用外部数据集更新CRM记录
- 通过计算公式字段生成新属性
- 一键即时写入数据至CRM
例如,可将产品使用平台(如Mixpanel)的数据与公司数据集整合,在HubSpot中创建强大的产品参与度评分属性
。 了解如何同步第三方应用程序数据。
将数据同步至HubSpot CRM
您可将数据同步至HubSpot CRM以实现:
- 优化受众细分
- 发送更个性化的营销邮件
- 基于数据洞察优化销售触达
例如:创建跨渠道客户行为追踪数据集,将其同步回CRM后可优化受众细分,精准识别高意向潜在客户。基于这些洞察,您能发送契合客户偏好的个性化邮件营销活动,从而提升互动率与转化率
。 了解如何将数据同步至HubSpot的CRM系统。
在工作流中使用数据集
您可在工作流中运用数据集实现:
- 为主要数据集记录构建一次性或周期性工作流
- 将数据集字段整合至工作流操作
例如:利用互动评分数据集构建自动化工作流,在客户存在升级或流失风险时触发预警。该工作流还能主动联系具备升级潜力的客户。
了解如何在工作流中使用数据集。
利用数据集创建细分群体
您可通过数据集创建细分群体以实现:
- 将产品使用情况、潜在客户评分和客户数据导入并合并至数据工作室
- 将HubSpot联系人数据与外部来源整合,通过筛选器优化洞察
- 生成符合特定条件的数据集联系人筛选列表
例如:利用精准客户数据集生成动态分段,驱动自动化营销活动,实现大规模个性化客户体验
。 了解如何使用数据集创建分段。
在报告中使用数据集
您可在报告中使用数据集实现:
- 整合多数据源创建统一报告,融合CRM、外部应用及分析平台信息
- 通过动态应用筛选器聚焦特定群体、行为或趋势
- 通过公式字段构建自定义指标与计算,生成独特绩效指标
例如:创建字段根据交易金额属性计算年度经常性收入,随后在报告中使用该数据集追踪收入趋势、预测未来收益并分析客户留存情况
。 了解如何在报告中使用数据集。
将数据集导出至Google表格和Office 365 Excel
您可将数据集导出至Google表格和Office 365 Excel以实现:
- 维护外部副本以实现归档或增强安全性。
- 离线状态下仍可处理数据。
- 轻松与团队成员共享数据集,实现实时编辑与反馈。
例如,将 HubSpot 数据集导出至 Google 表格或 Office 365 Excel 后,企业可优化数据以清晰洞察收入趋势和客户获取情况,随后在无需授予 HubSpot 访问权限的前提下安全地与外部利益相关者共享数据
。 了解如何导出数据集。
创建数据集
创建数据集的步骤:
- 在你的 HubSpot 帐户中,导航到数据管理 > Data Studio。
- 点击右上角的"创建数据集"。
数据源
数据源是数据集的基础。在词汇表中了解不同数据源的详情。
- 在"来源"选项卡中,点击"选择主要数据源"下的"选择数据源"。
- 在选择数据屏幕上,选择您的主要数据源:
- 在“已同步来源”选项卡中,点击HubSpot数据源或第三方应用程序的数据源。要添加新来源,请点击“+ 新建来源”,然后按照提示操作。
- 在CSV选项卡中,点击CSV文件将其设为数据源。要添加 CSV 文件,请点击+ 上传新 CSV,然后按照提示操作。
- 要添加次要数据源,请点击“+ 添加次要数据源”,然后按照上述步骤操作。根据需要继续添加次要数据源。
- 若需连接多个数据源构建更复杂的数据集,请点击使用高级数据源配置。
高级数据源配置
连接其他数据源:
- 点击“连接其他数据源”,或在数据源查看器中点击+ 图标。

- 在HubSpot 数据源或外部数据源选项卡中选择数据源。
- 点击继续。
- 在“预览关联”页面配置以下内容:
-
- 左表框将显示您选择的主数据源。
- 在右表框中,将显示您选择的附加数据源。
- 点击左侧下拉菜单选择左连接或内部连接。
- 左连接:返回[主数据源]的所有行以及[次数据源]中匹配的行。
- 内连接:返回在[主数据源]和[辅助数据源]中均存在匹配值的行。
- 点击使用关联标签或使用匹配键。
- 使用关联标签:为连接选择关联标签。
- 使用匹配键:为左表和右表分别选择匹配键。
- 在匹配行为下,指定所选数据源之间的关系:
- 多重匹配:左表中一行可匹配右表中多行。
- 仅限单一匹配:左表中每行最多可匹配右表中一行。额外行将不被包含。
- 点击添加自定义连接。
列
- 在“列”选项卡中,拖放列以自定义其顺序。
- 要选择要在数据集中显示的列,请点击选择列,然后勾选所需列旁的复选框。
- 要创建新列,请点击“+ 创建新列”。探索以下不同列创建选项:
数据代理
使用数据代理进行研究并生成新数据:
- 点击展开数据代理,然后点击创建智能列。
- 在智能列名称文本框中输入列名。
- 在描述需求文本框中 ,撰写您希望 智能列生成并提取的数据描述。
- 点击“+ 插入列令牌”以引用数据集内的其他属性。
- 点击“数据来源?”下拉菜单选择数据源。
- 网络研究:来自互联网搜索的数据。
- 公司研究:来自公司主网站的数据。
- 数据集列:来自数据集其他列的数据。
- 点击“数据类型”下拉菜单,指定单元格中的信息类型(例如数字、文本或日期)。
- 字符串
- 数字
- 布尔
- 点击预览。
- 智能列现已显示在表格中。
数据增强
使用数据增强功能填补缺失值或验证数据:
- 点击展开数据增强功能。随后点击增强[主数据源]列或增强[次数据源]列。

- 点击[数据源][属性]的列下拉菜单 ,选择需要增强的列属性。
- 在"选择要创建的列"区域勾选属性旁的复选框。也可通过搜索栏查找属性。
- 点击预览或创建[#]列。
公式
使用公式基于其他列创建计算:
- 点击展开公式。然后点击以下任一选项:
-
- 应用开关案例
- 比较日期
- 查找替换
- 公式构建器(高级)
- 摘要度量
- 在底部面板中填写公式字段。
- 然后点击保存。
修饰符
使用修饰符应用格式更改和标准化:
- 点击应用首字母大写,然后执行以下操作:
- 点击"引用列"下拉菜单选择列。
- 在新列名称文本框中输入名称。
- 在选择首字母大写方式下,点击标题式、大写或小写。
- 点击创建列。
- 点击“修剪空格”,然后执行以下操作:
- 点击“要引用的列”下拉菜单选择列。
- 在新列名称文本框中输入名称。
- 点击创建列。
汇总视图与非汇总视图
查看数据集时有两种视图类型:
- 汇总视图:当数据集包含多个数据源且主数据源与次数据源存在多重匹配时自动生成。该视图按主数据源分组展示数据,适用于CRM同步、工作流和列表操作。CRM同步、工作流及列表中仅显示汇总视图中的可用列。
- 未汇总视图: 用于展示未分组数据的数据集视图 。
请注意:当仅存在单一数据源,或不同数据源间呈一对一关系时(例如example@hubspot.com在Snowflake和HubSpot CRM中各出现一次),系统将不会提供汇总视图或非汇总视图选项,该数据集可直接用于报告、CRM同步、工作流和列表。 了解如何配置数据连接设置。
筛选器
对数据集应用筛选器。
- 在筛选器选项卡中,可为数据集应用行级筛选器、聚合筛选器和分组汇总筛选器。
- 点击"包含匹配数据"下拉菜单,选择"下方所有筛选条件""下方任意筛选条件"或"自定义筛选规则"。
- 点击“+ 添加筛选器”,从弹出框中选择筛选器。根据需要继续添加筛选器。

数据集预览
完成数据集自定义后,可执行以下操作:
- 检查表格以确保数据集显示正确。
- 点击“摘要视图”下拉菜单,选择以下选项之一:
-
- 摘要视图:按主要来源分组显示数据。适用于CRM同步、工作流和列表。
- 未汇总视图:显示未分组数据,包含所有来源的行。适用于报告生成。
- 若对数据集满意,请点击 保存。点击“使用于 ”可创建报告、工作流、列表,执行CRM同步或导出数据集。
术语表
数据源
数据源包含您需要报告的CRM对象(如联系人、自定义对象)、资产(如网站页面、邮件)及活动(如对话、销售)。每个数据集最多可选择五个数据源。
主数据源作为数据集锚点,其他所有数据源均与其关联。HubSpot通过最短路径连接数据源,自动关联联系人、交易等相关数据,无需额外操作。
其他数据源需通过中间连接实现集成。例如当交易为主数据源时,若需调用博客文章数据,HubSpot将通过联系人及网站活动建立关联,自动选择必要数据源。
附加数据源
您可向数据集添加次级数据源以整合信息至单一视图。部分数据源将自动集成,其余则需额外操作建立连接。
自动关联
常见数据组合(如企业 + 交易)及同步应用集成(如联系人 + Stripe 发票)支持自动关联。
选择此类数据源对时,系统将通过默认列(通常为电子邮箱或 企业域名)自动匹配行数据
。 您可在数据源面板自定义匹配列。
自定义关联
当整合具有灵活列结构的数据源(如Google表格、AirTable、CSV文件和数据仓库)时,需提供额外信息才能实现数据合并。
若需自定义关联,您需要从每个数据源选择匹配列。这通过使用电子邮件地址、ID或公司域名等通用标识符确保数据正确对齐。
语法规范
函数内部可使用属性/字段数据或字面量数据。属性与字段数据将根据具体数据源动态变化,而字面量数据保持恒定。例如:
2021-03-05是字面日期,保持恒定。[CONTACT.createdate]是基于属性的日期,每个联系人记录中该值均为动态数据。
函数可同时包含字面量
与
属性/字段数据,前提是数据类型与函数所需参数兼容。例如:
DATEDIFF("MONTH", "2021-01-01", "[CONTACT.createdate]")
下文将介绍字面量与属性/字段数据的语法,以及如何将其融入公式。
字面量语法
使用字面量在计算中添加特定的静态文本字符串、数字、真/假值及日期。
- 字符串字面量: 用引号括起的文本 。例如:
“My cool string”。
- 数字字面量:不带引号的数字。例如:
42。 - 布尔字面量:
true或false。 - 日期字面量: 格式为
"YYYY-MM-DD"的字符串 ,或日期时间戳数字(如1635715904)。
属性语法
属性引用允许您直接包含所选数据源属性的值。无需将属性添加为数据集字段即可引用。
引用属性时请使用以下语法:
- 引用表达式始终用方括号(
[和])包围。 - 属性引用需先指定对象或事件名称,后接句点及内部属性名称。例如:
[CONTACT.lifecyclestage][COMPANY.name][e_hs_scheduled_email_v2.__hs_event_native_timestamp]
字段引用语法
在公式中引用字段时,需用方括号括起字段名称。例如:
-
[字段 1][我的超赞自定义字段]
只要公式的运算符和函数支持该字段的数据类型,即可在公式中引用字段。例如,若创建的新字段包含字符串,则可在接受字符串的函数中引用该字段:
- 若字段 1 为
[DEAL.name],则其包含字符串值(交易名称)。 CONCAT([字段 1], "Q4")是有效的,因为它包含两个字符串值。CONCAT([交易.名称], 2012)则无效,因其同时包含字符串与数字值。
运算符
运算符可与字面量及属性/字段值配合使用,并遵循标准运算规则PEMDAS进行求值。这允许您使用括号嵌套运算符。例如:
- 数字与属性引用的加法:
1 + [DEAL.amount] - 使用括号嵌套运算:
(1 + 2) * (3 + 4)
| 运算符 | 描述 | 使用示例 |
|
|
加法运算。返回一个数字。 |
|
|
|
减去数字。返回一个数字。 |
|
|
|
乘法运算。返回一个数字。 |
|
|
|
进行数字除法运算。返回一个数值。 |
|
|
|
取数的负值。 |
|
|
|
检查两个布尔值是否均为真。返回布尔值。 |
|
|
|
检查两个布尔值中是否存在为真的值。返回布尔值。 |
|
|
|
否定一个布尔值。返回另一个布尔值。 |
|
|
|
等值运算符。返回布尔值。 |
=true= true |
IF
IF逻辑是一组在特定条件满足时执行的规则。可利用IF逻辑实现数据区分。例如:
- 根据交易规模计算不同佣金(即大额交易给予更高比例)。
- 将交易按层级分类,便于在报告中分析和采取行动。
- 将反馈意见归类(例如将1-6级标记为"反对者")。
- 根据潜在客户被标记为线索的天数设定联系优先级。
LABEL
LABEL 函数可将枚举属性区间值转换为用户友好型值。某些 HubSpot 定义属性(如交易和 联系人所有者)以内部值形式呈现,这会增加分析难度。当配合支持转换的 HubSpot 定义属性使用时,LABEL 函数将根据门户设置(而非用户设置)提供转换结果。例如,您可使用 LABEL 函数:
-
在字段中直接访问联系人或交易阶段名称
LABEL([DEAL.dealstage]) = "成交成功"(10)
- 在字段中直接引用HubSpot所有者姓名
LABEL([DEAL.hubspot_owner_id]) = "John Smith"
数值函数
| 函数 | 定义 | 参数 | 使用示例 |
|
|
计算数的绝对值。返回一个数。 |
number:要取绝对值的数值。 |
|
|
|
将十进制数四舍五入到最接近的整数。返回一个数字。 |
number:要取上取整的数值。 |
|
|
|
对数值进行除法运算,但当除数为零时返回零。返回一个数值。 |
被除数:用于除法运算的被除数。 除数:除法运算中使用的除数,当除数为零时返回零值 |
|
|
|
计算欧拉数(e)的指定次幂。返回一个数字。 |
指数:欧拉数的幂次。 |
|
|
|
将十进制数向下舍入到最接近的整数。返回一个数字。 |
number:欧拉数的幂次指数。 |
|
|
|
计算一个值的自然对数。返回一个数字。 |
number:要计算自然对数的值。 |
|
|
|
计算指定底数的对数值。返回一个数字。 |
base:计算数值对数时使用的底数。 value:要计算对数值的数值。 |
|
|
|
将基数值提升到指定幂次。返回一个数字。 |
基数:要计算幂的数值。 exponent:要乘以的指数。 |
|
|
|
计算非负数的平方根。返回一个数字。 |
number:要求平方根的数值。 |
|
|
|
将数值分配到等宽桶中。返回该值所属桶的编号。 若返回值低于最小值,则返回零。若返回值高于最大值,则返回桶数+1。 |
value:用于计算桶号的数值。 minValue:开始分桶的最小值。 maxValue:分桶的最大值。 bucketCount:在minValue和maxValue之间进行分桶所需的等宽桶数。 |
|
字符串函数
| 函数 | 定义 | 参数 | 使用示例 |
|
|
判断字符串是否包含区分大小写的子字符串。返回布尔值。 |
string:待检测的字符串值。 子字符串:在字符串中需要查找的值。 |
|
|
|
连接两个字符串。返回一个字符串。 |
string1:将附加string2的字符串值。 string2:要附加到string1的字符串值。 |
|
|
|
计算字符串的长度。返回一个数字。 |
string:要计算长度的字符串值。 |
|
|
|
移除字符串首尾空格。返回字符串。 |
字符串:要清除空格的字符串值。 |
|
日期函数
| 函数 | 定义 | 参数 | 使用示例 |
|
|
根据年、月、日各部分创建日期值。返回日期。 |
年份:所需日期的年份部分 。 month:所需日期的月份部分。 day:所需日期的日部分。 |
|
|
|
返回两个日期值之间以指定时间单位计算的时间间隔。返回一个数字。 |
日期部分:用于计算差异的年、季度、月、周或日单位。 date1:要从date2中减去的起始日期值。 date2:用于减去 date1 的结束日期值。 |
|
|
|
从日期值中提取年份、季度、月份、周或天。返回一个数字。 |
datePart:要提取的年份、季度、月份、周或日单位。 date:要从中提取日期部分的日期值。 |
|
|
|
截断日期值至其年、季度、月、周或日。 |
日期部分:截断后的年份、季度、月份、周或日单位。 date:要截断的日期值。 |
|
|
|
根据年、月、日、时、分、秒部分创建时间戳值。返回一个日期时间值。 |
年份:所需日期中的年份部分。 month:目标日期中的月份部分。 day:目标日期中的日份。 |
|
|
|
计算日期所在年度的周序号。返回一个数字。 |
日期:用于计算年度内周数的日期时间值。 |
|
|
|
根据您账户时区返回当前时间。返回日期时间值。 |
|
|
|
|
返回两个日期之间的工作日数(星期一至星期五)。 |
value1:起始日期时间值。 value2:结束日期时间值。 |
|
