在 Data Studio 中构建和激活数据集
上次更新时间: 2025年11月7日
请注意:若您是超级管理员,请了解如何将您的账户加入测试版。
HubSpot Data Studio整合外部客户数据,为您的技术栈提供统一的同步、集成和激活平台。用户可从Google表格、Snowflake及数据同步应用等外部来源构建数据集,并将其集成到列表、工作流和报告中,实现高效的数据驱动决策。
开始前须知
- 查看、编辑和同步数据集需具备数据工作室权限。
- 查看和编辑权限默认开启。超级管理员需为数据集用户开启同步权限,方可使用HubSpot 积分在Data Studio 中操作。
- 在HubSpot 产品与服务目录中了解订阅限制的更多信息。
什么是数据集?
数据集是整合自整个HubSpot账户的数据集合,可包含HubSpot及/或外部数据源。数据集可包含CRM对象属性、HubSpot资产属性、外部数据源字段,以及用于数据计算的公式。
在词汇表中了解有关数据集定义的更多信息。
数据工作室的应用场景
以下关键应用场景展示了如何利用外部数据集增强客户关系管理记录、优化工作流程、创建动态客户列表,以及构建数据集报告。
同步第三方应用程序数据
您可将第三方应用的数据集直接同步至HubSpot CRM,从而实现:
- 使用外部数据集更新CRM记录
- 通过计算公式字段生成新属性
- 一键即时写入CRM数据
例如,您可将产品使用平台(如Mixpanel)的数据与公司数据集融合,在HubSpot中创建强大的产品参与度评分属性。
了解如何同步第三方应用程序数据。
将数据同步至HubSpot的CRM
您可以将数据同步至HubSpot的CRM系统以实现:
- 优化受众细分
- 发送更个性化的营销邮件
- 基于数据洞察优化销售触达策略
例如,您可以创建一个跨渠道追踪客户行为的数据集。通过将这些数据同步回客户关系管理系统(CRM),可优化受众细分以识别高意向潜在客户。利用这些洞察,您能根据客户偏好定制个性化邮件营销活动,从而提升互动率与转化率。
了解如何将数据同步至HubSpot的CRM系统。
在工作流中使用数据集
您可在工作流中使用数据集实现以下功能:
- 为主要数据集记录构建一次性或定期工作流
- 将数据集字段整合到工作流操作中
例如,利用参与度评分数据集构建工作流,自动向客户发送潜在升级或流失风险提醒。该工作流还能主动联系可能适合升级的客户。
了解如何在工作流中使用数据集。
使用数据集创建细分群体
您可以使用数据集创建细分以:
- 将产品使用情况、潜在客户评分和客户数据导入并合并至Data Studio
- 将HubSpot联系人数据与外部来源整合,通过筛选器优化洞察
- 生成符合特定条件的数据集联系人筛选列表
例如,利用目标客户数据集生成动态细分群体,驱动自动化营销活动,实现大规模个性化客户体验。
了解如何运用数据集创建细分群体。
在报告中使用您的数据集
您可在报告中使用数据集实现以下功能:
- 整合多个数据源,创建包含CRM、外部应用程序和分析平台信息的统一报告
- 动态应用筛选器对数据进行分段,聚焦特定群体、行为或趋势
- 通过公式字段构建自定义指标与计算,生成独特的绩效指标。
例如,可创建字段根据交易金额属性计算年度经常性收入,随后在报告中使用数据集中的该数据追踪收入趋势、预测未来收益并分析客户留存率随时间的变化。
了解如何在报告中使用数据集。
将数据集导出至Google表格和Office 365 Excel
您可以将数据集导出至 Google 表格和 Office 365 Excel 以:
- 维护外部副本以实现归档或增强安全性。
- 即使没有互联网连接也能处理数据。
- 轻松与团队成员共享数据集,实现实时编辑与反馈。
例如,将 HubSpot 数据集导出至 Google 表格或 Office 365 Excel,企业可优化数据以清晰洞察收入趋势和客户获取情况,随后安全地与外部利益相关者共享数据,而无需授予其访问 HubSpot 的权限。
了解如何导出数据集。
创建数据集
创建数据集的方法:
- 在你的 HubSpot 帐户中,导航到数据管理 > Data Studio。
- 点击右上角的创建数据集。
数据源
数据源是数据集的基础。在词汇表中了解不同数据源的详细信息。
- 在“来源”选项卡的“选择主要数据源”下,点击“选择数据源”。
- 在选择数据屏幕上,选择您的主要数据源:
- 在“已同步来源”选项卡中,点击HubSpot数据源或第三方应用程序的数据源。要添加新来源,请点击“+ 新建来源”,然后按照提示操作。
- 在CSV选项卡中,点击CSV文件作为数据源。要添加 CSV 文件,请点击+ 上传新 CSV,然后按照提示操作。
- 要添加次要数据源,请点击“+ 添加次要数据源”,然后按照上述步骤操作。根据需要继续添加次要数据源。
- 若需连接多个数据源构建复杂数据集,请点击 使用高级数据源配置。
高级数据源配置
要连接另一个数据源:
- 点击“连接其他数据源”,或在数据源查看器中点击+ 图标。

- 在HubSpot 数据源或外部数据源选项卡中选择数据源。
- 点击继续。
- 在“预览关联”页面配置以下内容:
-
- 左表框将显示您选择的主数据源。
- 右表框将显示您选择的附加数据源。
- 点击左侧下拉菜单选择左连接或 内部连接。
- 左连接:返回[主数据源]的所有行及[次数据源]中匹配的行。
- 内连接:返回在[主数据源]和[辅助数据源]中均存在匹配值的行。
- 点击使用关联标签或使用匹配键。
- 使用关联标签:为连接选择关联标签。
- 使用匹配键:为左表和右表分别选择匹配键。
- 在匹配行为下,指定所选数据源之间的关系:
- 多重匹配:左表中一行可匹配右表中多行。
- 仅限单一匹配:左表中每行最多可匹配右表中一行。额外行将不被包含。
- 点击添加自定义连接。
列
- 在“列”选项卡中,拖放列以自定义其顺序。
- 要选择要在数据集中显示的列,请点击“选择列”,然后勾选所需列旁的复选框。
- 要创建新列,请点击“+ 创建新列”。探索以下不同列创建选项:
数据代理
使用数据代理进行研究并生成新数据:
- 点击展开数据代理。然后点击创建智能列。
- 在智能列名称文本框中输入列名。
- 在描述需求文本框中 ,撰写您希望 智能列生成并提取的数据描述。
- 点击“+ 插入列标记”以引用数据集内的其他属性。
- 点击“数据来源?”下拉菜单选择数据源。
- 网络研究:来自互联网搜索的数据。
- 公司研究:来自公司主网站的数据。
- 数据集列:来自数据集其他列的数据。
- 点击“数据类型”下拉菜单,指定单元格中的信息类型(例如数字、文本或日期)。
- 字符串
- 数字
- 布尔值
- 点击预览。
- 智能列现已显示在表格中。
增强
使用数据增强功能填补空白或验证数据:
- 点击展开数据增强功能。随后点击增强[主数据源]列或 增强[次数据源]列。

- 点击[数据源][属性]的列下拉菜单 ,选择需要增强的列属性。
- 在"选择要创建的列"区域勾选属性旁的复选框。也可通过搜索栏查找属性。
- 点击预览或创建[#]列。
公式
使用公式基于其他列创建计算:
- 单击展开公式。然后单击以下选项之一:
-
- 应用开关语句
- 比较日期
- 查找替换
- 公式构建器(高级)
- 摘要度量
- 在底部面板中填写公式字段。
- 然后点击保存。
修饰符
使用修饰符应用格式更改和规范化:
- 点击“应用首字母大写”,然后执行以下操作:
- 点击“引用列”下拉菜单选择列。
- 在新列名称文本框中输入名称。
- 在选择首字母大写方式下,点击标题式、大写或小写。
- 点击创建列。
- 点击“修剪空格”,然后执行以下操作:
- 点击“要引用的列”下拉菜单选择列。
- 在新列名称文本框中输入名称。
- 点击创建列。
汇总与未汇总视图
用于查看数据集的视图分为两种类型:
- 汇总视图:当数据集包含多个数据源且主数据源与次数据源存在多重匹配时自动生成。该视图按主数据源分组展示数据,适用于CRM同步、工作流和列表操作。CRM同步、工作流及列表中仅显示汇总视图中的可用列。
- 未汇总视图: 用于展示未分组数据的数据集视图 。
请注意:当仅存在单一数据源,或不同数据源间呈一对一关系时(例如example@hubspot.com在Snowflake和HubSpot CRM中各出现一次),系统将不会提供汇总视图或非汇总视图选项,该数据集可直接用于报告、CRM同步、工作流和列表。了解如何配置数据连接设置。
筛选器
对数据集应用筛选器。
- 在筛选器选项卡中,可为数据集应用行级筛选器、聚合筛选器和分组汇总筛选器。
- 点击“包含匹配数据”下拉菜单,选择“下方所有筛选器”、“下方任意 筛选器”或“自定义筛选规则”。
- 点击“+ 添加筛选器”,从弹出框中选择筛选器。根据需要继续添加筛选器。

检查数据集
完成数据集自定义后,可执行以下操作:
- 检查表格以确保数据集显示正确。
- 点击"摘要视图"下拉菜单,选择以下选项之一:
-
- 汇总视图:按主要来源分组显示数据。适用于CRM同步、工作流和列表。
- 未汇总视图:显示未分组数据,包含所有来源的行。适用于报告生成。
- 若数据集配置满意,请点击 保存。点击“用于 ”可创建报告、工作流、列表,执行CRM同步或导出数据集。
术语表
数据源
数据源包括您需要报告的CRM对象(如联系人、自定义对象)、资产(如网站页面、电子邮件)和活动(如对话、销售)。每个数据集最多可选择五项。
主数据源作为数据集锚点,其他所有数据源均与其关联。HubSpot通过最短路径连接数据源,自动关联联系人、交易等相关数据,无需额外操作。
其他数据源需通过中间环节实现集成。例如当交易数据为主源时,若需调用博客文章数据,HubSpot将通过联系人及 网站活动建立关联,自动选择必要数据源。
附加数据源
您可向数据集添加次要数据源,将信息整合至单一视图。部分数据源将自动集成,其余则可能需要额外操作建立连接。
自动关联
常见的HubSpot数据组合(如公司+交易)以及与同步应用的集成(如联系人+Stripe发票)均支持自动关联。
选择这些数据源对时,系统将通过默认列(通常为电子邮箱地址或 公司域名)自动匹配行数据。
若需自定义匹配列,可在数据源面板管理关联设置。
自定义连接
当整合来自列结构灵活的数据源(如Google表格、AirTable、CSV文件和数据仓库)时,您必须提供额外信息以启用数据合并功能。
若需自定义连接,您需从每个数据源中选择匹配列。这通过使用电子邮件地址、ID或公司域名等通用标识符,确保数据正确对齐。
语法
函数内部可使用属性/字段数据或字面量数据。属性与字段数据将根据具体数据源动态变化,而字面量数据保持恒定。例如:
2021-03-05是一个字面日期,保持恒定。[CONTACT.createdate]是基于属性的日期,对每个联系人记录而言是动态的。
函数可同时包含字面量数据与属性/字段数据,前提是数据类型与函数所需参数兼容。例如:
DATEDIFF("MONTH", "2021-01-01", “[CONTACT.createdate]”)
下面将介绍字面量和属性/字段数据的语法,以及如何将其整合到公式中。
字面量语法
使用字面量在计算中添加特定的静态文本字符串、数字、真/假值和日期。
- 字符串字面量: 用引号包围的文本 。例如:
“My cool string”。
- 数字字面量:不带引号的数字。例如:
42。 - 布尔字面量:
true或false。 - 日期字面量: 格式为
"YYY-MM-DD"的字符串 ,或日期时间戳数字(例如1635715904)。
属性语法
属性引用允许您直接包含所选数据源属性的值。无需将属性添加为数据集字段即可进行引用。
引用属性时请使用以下语法:
- 引用表达式始终用方括号包围(
[和])。 - 属性引用需先指定对象或事件名称,后接句点及内部属性名称。例如:
[CONTACT.lifecyclestage][COMPANY.name][e_hs_scheduled_email_v2.__hs_event_native_timestamp]
字段引用语法
在公式中引用字段时,需用方括号括起字段名称。例如:
-
[Field 1][My awesome custom field]
只要公式的运算符和函数支持该字段的数据类型,即可在公式中引用字段。例如,若创建的新字段包含字符串,则可在支持字符串的函数中引用该字段:
- 若字段1为
[DEAL.name],则其包含字符串值(交易名称)。 CONCAT([Field 1], "Q4")该表达式有效,因其包含两个字符串值。CONCAT([DEAL.name], 2012)以下表达式无效,因其同时包含字符串与数字值:
运算符
运算符可用于字面量和属性/字段值,其计算遵循标准的PEMDAS运算顺序。这允许您使用括号嵌套运算符。例如:
- 数字与属性引用的加法:
1 + [DEAL.amount] - 使用括号嵌套运算:
(1 + 2) * (3 + 4)
| 运算符 | 描述 | 使用示例 |
|
|
加法运算。返回一个数字。 |
|
|
|
数字减法。返回一个数字。 |
|
|
|
乘数。返回一个数。 |
|
|
|
数字除法。返回一个数字。 |
|
|
|
取数的负值。 |
|
|
|
检查两个布尔值是否均为真。返回布尔值。 |
|
|
|
检查两个布尔值中是否至少有一个为真。返回布尔值。 |
|
|
|
对布尔值取反。返回另一个布尔值。 |
|
|
|
等值运算符。返回布尔值。 |
=true= true |
IF
IF逻辑是一组在特定条件满足时执行的规则。您可以使用IF逻辑对数据进行区分。例如,您可以使用IF逻辑来:
- 根据交易规模计算不同佣金(即大额交易给予更高比例)。
- 将交易按等级划分,便于在报告中进行分析和采取行动。
- 将反馈意见归类(例如将1-6级标记为"反对者")。
- 根据潜在客户被标记为线索的天数设定联系优先级。
标签
LABEL函数可将枚举属性区间值转换为用户友好型值。某些HubSpot定义属性(如交易和 联系人所有者)以内部值形式呈现,这会导致分析困难。当应用于支持翻译的HubSpot定义属性时,LABEL函数将根据门户设置而非用户设置提供翻译结果。例如,您可使用LABEL函数实现:
-
在字段中直接访问联系人或交易阶段名称
LABEL([DEAL.dealstage]) = "Closed Won"(10)
- 在字段中直接通过名称引用HubSpot所有者
LABEL([DEAL.hubspot_owner_id]) = "John Smith"
数字函数
| 函数 | 定义 | 参数 | 使用示例 |
|
|
计算数的绝对值。返回一个数。 |
number:要取绝对值的数值。 |
|
|
|
将十进制数四舍五入至最接近的整数。返回一个数值。 |
number:要取天花板的数值。 |
|
|
|
进行除法运算,但当除数为零时返回零。返回一个数值。 |
被除数:用于除法运算的被除数。 除数:作为除法操作中除数的数值,当除数为零时结果为零 |
|
|
|
计算欧拉数(e)的指定次幂。返回一个数值。 |
指数:欧拉数的幂次指数。 |
|
|
|
将十进制数向下舍入至最接近的整数。返回一个数值。 |
数值:欧拉数需提升至的指数值。 |
|
|
|
计算某个值的自然对数。返回一个数字。 |
number:要计算自然对数的值。 |
|
|
|
计算指定底数的对数。返回一个数值。 |
base:计算数值对数时使用的底数。 数值:要计算对数值的数值。 |
|
|
|
将基数值提升至指定幂次。返回一个数值。 |
底数:计算幂次的基数。 指数:要提升基数的幂次数。 |
|
|
|
计算非负数的平方根。返回一个数值。 |
number:求平方根的数值。 |
|
|
|
将数值分桶到等宽桶中。返回该值所属桶的编号。 若返回值低于最小值,则返回零。若返回值高于最大值,则返回桶数+1。 |
value:用于计算桶号的数值。 minValue:分桶操作的起始最小值。 maxValue:分桶的最大值。 bucketCount: 在minValue和 maxValue之间划分的等宽桶数量。 |
|
字符串函数
| 函数 | 定义 | 参数 | 使用示例 |
|
|
判断字符串是否包含区分大小写的子字符串。返回布尔值。 |
字符串:待检测的字符串值。 子字符串:需在字符串中查找的值。 |
|
|
|
连接两个字符串。返回字符串。 |
string1:将附加string2的字符串值。 string2:要附加到string1的字符串值。 |
|
|
|
计算字符串长度。返回一个数字。 |
string:要计算长度的字符串值。 |
|
|
|
移除字符串首尾空格。返回字符串。 |
string:要清除空格的字符串值。 |
|
日期函数
| 函数 | 定义 | 参数 | 使用示例 |
|
|
根据年、月、日部分创建日期值。返回日期。 |
年份: 目标日期的年份 部分。 month:所需日期的月份部分。 day:目标日期的日部分。 |
|
|
|
返回两个日期值之间以指定时间单位计算的时间间隔。返回数字。 |
日期部分:用于差值计算的年、季度、月、周或日单位。 date1:要从date2中减去的起始日期值。 date2:用于减去 date1 的结束日期值。 |
|
|
|
从日期值中提取年、季度、月、周或日。返回一个数字。 |
datePart:要提取的年份、季度、月份、周或日单位。 date:要从中提取日期部分的日期值。 |
|
|
|
截断日期值至其年、季度、月、周或日。 |
日期部分:截取为年、季度、月、周或日单位。 日期:要截取的日期值。 |
|
|
|
根据年、月、日、时、分、秒各部分创建时间戳值。返回一个日期时间值。 |
年份:目标日期中的年份部分。 month:目标日期中的月份部分。 日:目标日期中的日份。 |
|
|
|
计算指定日期对应的年度周数。返回数字值。 |
日期:用于计算年度内周数的日期时间值。 |
|
|
|
根据账户时区返回当前时间。返回一个日期时间值。 |
|
|
|
|
返回两个日期之间的工作日(周一至周五)数量。 |
value1:起始日期时间值。 value 2:结束日期时间值。 |
|
