集 和 组是tableau数据分析中常用的功能,在很多案例分析和教程里我们都能看到它们的踪影,特别是 集 配合筛选器、参数等功能,能够实现很多令人惊叹的效果。
集和组都是Tableau中进行数据处理、数据区分、数据筛选的重要功能。本文我们简单介绍Tableau中的集(set)和组(group)的区别与作用。
集的官方定义:
集(Set),是根据某些条件定义数据子集的自定义字段
组的官方定义:
组(group)通过将大量维度成员组合到更高级别的类别中,来简化大量维度成员
一、集 和 组的创建
一般常规创建集 或 组 的方法有两种
1、维度字段上右键 - 创建 - 集/组
2、视图上直接创建
在需要分组的视图中,按住Ctrl多选需要分组的项目成员,选中后会自动弹出下图中的快捷框,点击箭头标识的创建集 或 组
从标识上我们可以看到,''曲别针"形状的是 组,文氏图形状的是 集 。
二、集 和 组的区别
集和组他们的区别有很多。
1、从表现形式上来看:
集(Set)的效果,其划分结果只有两种,in 或者 out ,也就是内 和外 ,符合条件的是内,其余是外。
组(group)的效果,是根据需要将不同维度聚合起来,组可以有多个。
比如我们可以按照 物品的体积将子类别再分成大、中、小型用品。
2、从功能用途上去区分:
集合可以参与计算,就可以理解它是一种二进制数据还是布尔数据。
[En]
Set can participate in the calculation, you can understand that it is a kind of binary data or Boolean data.
组是维度的进一步聚合,它不可以用于计算。
3、从成员设置创建上去区分:
集的创建 除了我们手动选择成员,还可以通过 条件和排序去进行设置
而组只能手动选择成员。
按条件创建集:
按排序创建集:
三:集和组的主要使用场景
集(set)在日常使用中有着较多的使用场景。下面我们列举几种常用的 集的使用。
1、用作数据标记
上面介绍到,集是一种二分类的数据形式。我们可以通过 创建集的形式轻易的标记出我们要重点关注的数据。
如:我们想将利润率大于 10 % 的子类别产品标记出来。
首先:子类别创建一个 集【利润率大于10%】
将新建的 集 拖入标记功能区颜色。我们可以很容易看到哪些是利润率比较高的子类别。
2、用做筛选器
毫无疑问,除了用集合标记数据外,我们还可以使用集合作为过滤器来过滤出我们关心的数据集。
[En]
There is no doubt that in addition to tagging data with sets, we can also use sets as filters to filter out the data sets we care about.
3、使用集来当维度字段。
这一作用和 组(group) 很像。虽然 集 只是二分类数据,但是依然不妨碍它本身是维度数据这一特征。
4、用于计算字段
如上所述,集合可以在计算字段中使用。由于集合的二进制分类特征,在计算领域中可以作为判断逻辑来确定它是否在集合中。
[En]
As mentioned above, sets can be used in calculated fields. Because of the binary classification feature of the set, it can be used as judgment logic to determine whether it is in the set or not in the calculation field.
比较经典的有 使用集来选择 TOPN 和 其他 数据 。如下动图所示
由于使用场景丰富,作者将在下一篇文章中单独介绍这一部分。
[En]
Due to the rich use scenarios, the author is going to introduce this part separately in the next article.
组 的使用场景 :
上文有介绍,组主要是将大量维度进行进一步聚合,这基本上就是组(group)的主要功能。 笔者不再过多赘述。
下篇文章我们会对 集在计算字段中的使用及功能做进一步介绍。
如果本文对你有所帮助,欢迎点赞关注。谢谢大家。
Original: https://blog.csdn.net/adbandon/article/details/123692248
Author: 江边鸟~
Title: 简单介绍Tableau中的集(set)和组(group) --(上)

十分钟掌握聚类算法的评估指标

BES音频框架分析—Audioflinger

聚类分析、matlab我国各地区普通高等教育发展状况分析、Q型、R型聚类

python依据相同字段实现两个excel文件(dataframe)合并

Tensorflow—使用Tensorflow进行机场与湖泊的二分类

Detectron2安装踩坑记录(比较详细版)

图解神经网络:卷积、池化、全连接(通道数问题、kernel与filter的概念)

语音识别课前准备-kaldi安装流程

train.py: error: the following arguments are required: –config解决办法

【浙政钉】微信-专有钉钉小程序-开发踩坑实记

【OpenCV】在Python环境下安装OpenCV并检测是否安装成功

chrome文字转语音(tts)

无人机避障四种常见技术中,为何大疆首选双目视觉

野生yolov3在atlas200dk的部署
