数据分析中的定性与定量数据
数据分析是一种利用统计学或逻辑方法来解读和评估数据的技术。它涉及对信息的全面总结,并进一步用于收集和展示最终结果,以便有效地传达关键发现或结论。
然而,这一过程要求研究者区分所收集的数据。为了简化数据分析流程,必须掌握两种基本方法:定性数据和定量数据。
定性数据和定量数据都是创建、观察、验证和收集的数据形式。数据可以呈现为数字或非数字格式,例如数值、事实、测量值、记录、笔记本、视频和图像等。
尽管如此,两者之间存在诸多差异。要在项目中做出恰当选择,必须分别了解每种数据类型及其区别。
因此,让我们深入了解定性数据和定量数据之间的差异。
定性与定量数据:它们是什么?
为了更清晰地理解这些术语,首先需要注意的是,前者是解释性的、探索性的和主观的,而后者是结论性的、客观的和精确的。
定性数据
定性数据是指无法通过数值测量、表示或计数的信息。此类信息通常从音频、图像、文本等来源收集,并通过概念图、时间线、信息图表等可视化工具进行呈现。
例如,当用户访问您的网站并将商品添加到购物车但最终放弃购买时,您的任务是深入调查“为什么”和“如何”。例如,您需要了解访问者放弃购物车的原因以及用户对您的网站或产品的感受。在此情境下,“质量”是核心框架;因此,您需要从定性数据中获取洞察力。
在上述示例中,您无需依赖数字来了解用户行为背后的原因,而是需要询问他们的动机和体验。换句话说,定性数据是描述事物特征的标签或术语,例如将冰淇淋口味标注为“巧克力”,或将海洋描述为“蓝色”。
定性数据是一种非统计形式,通常呈现半结构化或非结构化状态。这意味着这类数据无需通过图表来获取具体的数值。相反,其特点在于形式、标签、属性和其他识别标识符。
定性数据可以通过文件、文本、视频记录、录音、焦点小组、访谈记录、笔记和观察等方式生成。此外,诸如驾驶执照号码或社会安全号码之类的身份识别号码也属于定性数据,因为它们对个体而言是独一无二且具有分类意义的。
示例:金色把手、光滑饰面、深棕色、美式坚果风味、意大利制造、绿色衬衫、蓝色海洋、精美图片等。
定量数据
定量数据是指可以用数值测量或计数的信息。它被认为是研究人员进行统计分析和数学计算以做出合理决策的任何可量化数据。
这类数据主要回答诸如“有多少?”、“多久一次?”、“多少钱?”等问题。定量数据可以通过数学技术轻松验证和评估。为了更好地理解,请看以下示例:
一位顾客询问店主:“那台打印机多少钱?”
收集不同设备价格等数据是一个定量问题。数值与大多数测量参数相关,如重量(公斤、磅)、成本(美元)等。
定量数据可以通过民意调查、问卷调查等方式收集,并用于统计分析。简单地说,可以“量化”的信息被称为定量数据。它本质上是结构化的,可以通过统计数据和报告进行计算,这意味着它具有明确的定义和严谨性。
定量数据更加封闭和简洁,可以通过测试、调查、实验、指标、市场报告等方式生成。
示例:以公斤为单位的重量、以英寸或英尺为单位的高度、以公里或英里为单位的距离、以年或月为单位的年龄、以美元为单位的收入、以厘米为单位的长度等。
定性与定量数据:差异
定性数据和定量数据在各自的领域中都占据重要地位。为了更好地理解它们,我们需要从标准、功能、性质等方面来区分它们。
让我们首先了解一些基本区别:
- 根据质量或属性分类的数据称为定性数据。相反,可以计数或用数字表示的数据称为定量数据。
- 定性数据依赖于个人理解、情感、颜色等。另一方面,定量数据依赖于数值,您可以从中获得统计结果来辅助决策。
- 在定性数据中,收集口头信息;而在定量数据中,则收集可测量的信息。
- 定性数据有助于初步理解,而定量数据则为最终行动提供依据。
到目前为止,我们已经了解了这两种数据类型背后的主要概念。现在,我们将深入探讨它们之间的一些关键区别。
开始吧!
标准 | 定性数据 | 定量数据 |
定义 | 定性数据分析是一种用于深入理解社会和人文科学的技术,以获得最终结果。 | 定量数据分析是一种用于通过逻辑和数学技术生成事实性信息和数字信息的技术。 |
数据 | 它包含宗教、国籍、事物的颜色、品味、性别等数据。 | 它包含重量、质量、大小、身高、价格等数据。 |
方法 | 它遵循主观分析,其中涉及无法计算的非统计数据。 | 它遵循可以通过数学推导轻松计算的客观分析。 |
分析 | 分析侧重于解释为什么发生某种现象,用户感受如何,以及用户为什么放弃购物车等。 | 这里的分析侧重于解释开发的数量或数量,例如购物车放弃率。 |
示例 | 这里的示例不具有代表性,并且整个过程中的样本量始终很小。 | 样本量很大,可以进行泛化。 |
采集方法 | 可以采用书面文件、访谈、观察等方式采集定性数据。 | 可以采用实验、访谈、观察、调查、民意调查等方式采集定量数据。 |
数据类型 | 基于文本。 | 基于数字。 |
结果 | 汇总结果用于分析数据或简单地赋予意义。 | 这里的结果依赖于通过图表展示的变化。 |
元素 | 文字、物体、图片等。 | 数字和图形信息。 |
现实生活中的例子
示例 1:(办公空间)
办公空间是一个很好的例子,可以体现两种数据类型,具体取决于每个元素的功能。
定性数据
- 宽敞开阔
- 自然光充足
- 大型厨房区域
- 凉爽的喷泉
- 引人注目的墙漆
- 美观的相框
- 大型室内游戏空间
定量数据
- 建筑面积为 12,000 平方英尺
- 楼层数
- 窗户数量
- 门数
- LED 灯数量
- 系统数量
示例 2:(网站上的文章)
定性数据
- 文章的性质
- 文章质量,例如拼写、语法、标点符号等。
- 读者对此的感受
- 文章对主题和术语的描述方式
- 所使用的视频和音频的质量
定量数据
- 字数
- 使用的图像数量
- 参与度,例如评论、页面浏览量等。
- 加载时间
- 产生的潜在客户数量
示例 3:(大学校园)
定性数据
- 高大茂盛的树木
- 鲜艳的色彩
- 新一代建筑
- 智能灯和风扇
- 大型教室
- 炫酷的投影仪
- 优质书籍
定量数据
- 教室数量
- 楼栋数量
- 空调通风口数量
- 停车场面积(平方米)
- 教室大小
- 长凳数量
- 楼层数
定性数据与定量数据:类型
定性数据的类型
统计学家和研究人员将定性数据分为三类:
- 二元数据:当您将项目分类为“好”或“坏”、“硬”或“软”、“对”或“错”、“新鲜”或“陈旧”时,它被称为二元数据。换句话说,您可以使用相互排斥的特性来表征定性数据,这意味着它们不能同时存在。统计学家使用这些数据来创建模型以预测项目的性质。
- 名义数据:也称为标记数据或命名数据。这是一种可用于命名事物而无需提及任何数值的数据类型。
例如,如果按颜色将一组项目分类,则可以直接根据其颜色标记每个项目。研究人员使用这些名义数据来区分信息集,例如颜色。统计学家和研究人员也可以使用这种类型来创建多项选择调查,以了解哪种选择更受欢迎。
- 顺序数据:顺序数据是一种按照特定比例或顺序分类的定性数据。这是数据收集的重要步骤。
例如,当受访者以 1 到 10 的等级对服务满意度进行评分时,系统会根据输入收集数据。这里,没有可用于测量每个等级之间差异的标准尺度。一些示例包括李克特量表、区间量表等。
定量数据的类型
定量数据分为两种主要类型:离散数据和连续数据。让我们分别了解一下。
离散数据
离散数据是一种定量数据类型,仅包含数字计数,不涉及长度、重量、高度等任何类型的测量。例如,学生人数、天数、吊扇数量、个人年龄等。
在识别离散数据时,您可以使用以下问题来区分:
- 能数吗?
- 可以分割吗?
- 可以测量吗?
等等…
离散数据也称为属性数据,不能分解为更小的部分。可以说它要么是可数的有限,要么是可数的无限。
示例:可数的有限数据是一个集合 A = {1, 2, 3, 4, …, n},其中 n 是小于无穷大的数。可数的无限数据是一个集合 B = {1, 2, 3, …}。
连续数据
连续数据是一种可以放置在测量尺度上的定量数据类型,这意味着它可以采用可以分解为较小部分的数值。可以将连续数据分类为不可数有限和不可数无限。
例如,学生的平均绩点以 10 分制衡量。在这里,学生的分数可以在 0 到 10 之间,包括 8.5、1.57、4.65、2.68、9.8 等。此类数据可以归类为不可数有限连续数据,因为它具有上限和下限。
同样,您可以举一个不可数无限数据的例子。它是一组实数 R = {…, -1, 0, 1, …}。在这种情况下,数据既没有上限也没有下限。
连续数据又分为两种:
区间数据是一种可以沿着尺度进行测量的简单技术,其中每个点都放置在彼此相同的距离处。另一方面,比率数据是区间数据的延伸。当我们谈论精确的数据测量时,它具有最终用途。比率数据说明顺序、确切距离等。
生成定性和定量数据的方法
在深入探讨定性和定量数据的不同数据收集方法之前,让我们先尝试了解数据收集的类型。
数据收集方法如下:
- 调查、问卷和测验
- 访谈
- 焦点小组
- 直接观察
- 文件
数据收集方法可以分为定量和定性数据类型。
定性数据收集方法
- 问卷和开放式调查:这是最常用的数据收集方法。它允许受访者更灵活地给出答案,不包含任何预定义的答案或选项,允许用户自由发挥。
- 一对一访谈:也称为面对面访谈,是一种常用的定性数据收集方法。在这里,您可以轻松地从访谈中收集数据。此技术特别适用于收集高度个性化的数据。
- 焦点小组:焦点小组也是一种访谈方法,但它不是一对一的访谈,而是进行小组讨论。它在资源不受金钱、时间等限制的情况下非常方便。
例如,如果您进行一项关于青少年吸毒者康复的研究,则该组中的所有成员都必须是正在从毒瘾中恢复的青少年。 - 直接观察:这是一种更为被动的数据收集方式。数据收集者代替参与者,彻底观察环境,并记录音频、视频和照片。由于涉及直接观察,这种方法可能存在固有偏见。
定量数据收集方法
- 在线测验和封闭式调查:这种方法基于允许受访者从选项中进行选择的问题。它分为分类和比率/区间类型。
分类问题可以分为二分(是或否)、复选框问题和多项选择问题。相比之下,区间题由李克特量表、矩阵题、评分量表等组成。
定量数据相对于定性数据的优势
与定性数据相比,定量数据具有许多优势,因为它更容易测量并用于准备图表或报告。它也比定性数据耗时更少。当您不确定会发生什么时,可以使用此技术。
让我们了解定量数据相对于定性数据的优势:
- 更科学
- 对敏感性控制更强
- 不那么主观
- 重点明确
- 可以处理更大的样本
- 可以采用简单的方法进行排列
- 可重复
- 相关性强
- 结构化程度高
- 可推广
- 一致性高
- 快速且节省时间
- 对做出合理决策有帮助
- 数据更易接受
- 高度可访问
- 可以使用随机样本
- 不需要直接观察
结论
与定量数据相比,定性数据更难分析。它通常使用定性内容分析、主题分析和语篇分析等方法。另一方面,定量数据基于数值或取值,并使用 SPSS、R 或 Excel 来计算平均分、特定问题被问到的次数、有效性等。结果以表格或图表的形式呈现。
本文应该可以帮助您了解定性数据和定量数据之间的区别,以及在何种应用场景下选择哪种数据类型。