当大多数人想到统计学时,他们会想到经济、金融和股票市场。对于不属于此类行业的普通人来说,统计的概念似乎仅限于记家庭账本,计算每个家庭的收入和支出。有些人从来没有考虑过这些事情,甚至从来没有整理过自己的财务状况。造成这种情况的主要原因是许多人只是无所事事地度过了这一天,而没有制定任何长期计划。
但现实中,有统计数据,简单来说,我们每个人的收入基本稳定,除了“口罩”等特殊情况,是需要有计划的。否则,一找到喜欢的东西就买,只会因无计划的消费而增加开支,对资产管理和投资没有任何用处。
统计学是经济学、工商管理学的一门基础专业,是许多研究生入学考试科目的重要基础,也是学术研究的必备技能。主要用来解释和分析我们社会生活、工作、科学研究领域中出现的各种现象的特征,总结规律,以便更好地实践科学。这包括统计指标、数值特征、动态分析、指数分析、简单趋势模型、抽样推断以及相关和回归分析的知识。
那么,如果你和我一样对这门学科感兴趣,今天就让我们一起开始学*这门课程——统计吧。我们使用的教材是《统计学》(第8版),中国人民大学贾俊平教授主编。该教材内容全面、通俗易懂、实例较多,被认为是多次出版的经典教材。统计数据。首先,学*本课程的第一章,—— 统计概论。
什么是统计学
一般来说,统计学是一种处理数据的方法。当然,处理数据需要经过一系列的收集、处理、分析、解释的过程,并从结论中发现数据内在的规律,加深对现象的理解。在,
1.收集数据:通过调查和实验来获取数据。
2、处理数据:对数据进行分组,通过表格、图像的方式展示数据。
3. 分析数据。也就是说,我们使用各种统计技术来分析数据。
4. 解释数据。得出结论并加以解释。
统计方法的分类
数据分析方法一般分为描述性统计和推论性统计两类。描述性统计是推论性统计的前提,推论性统计是描述性统计的发展。
描述性统计是一种统计技术,专门研究如何收集数据、如何处理数据、如何汇总数据、如何使用图表来解释数据以及如何汇总和分析数据。一般采用浓度量、差异量、位置量、相关系数等常用测量工具。
然而,值得注意的是,描述性统计不仅仅反映所研究人群的直观特征,例如人群大致是什么样的。它还可以反映外部联系,即不同数据之间的关系。它还可以反映横向比较的结果,例如所研究的人群与其他人群相比的水平。不过这些信息比较简单,可以让大家对整体情况有一个初步的了解。
推论统计是利用概率论原理研究如何利用样本信息来推断总体特征的统计方法,主要包括参数估计、假设检验、方差分析,并研究揭示独特的统计规律和特征人口。我们研究不同统计方法的特性并讨论它们的突出程度。
总的来说,两种方法都旨在从数据中获取有价值的信息,但在研究目标、方法和应用场景上存在显着差异。
描述性统计研究侧重于收集的具体数据及其特征和分布。它直接分析和描述数据,不包括对总体的推论。推论统计的研究对象是总体,通过对样本数据的分析来推断总体的特征和属性。由于通常不可能对总体进行全面调查,推论统计方法需要根据有限的数据样本来估计和推断总体。
常见的研究方法包括描述性统计,计算均值、中位数、众数等集中趋势指标,以及标准差、方差等离散指标。它还包括创建频率分布表和统计图表,直观地显示数据的分布特征。例如,计算特定班级学生的平均值和标准差,或创建学生分数的频率分布直方图。推论统计是根据样本数据对总体进行推断和估计,主要技术包括参数估计和假设检验。参数估计是通过样本数据估计总体参数,如总体均值、总体比例等。假设检验是检验有关总体参数的假设,以确定它们是否正确。例如,通过抽样调查,可以估算特定地区居民的平均收入水平,或者测试一种新药是否比旧药更有效。
从应用场景来看,描述性统计不仅适合数据的可视化呈现,也适合对小规模数据的初步分析和理解。例如,在公司的日常运营和管理中,可以利用描述性统计来分析销售、生产数据等,帮助管理者快速了解业务运行情况。在学术研究中,描述性统计也常用于对研究数据的初步描述和报告。推理统计广泛应用于需要全局推理和决策的场景。例如,市场研究通过抽样调查推断消费者的需求和偏好,医学研究通过临床试验推断新药的有效性和安全性,通过调查推断整体态度和行为。
统计数据的类型
统计数据是统计研究的基础信息,是分析和应用的基础。它是衡量客观现象的结果。我们可以从不同的角度考虑研究问题,并以不同的方式划分统计数据。
1、按测量尺度划分
数值数据:以数值尺度测量的数据。结果以具体的数字表示,可以精确测量各种物体的性质和间距。例如:百分比有25%、50%、100%等,它们的具体值为数值变量。
有序数据:只能归因于有序成绩的非数字数据。其目的是衡量事物类别的顺序。例如,教育背景分为小学和初中。高中、专科、本科、研究生等
分类数据:将结果表示为文本类别,用于区分物体的颜色、形状或物理状况等。
2、按采集方式分类
观测数据:通过对自然环境的调查和观察收集的数据。经济、社会、人口、气候等领域相关现象的数据通常是通过观测数据获得的。
实验数据:通过实验中控制受试者收集的数据。大多数自然科学领域的数据,如各种物理、化学、计算机、生物学、医学实验等,主要是基于实验数据。
3.按时间状态划分
横截面数据:相同或相似时间点获得的数据。此类数据通常在不同的空间中获取,并测量特定时刻现象的状态特征。例如2024年9月河南省各市经济发展数据。
时间序列数据:从不同时间点获得的数据。此类数据通常是在同一空间中获取的,并描述现象随时间的变化。比如我国2000年至2020年的居民汽车销量数据。
几个基本概念
首先,让我们了解一些基本的统计概念。这些概念是统计学中经常使用的技术术语。我们需要真正理解和掌握这些概念的含义。
总体和样本总体定义为包含所有研究对象的集合,总体中的每个成员称为个体。示例:假设您要研究四年级7 班所有学生的平均成绩。在这种情况下,4班和7班的所有学生都将成为本次研究的总体,每个学生都是一个个体。
根据总体所包含元素的多少,可以将总体分为有限总体和无限总体。这很容易理解:有限总体中的个体数量是确定的,但无限总体中的个体数量是不确定的。区分有限总体和无限总体的主要目的是确定抽样过程中总体是否独立。对于有限总体,采样时必须考虑是否重复采样,是否会影响独立性。如果是一个无限的整体,对独立可能性的判断就会相对不同。
我曾经参与过一个涉及采样问题的项目。最初,在抽样过程中出现了一个问题,因为我们不知道它是有限总体还是无限总体。后来我意识到,明确区分这一点非常重要。否则,根本无法保证采样的独立性,并且获得的结果可能不可靠[请勿阅读]。
样本是从总体中选择的数据部分。当您将总体与集合进行比较时,样本是其子集。例如,某公司想要测试其生产的一批电池的质量,并选择1000个电池进行测试,以检测其使用寿命。这里整体看的不是这批电池,而是这批电池的使用寿命。结论是数据是样本。
请注意,总体是正在研究的全部内容。它是一个概念集合,包括所有个体、元素以及对特定现象或感兴趣特征的观察。总体可以用多种方式描述,包括其特征、属性和分布,但总体本身并不是纯粹的数据。只有当我们观察和记录群体中的个体时,我们才能获得关于群体的具体数据。
样本是从总体中抽取的个体或观察结果的一部分,实际上表示为特定的数据集合。然而,样本的重要性不仅在于数据本身,还在于其代表总体的能力以及通过样本数据推断总体特征的作用。
因此,总体和样本不能简单地理解为两者都是数据。这些是总结研究主题的不同方式,涉及概念、方法和数据等多个层面。
参数和统计参数是用于描述全局特征的常见数值度量。简而言之,它是研究人员想要了解的人群特定特征的数字表示。例如,如果你想知道你班上学生的平均身高,平均身高就是参数。在统计学中,常用的参数包括总体平均值(符号)、标准差和总体比例。这些参数通常是未知数,也是数据分析时需要计算的结果。
统计量是与用于描述样本特征的参数相对应的汇总数值测量。根据样本数据计算。与样本函数类似,我们可以说样本提供的关于总体的大量信息是集中的。与总体相比,样本还包括常用的统计数据。例如,我们称样本均值小为x,样本标准差为s,样本比例为p。这些样本统计数据通常用小写英文表示。下图直观地反映了参数与统计量之间的关系。
变量是可以反映现象的特定特征或状态的指标。变量的这个特定值称为变量值,通常称为数据。例如,产品价格波动。还有教育程度、股票价格、时间、体重等,这些都是变量。统计实际上是对其中一些变量的值进行统计。
根据测量尺度划分数据类型允许您将变量分为分类变量、序数变量和数值变量。
分类变量可以分为有序变量和无序变量。有序变量(也称为顺序变量)是指在时间、优先级、大小、数量等方面具有可比较性和可排序性的变量。无序变量一般是指不能排序的变量。您可以比较不同类别的变量,例如主题、姓名、行业、职业等。
其中,数值变量是指取值范围为数值的变量。它也是应用最广泛的类型,因为它可以更准确地表达物体的特征。数值变量还可以进一步分为离散变量和连续变量,具体取决于其值是否连续。它们的具体含义和用法将在下一章详细解释。
最后,让我再解释一下经常被混淆的数值数据和数值变量。通过将数字数据与特定数字的集合进行比较,例如考试成绩、60 分、90 分等,可能会更容易理解数字数据。作为一个数值变量,就像篮子里有数字;它被称为“身高”,包含各种人的身高数据,例如170厘米和180厘米。记得上数学课的时候,老师总是讲这些事情。当时,我认为数值数据是特定的数字,数值变量是您命名的数字组(笑)。
好了,这就是今天的全部内容。今天我们主要了解了统计的含义和意义,然后了解了三类统计数据和一些常见的概念。用于统计。希望通过学*本课,您对统计学有一个初步的了解。如果您对内容感兴趣并且觉得不错,请点赞、收藏、关注。您的兴趣就是我发帖的动力。谢谢。全部!下次见!
版权声明:本文转载于网络,版权归作者所有。如有侵权,请联系本站编辑删除。