📜  什么是数据组织?

📅  最后修改于: 2021-06-25 01:51:20             🧑  作者: Mango

有时,我们会查看某些信息并长时间处理整个信息,但仍然很难记住,尤其是当提供给我们的数据又长又复杂时。这是人脑开始可视化事物以使其更令人难忘的时候。简而言之,这也是数据处理的目的,即以使人脑易于理解的方式收集和呈现数据的过程被称为数据处理。也被称为统计信息,数据处理已被证明是表示数据的最有效方法。

组织原始数据

在学习组织数据之前,让我们先考虑一下“数据”一词,什么是数据?

数据不过是系统记录的值和有关数量的事实。如果提供给我们的数据不是系统的或组织的,则称为原始数据。通常,提供给我们的数据是原始数据的形式,系统地组织它们的形式可以是条形图,象形图,双条形图,或任何其他形式的可视化表示形式称为原始数据组织。

原始数据示例

有人问了15个人最喜欢的运动,这些是他们给出的答案,

板球,排球,网球,板球,板球,网球,羽毛球,排球,羽毛球,羽毛球,板球,网球,排球,板球,网球。

以表格格式组织原始数据

Sports

Number

Of People

Cricket 5
Volleyball 3
Tennis 4
Badminton 3

很明显,表格形式的数据更易于理解和整洁,而原始数据很难记住。

因此,上表更易于解释和分析。该表称为“频率分布表” ,它说明了选择特定数据的次数。

频率

频率分布表中的频率一词表示特定数据已发生或重复多少次。例如,在上述示例中,人数是频率,选择板球作为运动的频率是5,而选择羽毛球作为运动的频率是3,等等。

分组频率分布

当数据非常大且难以安排单独数据的频率时,将使用分组频率分布。

例如,一个班级有20名学生,并且他们全部参加了数学测试(满分为100)。他们全部通过了测试,以下是他们获得的分数,

35、31、80、44、50、67、89、40、45、66、71、86、56、59、69、67、82、92、43、57。

由于为所有数据形成表格将提供一个非常大的表格,因此最好将它们分别分组,然后为各个组写入频率。

让我们以10个标记为一组,从30-40、40-50、50-60、60-70、70-80、80-90、90-100开始。

Marks in group Number of students
30-40 3
40-50 4
50-60 3
60-70 3
70-80 2
80-90 4
90-100 1

需要整理数据

组织数据的优势

  • 这样可以节省大量时间。

以前面的示例为例,找出大多数人选择哪种运动,可以通过原始数据和有组织的数据给出答案,但是在后一种情况下,回答问题所花费的时间和回答的难度要小得多。

  • 删除任何可能的错误。

在无组织数据中,错误的可能性不为零,在收集数据或表示数据时可能有错误,但是,在有组织数据中,请确保所提供的数据是完全正确的且没有任何错误。

  • 易于理解和记忆。

有组织的数据在视觉上很吸引人,并且比原始数据更容易记忆。

数据整理方法

有多种组织数据的方法,从象形文字和Tally标记之类的简单方法到直方图,条形图和Double条形图等可用于复杂和大型数据的方法。让我们简要地了解每种方法,

计数符号

Tally是了解数字并简单地将它们分组标记的最简单方法。对于1 – 1标记,对于2 – 2标记,对于3 – 3标记,对于4 – 4标记,对于5 –十字4标记代表数字5,对于更多的数字重复相同的操作。

下表下方说明了如何显示Tally标记,

象形文字

象形文字代表图片形式的给定信息,因此数据以视觉形式并且易于理解。象形文字可以被称为最早的形式,它不仅可以显示某些数据,而且还可以在没有发现语言时提供一种交流方式。象形文字的唯一缺点是,当信息太大或太复杂时,不建议使用象形文字,因为它解释了所有内容。图片会很乏味。

条状图

用长条表示数据的图形方式,条的长度由每个数据的频率决定。条形图是最常用的组织数据的方法,因为它有助于轻松识别数据的相对大小,并且借助缩放,甚至可以将大量数据拟合到条形图中。

例子:

以条形图的形式表示下表,

Sports

Number

Of People

Cricket 5
Volleyball 3
Tennis 4
Badminton 3

双条形图

假设有两组相互关联的数据,并且为了表示两组数据,不一定需要两个条形图,而不是两个单独的条形图,在这种情况下建议使用双条形图。双条形图更好,因为可以很容易地比较两个单独的数量。例如,一个人每天都在记录自己骑自行车的距离,而他希望在两周内看到自己的进步,那么两周的双曲线图可以表示相同。

饼形图

它是圆上数据的图形表示,圆盘由于具有相同的形状而被称为饼图。饼图上的切片说明了每个类别的数据量。比例或相对数据最好在饼图中表示,因为整个数据很容易比较。

例子,

在饼图上表示以下数据,

Sports

Number

Of People

Cricket 5
Volleyball 3
Tennis 4
Badminton 3

上表的饼图,

样本问题

问题1:在3周的时间里,一个男人决定对自己的健康状况进行检查并每天早晨跑步,他每天早晨跑步,然后制作了一个分组的频率分布表,以下是他所覆盖的公里数,对于相同的。

3km,3.5km,5km,4.8km,6km,5km,6.1km,4km,5.9km,7km,7.2km,6.3km,6.8km,7.1km,8km,6.5km,8.1km,8.8km,7.4km, 6.9km,8.1km,

解决方案:

问题2:在花园中,有5种不同类型的花卉植物,有3种雏菊植物,5种向日葵植物,4种绿色郁金香植物,6种玫瑰植物,2种大丽花植物。为上述数据制作一个象形文字。

解决方案:

问题3:为从村庄中获取的以下数据绘制饼图,该信息涉及不同年龄组以及他们在村庄中所占的百分比。

Kilometers Covered Number of days
2-4km 2
4-6km 5
6-8km 10
8-10km 4

解决方案:

问题4:对从村庄获得的数据制作条形图,以获取有关其年龄以及不同类别的比例的信息。

Villagers age Relative population in percentage
Infant 5 %
Adult 35 %
Young 40 %
Old 20 %

解决方案:

问题5:为获得的有关花园中植物数量的数据画上标记,

雏菊-3,向日葵-5,绿色郁金香-4,玫瑰-6,大丽花-2

解决方案: