有时,我们会查看某些信息并长时间处理整个信息,但仍然很难记住,尤其是当提供给我们的数据又长又复杂时。这是人脑开始可视化事物以使其更令人难忘的时候。简而言之,这也是数据处理的目的,即以使人脑易于理解的方式收集和呈现数据的过程被称为数据处理。也被称为统计信息,数据处理已被证明是表示数据的最有效方法。
组织原始数据
在学习组织数据之前,让我们先考虑一下“数据”一词,什么是数据?
数据不过是系统记录的值和有关数量的事实。如果提供给我们的数据不是系统的或组织的,则称为原始数据。通常,提供给我们的数据是原始数据的形式,系统地组织它们的形式可以是条形图,象形图,双条形图,或任何其他形式的可视化表示形式称为原始数据组织。
原始数据示例
有人问了15个人最喜欢的运动,这些是他们给出的答案,
板球,排球,网球,板球,板球,网球,羽毛球,排球,羽毛球,羽毛球,板球,网球,排球,板球,网球。
以表格格式组织原始数据
Sports |
Number Of People |
Cricket | 5 |
Volleyball | 3 |
Tennis | 4 |
Badminton | 3 |
很明显,表格形式的数据更易于理解和整洁,而原始数据很难记住。
因此,上表更易于解释和分析。该表称为“频率分布表” ,它说明了选择特定数据的次数。
频率
频率分布表中的频率一词表示特定数据已发生或重复多少次。例如,在上述示例中,人数是频率,选择板球作为运动的频率是5,而选择羽毛球作为运动的频率是3,等等。
分组频率分布
当数据非常大且难以安排单独数据的频率时,将使用分组频率分布。
例如,一个班级有20名学生,并且他们全部参加了数学测试(满分为100)。他们全部通过了测试,以下是他们获得的分数,
35、31、80、44、50、67、89、40、45、66、71、86、56、59、69、67、82、92、43、57。
由于为所有数据形成表格将提供一个非常大的表格,因此最好将它们分别分组,然后为各个组写入频率。
让我们以10个标记为一组,从30-40、40-50、50-60、60-70、70-80、80-90、90-100开始。
Marks in group | Number of students |
30-40 | 3 |
40-50 | 4 |
50-60 | 3 |
60-70 | 3 |
70-80 | 2 |
80-90 | 4 |
90-100 | 1 |
需要整理数据
组织数据的优势
- 这样可以节省大量时间。
以前面的示例为例,找出大多数人选择哪种运动,可以通过原始数据和有组织的数据给出答案,但是在后一种情况下,回答问题所花费的时间和回答的难度要小得多。
- 删除任何可能的错误。
在无组织数据中,错误的可能性不为零,在收集数据或表示数据时可能有错误,但是,在有组织数据中,请确保所提供的数据是完全正确的且没有任何错误。
- 易于理解和记忆。
有组织的数据在视觉上很吸引人,并且比原始数据更容易记忆。
数据整理方法
有多种组织数据的方法,从象形文字和Tally标记之类的简单方法到直方图,条形图和Double条形图等可用于复杂和大型数据的方法。让我们简要地了解每种方法,
计数符号
Tally是了解数字并简单地将它们分组标记的最简单方法。对于1 – 1标记,对于2 – 2标记,对于3 – 3标记,对于4 – 4标记,对于5 –十字4标记代表数字5,对于更多的数字重复相同的操作。
下表下方说明了如何显示Tally标记,
象形文字
象形文字代表图片形式的给定信息,因此数据以视觉形式并且易于理解。象形文字可以被称为最早的形式,它不仅可以显示某些数据,而且还可以在没有发现语言时提供一种交流方式。象形文字的唯一缺点是,当信息太大或太复杂时,不建议使用象形文字,因为它解释了所有内容。图片会很乏味。
条状图
用长条表示数据的图形方式,条的长度由每个数据的频率决定。条形图是最常用的组织数据的方法,因为它有助于轻松识别数据的相对大小,并且借助缩放,甚至可以将大量数据拟合到条形图中。
例子:
以条形图的形式表示下表,
Sports |
Number Of People |
Cricket | 5 |
Volleyball | 3 |
Tennis | 4 |
Badminton | 3 |
双条形图
假设有两组相互关联的数据,并且为了表示两组数据,不一定需要两个条形图,而不是两个单独的条形图,在这种情况下建议使用双条形图。双条形图更好,因为可以很容易地比较两个单独的数量。例如,一个人每天都在记录自己骑自行车的距离,而他希望在两周内看到自己的进步,那么两周的双曲线图可以表示相同。
饼形图
它是圆上数据的图形表示,圆盘由于具有相同的形状而被称为饼图。饼图上的切片说明了每个类别的数据量。比例或相对数据最好在饼图中表示,因为整个数据很容易比较。
例子,
在饼图上表示以下数据,
Sports |
Number Of People |
Cricket | 5 |
Volleyball | 3 |
Tennis | 4 |
Badminton | 3 |
上表的饼图,
样本问题
问题1:在3周的时间里,一个男人决定对自己的健康状况进行检查并每天早晨跑步,他每天早晨跑步,然后制作了一个分组的频率分布表,以下是他所覆盖的公里数,对于相同的。
3km,3.5km,5km,4.8km,6km,5km,6.1km,4km,5.9km,7km,7.2km,6.3km,6.8km,7.1km,8km,6.5km,8.1km,8.8km,7.4km, 6.9km,8.1km,
解决方案:
The Grouped Frequency distribution when the groups are divided as, 2-4km, 4-6km, 6-8km, 8-10km shall look like,
问题2:在花园中,有5种不同类型的花卉植物,有3种雏菊植物,5种向日葵植物,4种绿色郁金香植物,6种玫瑰植物,2种大丽花植物。为上述数据制作一个象形文字。
解决方案:
The Pictures that represents the number of plants in the garden,
The Pictograph for the data given in question is,
问题3:为从村庄中获取的以下数据绘制饼图,该信息涉及不同年龄组以及他们在村庄中所占的百分比。
Kilometers Covered | Number of days |
2-4km | 2 |
4-6km | 5 |
6-8km | 10 |
8-10km | 4 |
解决方案:
The Pie Chart for the above data,
问题4:对从村庄获得的数据制作条形图,以获取有关其年龄以及不同类别的比例的信息。
Villagers age | Relative population in percentage |
Infant | 5 % |
Adult | 35 % |
Young | 40 % |
Old | 20 % |
解决方案:
The Bar Graph for the Table given above,
问题5:为获得的有关花园中植物数量的数据画上标记,
雏菊-3,向日葵-5,绿色郁金香-4,玫瑰-6,大丽花-2
解决方案:
The Tally Marks For the above data,