📜  2020 年学习数据科学的 5 本最佳书籍

📅  最后修改于: 2021-10-19 05:11:06             🧑  作者: Mango

数据科学是 2020 年的热门技术之一,如果我们想学习并以此为业,那么现在就是最好的时机。我们熟悉大数据,以及对收集到的非结构化数据进行分析和维护的难度。因此,每家公司都需要数据科学家从数据中获得最大的生产力。

2020 年数据科学 5 大最佳学习书籍

由于银行、网络安全、教育、医疗保健等每个行业都需要数据科学家,因此可用的职位空缺数量将大幅增加。此外,还有大量课程可供初学者学习和掌握数据分析的技能。以下是一些将帮助您实现 2020 年成为数据科学家梦想的书籍。

1. 数据科学的艺术(Roger D. Peng,Elizabeth Matsui)

这是描述数据分析方法的最好的书籍之一。作者在数据分析领域拥有丰富的工作经验,因此他们以非常淡化的方式呈现内容。这使初学者可以轻松地思考有关数据分析概念的知识,并以最合适的方式应用从线性回归到分类树再到随机森林的工具。这本书将数据分析描述一门艺术不是科学

这两者有何不同?

技术数据科学是真正的科学,数据分析只是一个器官。数据分析的过程并不是像往杯子里倒咖啡那样简单就能灌输到人脑中的东西。只有少数人才能以生成可行解决方案并解释人们感兴趣的问题的方式进行数据分析。因此,这种对问题的普遍和富有表现力的解释模式可以称为 ART,因此,本书提供了有关数据分析作为“数据科学艺术”的完整信息。

2. 用于数据分析的Python :Data Wrangling With Pandas、NumPy 和 IPython(Wes McKinney)

Python语言以其简单性、可读性和生产力而闻名。此外, Python的库丰富,为数据分析提供了大量工具和高级数据结构。用于数据科学研究的Python库包括 Pandas、NumPy、SciPy、Matplotlib 等。此外,Data Wrangling 或 munging 换句话说只是将可用的原始数据整理成更适合下游流程的形式。它涉及创建新变量、识别重复项和过滤重复项。此外,它还包括诸如对提取的数据进行排序并将它们存储到数据库中的过程。用于清理和提取复杂数据的最佳语言是Python,因为它具有可用的包和库。要了解有关Python语言及其在数据转换和数据分析中使用的一组库的更多信息,本书是最合适的选择。

3. R 数据科学(Hadley Wickham 和 Garrett Grolemund)

Python在科技界是一种通用语言。而 R 是为统计和分析目的而设计的。因此,如果一个人对主修数据科学非常有野心,那么学习 R 是很好的尝试,因为它是特定于领域的。此外,与Python相比,R 不太受欢迎,因为大多数开发人员都专注于学习Python。由于仅限于统计工程领域的领域专家,涉及的人员有限,因此学习 R 并成为 R 开发人员将在未来受益。此外,由于 R 专家实力较弱,为了消除我们对该主题的疑虑,为自己保留一本书是最好的决定。

4. 傻瓜数据科学(Lillian Pierson)

Lillian Pierson 的这本书最好地描述了与数据科学相关的技术术语,总结了数据分析、数据可视化、大数据、其基础设施等。这本书提供了对该技术的鸟瞰图,最适合具有数据科学知识的人需要修改可以略过它。另一方面,对于一个没有任何数学、统计学、编程、计算等先验知识的人来说,它会造成一种在石头和荆棘中行走的氛围。但这本书的优点是,作者将内容塞满了图表,图表和图形可以使阅读的主题清晰可见。所以在2020年,我们在数据科学领域的技术技能,不需要重新考虑。事实上,它是接收入门知识的最佳选择。

5. 数据科学手册

肯定是一个冗长的书名。内容为读者提供对蓬勃发展的技术数据科学的深刻见解。这四位作者撰写的这本书基本上是对 25 位了不起的数据科学家的采访草图。这些人从生活的不同角度进入数据科学领域,他们处理数据的观点和经验将有助于增强对该领域的信心和理解。正如作者在本书描述中所描述的那样,这本书是一本充满策略、建议和秘诀的参考书,可以启动和发展您的数据科学事业。因此,如果您想进一步了解数据科学是什么,它的用例和应用程序是什么,那么如果您想进一步探索数据科学中的阅读或实验内容,这本书是一个很好的起点。

上面的文章描绘了领先的数据科学卷集中的五本最佳书籍。购买它们,阅读它们并向它们学习,从而使这段时间变得富有成效。