如何建立令人印象深刻的数据科学组合?
数据科学正在迅速发展,并已成为当今毕业生和退伍军人最抢手的工作之一。这也导致了对这些工作的激烈竞争。当每个人都充满热情、努力工作、知识渊博时,你如何从其他候选人中脱颖而出?答案-投资组合。扎实而多样化的数据科学组合有助于突出您的能力和知识。
由于就业市场上有大量人才,雇主可能对聘用应届毕业生有点谨慎。那么你如何说服他们你是这份工作的理想人选呢?您通过展示以前项目和实习的工作来展示您的能力。投资组合的主要目的是向潜在雇主展示一个人的能力。从而增加您在梦想中的公司找到工作的机会。
如果您有非技术教育背景或正在改变职业,投资组合也变得很重要。这也适用于那些工作经验很少的人。既然我们已经列出了为什么数据科学组合很重要的几个原因,那么让我们来看看如何构建一个令人印象深刻的数据科学组合。
哪些项目对您的投资组合有吸引力?
增加被聘用机会的最佳方法是建立针对特定雇主、特定行业和特定工作的投资组合。但是,如果您正在寻找入门级职位,那么您就是在撒网并寻找需要类似技能和能力的机会。如果您将包含至少一个来自以下每个领域的项目组合在一起,您将有一个良好的开端。
- 数据清理:大多数数据科学配置文件中 60-80% 都需要数据准备、整理和清理——无论你想怎么称呼它。因此,通过项目展示您的数据清理才能将验证您的技能。您首先需要选择一个杂乱无章的数据集以供您使用。浏览未过滤的数据,提出您想要调查的有趣的分析问题或角度。然后清理数据并执行一些基本分析来回答这些问题。清洁技术因一个数据集而异。您可能需要修复结构错误、过滤掉不需要的数据并处理丢失的数据。一些最好使用的工具是 TIBCO Refine、Winpure、Data Cleaner、Data Ladder 等。Tableau 是另一个可用于数据清理的强大软件。
- 数据讲故事和可视化:数据科学中的讲故事是指通过分析和连接数据得出结论。任何数据科学家的工作都需要提供实际的洞察力并用数据说服他人。这些结论、见解及其在业务中的应用需要传达给各个利益相关者。这将需要使用数据可视化和沟通技巧。您可以设计一个类似于国家地理发布的项目,该项目可视化美国因 Covid-19 造成的 500,000 人死亡。或者是一个关注高中生心理健康的微型项目。
- 小组项目:在小组中工作表明您具有有效的沟通技巧和团队合作的能力,这在数据科学概况中至关重要。小组项目可能是创建具有挑战性和难度的项目的好方法。您可以尝试为著名的开源项目做出贡献,例如使用您选择的语言的与数据科学相关的开源库。这种项目的一个例子是对乳腺癌进行分类。您可以使用Python对该项目进行编程。与Python一起,可以使用侵袭性导管癌 (IDC) 数据集。您可以使用 Keras、OpenCV、NumPy 和 Matplotlib Python库。这可能很棘手,但如果您能够为知名库或包做出贡献,它将真正帮助公司注意到您的应用程序。
让您的投资组合更具吸引力的更多技巧
1.利用在线存在
在线形象对于更好地被录用变得非常重要。它有助于验证您的身份、教育、社交关系、兴趣等。有几个平台可用于建立令人印象深刻的社交媒体形象。其中一些是——
- LinkedIn – LinkedIn 个人资料可作为您的社交专业资料。它有助于在您的个人资料中建立可信度和兴趣。公司可以验证您的教育、工作经验和项目。您的 LinkedIn 个人资料也可用作数字简历,因为每个成就、资格、项目和网站链接都可以在此处提及。
- 建立一个深刻的 GitHub 个人资料——GitHub 是每个开发人员最好的朋友。特别是对于初学者开发人员。该软件允许基于 Web 的图形界面,提供访问控制和协作功能。您可以上传和分享您的数据科学项目。这样,雇主或其他数据科学家可以参考并完成您的项目。这也是在小组项目上进行协作的好方法。尝试在您的个人资料中包含多个项目和一些合作。在 LinkedIn 和简历上提供指向您的 GitHub 个人资料的链接是构建投资组合的好方法。
- 使用 Kaggle ——Kaggle 是数据科学和机器学习爱好者的另一个绝佳平台。这是一个可以学习、实践和测试数据科学和机器学习的社区。 Kaggle 是开始构建数据科学项目的绝佳方式。您可以找到各种用于启动项目的开放数据集,以及对项目派上用场的其他资源。您还可以参加一些比赛。您可以在您的 LinkedIn 个人资料中将这些作为标题,并获得使您的个人资料脱颖而出的徽章或奖牌。
2. 尽可能多地学习和交流:
假设您了解的语言、技术和工具越多,构建投资组合的效果就越好。这是因为拥有广泛的技能可以帮助您执行语言并更好地理解问题。它还有助于提高您的分析能力。由于数据科学是一个不断发展的领域,因此对于有抱负的数据科学家来说,紧跟趋势和发展势在必行。那么,你如何做到这一点?
- 阅读博客- 博客是快速获得有关任何主题的新见解和信息的好方法。最好的是,由于博客几乎每天都发布,它们包含有关新发展的相关信息。通过这种方式,您可以了解数据科学领域的当前事件和最新发展。在采访中提到其中一些肯定会给小组留下深刻印象。还可以帮助您掌握新的技能和工具。
- 建立社区——建立或成为像 Kaggle 这样的社区的一部分,打开了许多大门。社区是学习、练习和教授技能的好方法。您可以加入各种知名社区,例如 Kaggle、Slack、LinkedIn 和 Discord。积极参与此类社区可确保您永远不会错过任何更新或机会。这是建立专业联系的好方法。此外,关于社区的活跃简介会告诉雇主您对数据科学的浓厚兴趣。
- 投资组合网站——这一步通常被视为麻烦,因此被忽视。但这也是可以帮助候选人为自己打造品牌的一步。与平面设计师如何将 Behance 用于他们的作品集类似,您可以使用 Wix/Weebly 或 HTML 为您的数据科学作品集创建网站。
结论
创建作品集一开始可能看起来令人生畏,但在您习惯于记录和展示您的项目后,它将成为您的第二天性。使构建投资组合变得有趣和令人印象深刻的最好方法是选择您感兴趣的数据集和问题。通过这种方式,您可能能够赋予它个人风格,并将您的项目与其他人的项目区分开来。如果您想建立自己的品牌,请从博客网站开始或构建自己的网站。建立一个坚实的数据科学组合会给你带来巨大的优势。充分利用上述技巧将帮助您制作大量且令人印象深刻的数据科学组合。