Flipkart 数据工程师面试经验 1
我已经通过Linkedin 申请并接到了HR 的电话。
有4轮面试。
通常,我们将机器编码视为第一轮,由于插槽不可用,我将机器编码作为第二轮。
Round 1(数据建模+SQL查询):我被要求为一家电子商务公司创建数据模型。
- 需要以优化的方式解释每个表和它们之间的关系。
- 然后,询问了 3 个 SQL 查询(难度级别-中到难)。
提示:为数据建模做好准备并练习硬 SQL 查询。
第 2 轮(机器编码):我收到了一些 json 文档,并要求我为给定的查询提供解决方案。 (免费使用任何语言/环境)。
- 我用火花来解决它们。这是我第一次处理json格式,所以在这一轮中我有点挣扎。
- 小组成员对我的方法和逻辑感到满意。
提示:在这一轮之前熟悉所有文件格式,如果您使用 spark,请使用数据帧。
第 3 轮(技术轮):我已经端到端地解释了我的项目,并对此进行了一些后续问题。
然后,被问及
- Spark 内部原理和优化技术(深入)
- 为什么选择无 sql 数据库(优点)
- 很少有与大数据相关的问题。
- 2 道基于数组的 DSA 题(类似于缺失数字)(难度级别- 中)
- 再次根据工作、阶段、任务对 Spark 内部结构提出问题。
- 给定一个 ETL 场景,并要求解释从摄取到数据仓库的端到端流程。很少有基于相同场景的 SQL 查询。面试官对我的做法很满意。
尖端:
- 彻底了解 Spark 内部结构、优化技术,因为这一轮具有很高的权重,从而使面试官相信您可以在 Spark 环境中处理工作。
- 准备 DSA 问题(你永远不知道你可能会遇到困难的问题)
本轮过关,必须面对最后一轮。
第4轮(HM轮):这一轮将测试您的项目理解(端到端)。
- 你说的每一个答案都有很多后续问题。
- 准备好面对项目每个部分的问题。
提示:在面对 HM 回合之前,请先问问自己项目的每个部分(如何和为什么)。
判决:选择。