📜  InfoCusp 机器学习工程师面试经验

📅  最后修改于: 2021-11-21 05:52:35             🧑  作者: Mango

校外申请机器学习工程师一职。总共有8轮。 4 轮 ML、2 轮软件、1 轮 HR 和 1 轮编码。

第 1 轮和第 2 轮是 ML,第 3 轮是测试我的软件技能,第 4 轮和第 5 轮是 ML,第 6 轮是 HR,第 7 轮是 SW 一轮和最后一轮编码。

ML 回合中提出的问题:

  1. 告诉我您将使用精确率和召回率的真实用例。
  2. 有哪些不同类型的损失函数。何时使用 MSE 和 MAE。写出二元交叉熵的公式。
  3. 你怎么知道你的模型已经过拟合了?如何克服过拟合。
  4. 一个问题是关于贝叶斯定理没有正确记住。
  5. 如果你有一堆简历,你想说一个公司的集体简历,你会怎么做?所以基本上它与聚类有关,我们可以使用 word2vec 之类的嵌入来表示简历中的技能和重要领域,并使用一些距离度量进行聚类。我们也可以使用余弦相似度来找到最近的匹配简历。
  6. 我在我的一个项目中使用了 BERT,所以询问了 word2Vec 嵌入和 Bert 嵌入。有什么不同。
  7. 如果 LSTM 和 BERT 具有相同的参数,则训练速度会更快。所以基本上她是在寻找并行性,比如在 LSTM 中我们需要一次输入一个,而在 Bert 中我们需要一次输入。
  8. 对图像和一般情况下的少数类进行过采样的不同技术。
  9. 什么是隐马尔可夫模型。
  10. 告诉我使用 MLP 设计 XOR。
  11. 你会在测试时标准化数据,是或否?如果是比如何。
  12. 给定一个段落,如果假设答案在于段落本身,您将如何为段落命名。问我数据集会是什么样子。
  13. 详细解释伯特。
  14. 解释 Bagging 和 Boosting 以及它们的区别。
  15. 朴素贝叶斯的假设。
  16. 我们为什么要使用激活函数?
  17. 最大似然估计 (MLE) 与最大后验 (MAP)
  18. 问什么是Python中的匿名函数和我知道的不同 ML 库。
  19. 什么是特征向量和特征值。因此,只需了解它的基础知识以及 SVD 和协方差等等。
  20. 问了我知道的不同的降维技术,所以我解释了 PCA。
  21. 如何处理不平衡的数据集——他特别寻找类权重方法。

在软件回合中提出的问题:

  1. 给定 4 个点,你将如何确定它们是否形成一个正方形?
  2. 给定一个整数数组,其中每个整数都在 0 到 n-1 的范围内,找到第一个重复的数字。
  3. 给定一个由 n 个整数组成的数组,其中每个整数都在 1 到 n 的范围内,现在缺少一个并且重复一个。找到他们两个。
  4. 通过编写类和函数来设计我们之间的游戏。
  5. 多线程和多处理之间的区别。如果我们可以使用多处理实现相同的目标,为什么要使用多线程。
  6. 我们如何为一台计算机分配两个IP地址?
  7. 解释 ACID 属性、范式、避免死锁。
  8. 删除节点,给定指向该节点的指针。
  9. 看看如何将关系(一对多和全部)映射到类和聚合、泛化的概念。
  10. 解释面向对象的概念,特别是多态性。

编码轮:

  1. 在蛇和梯子游戏(10*10 棋盘)中达到目标的最少掷骰子数。
  2. 给定 A、B、C、D、K 和 f(t)=At 3 + Bt 2 + Ct + D,找到最大 t,使得 f(t)<=K。
  3. 给定n-array树和数字M,你可以在1到M之间改变节点值,使得所有根到叶路径的GCD为1。找出这种组合的总数。

人力资源回合:

  1. 为什么选择 CSE。
  2. 家庭背景。
  3. 为什么我们会选择你而不是任何其他候选人?
  4. 您对闲置组织的定义是什么?

感谢您的阅读!