校外申请机器学习工程师一职。总共有8轮。 4 轮 ML、2 轮软件、1 轮 HR 和 1 轮编码。
第 1 轮和第 2 轮是 ML,第 3 轮是测试我的软件技能,第 4 轮和第 5 轮是 ML,第 6 轮是 HR,第 7 轮是 SW 一轮和最后一轮编码。
ML 回合中提出的问题:
- 告诉我您将使用精确率和召回率的真实用例。
- 有哪些不同类型的损失函数。何时使用 MSE 和 MAE。写出二元交叉熵的公式。
- 你怎么知道你的模型已经过拟合了?如何克服过拟合。
- 一个问题是关于贝叶斯定理没有正确记住。
- 如果你有一堆简历,你想说一个公司的集体简历,你会怎么做?所以基本上它与聚类有关,我们可以使用 word2vec 之类的嵌入来表示简历中的技能和重要领域,并使用一些距离度量进行聚类。我们也可以使用余弦相似度来找到最近的匹配简历。
- 我在我的一个项目中使用了 BERT,所以询问了 word2Vec 嵌入和 Bert 嵌入。有什么不同。
- 如果 LSTM 和 BERT 具有相同的参数,则训练速度会更快。所以基本上她是在寻找并行性,比如在 LSTM 中我们需要一次输入一个,而在 Bert 中我们需要一次输入。
- 对图像和一般情况下的少数类进行过采样的不同技术。
- 什么是隐马尔可夫模型。
- 告诉我使用 MLP 设计 XOR。
- 你会在测试时标准化数据,是或否?如果是比如何。
- 给定一个段落,如果假设答案在于段落本身,您将如何为段落命名。问我数据集会是什么样子。
- 详细解释伯特。
- 解释 Bagging 和 Boosting 以及它们的区别。
- 朴素贝叶斯的假设。
- 我们为什么要使用激活函数?
- 最大似然估计 (MLE) 与最大后验 (MAP)
- 问什么是Python中的匿名函数和我知道的不同 ML 库。
- 什么是特征向量和特征值。因此,只需了解它的基础知识以及 SVD 和协方差等等。
- 问了我知道的不同的降维技术,所以我解释了 PCA。
- 如何处理不平衡的数据集——他特别寻找类权重方法。
在软件回合中提出的问题:
- 给定 4 个点,你将如何确定它们是否形成一个正方形?
- 给定一个整数数组,其中每个整数都在 0 到 n-1 的范围内,找到第一个重复的数字。
- 给定一个由 n 个整数组成的数组,其中每个整数都在 1 到 n 的范围内,现在缺少一个并且重复一个。找到他们两个。
- 通过编写类和函数来设计我们之间的游戏。
- 多线程和多处理之间的区别。如果我们可以使用多处理实现相同的目标,为什么要使用多线程。
- 我们如何为一台计算机分配两个IP地址?
- 解释 ACID 属性、范式、避免死锁。
- 删除节点,给定指向该节点的指针。
- 看看如何将关系(一对多和全部)映射到类和聚合、泛化的概念。
- 解释面向对象的概念,特别是多态性。
编码轮:
- 在蛇和梯子游戏(10*10 棋盘)中达到目标的最少掷骰子数。
- 给定 A、B、C、D、K 和 f(t)=At 3 + Bt 2 + Ct + D,找到最大 t,使得 f(t)<=K。
- 给定n-array树和数字M,你可以在1到M之间改变节点值,使得所有根到叶路径的GCD为1。找出这种组合的总数。
人力资源回合:
- 为什么选择 CSE。
- 家庭背景。
- 为什么我们会选择你而不是任何其他候选人?
- 您对闲置组织的定义是什么?
感谢您的阅读!