采访1MG.com DATA SCIENCE简介
总共给1MG做了4轮面试。
第一轮:电话轮
中级面试轮,我被问及朴素贝叶斯、贝叶斯定理、我的项目和卷积神经网络的简要工作。
第 2 轮:现场技术第 1 轮
在超过 1 小时的时间里,我被问及 DCGAN、损失函数、逻辑回归的深入知识、朴素贝叶斯分类器的工作、贝叶斯定理和总概率定理。损失函数均方误差、对数损失、均方对数误差被询问。很少有更多的主题/算法被要求了解我在该领域的知识。
问题:对于乳腺癌数据集,我应用了三种算法。一个决策树,我在测试集上获得 97% 的准确率,两个随机森林:98% 的准确率,三个朴素贝叶斯:92% 的准确率。其中哪个算法最好?
答:这些都不是,准确度那些不能说明哪种算法最好。精度和召回率也很重要。
该算法可能正确预测一个人没有癌症并且测试结果也是-ve,但这并不意味着它会预测一个人真正患有癌症时的+ve测试。
这种情况被称为准确性悖论。
第三轮:现场技术第二轮
在这里,我被问到可以在他们的平台中使用机器学习的应用程序部分。这是我的实用和应用知识测试仪。我已经彻底浏览了他们的网站和应用程序,所以我知道可以在哪里使用推荐部分,哪里可以使用关联规则方法。这里我们讨论了先验和 Fp-growth 树算法。
第 4 轮:人力资源轮
大约20分钟后,HR过来问了我一些关于我的问题。浏览了我的简历,并在 2 天内收到了选择消息。