当前位置:首页 > 教育培训 >

算法工程师一般考什么(算法工程师有哪几类就业难度如何)

来源:原点资讯(www.yd166.com)时间:2023-06-17 12:14:42作者:YD166手机阅读>>

前言

最近好久都没有发技术了,今天给大家分享10个算法工程师基本上都要学习的10个比较基础但是很经典的面试题。还有上次有老铁私信我抽书多久发的事情,这个我在8月24日已经寄出去了,再稍等一下,我长这么大答应的事情没有掉链子的。

算法工程师一般考什么,算法工程师有哪几类就业难度如何(1)

十个经典面试题

1、你会在时间序列数据集上使用什么交叉验证技术?是用k倍或LOOCV?

都不是。对于时间序列问题,k倍可能会很麻烦,因为第4年或第5年的一些模式有可能跟第3年的不同,而对数据集的重复采样会将分离这些趋势,而我们最终可能只是需要对过去几年的进行验证,这就不能用这种方法了。相反,我们可以采用如下所示的5倍正向链接策略:

fold 1 : training [1], test [2]

fold 2 : training [1 2], test [3]

fold 3 : training [1 2 3], test [4]

fold 4 : training [1 2 3 4], test [5]

fold 5 : training [1 2 3 4 5], test [6]

1,2,3,4,5,6代表的是年份。

2、你有1000列和1百万行的训练数据集,这个数据集是基于分类问题的。要求你来降低该数据集的维度以减少模型计算时间,但你的机器内存有限。你会怎么做?(你可以自由做各种实际操作假设。)

你的面试官应该非常了解很难在有限的内存上处理高维的数据。以下是你可以使用的处理方法:

  1. 由于我们的RAM很小,首先要关闭机器上正在运行的其他程序,包括网页浏览器等,以确保大部分内存可以使用。
  2. 我们可以随机采样数据集。这意味着,我们可以创建一个较小的数据集,比如有1000个变量和30万行,然后做计算。
  3. 为了降低维度,我们可以把数值变量和分类变量分开,同时删掉相关联的变量。对于数值变量,我们将使用相关性分析;对于分类变量,我们可以用卡方检验。
  4. 另外,我们还可以使用PCA(主成分分析),并挑选可以解释在数据集中有最大偏差的成分。
  5. 利用在线学习算法,如VowpalWabbit(在Python中可用)是一个不错的选择。
  6. 利用Stochastic GradientDescent(随机梯度下降法)建立线性模型也很有帮助。
  7. 我们也可以用我们对业务的理解来估计各预测变量对响应变量的影响的大小。但是,这是一个主观的方法,如果没有找出有用的预测变量可能会导致信息的显著丢失。

3、全球平均温度的上升导致世界各地的海盗数量减少。这是否意味着海盗的数量减少引起气候变化?

不能够这样说。这是一个“因果关系和相关性”的经典案例。全球平均温度和海盗数量之间有可能有相关性,但基于这些信息,我们不能说因为全球平均气温的上升而导致了海盗的消失。我们不能断定海盗的数量减少是引起气候变化的原因,因为可能有其他因素(潜伏或混杂因素)影响了这一现象。

算法工程师一般考什么,算法工程师有哪几类就业难度如何(2)

4、给你一个数据集,这个数据集有缺失值,且这些缺失值分布在离中值有1个标准偏差的范围内。百分之多少的数据不会受到影响?为什么?

约有32%的数据将不受缺失值的影响。因为,由于数据分布在中位数附近,让我们先假设这是一个正态分布。我们知道,在一个正态分布中,约有68%的数据位于跟平均数(或众数、中位数)1个标准差范围内,那么剩下的约32%的数据是不受影响的。因此,约有32%的数据将不受缺失值的影响。

5、你意识到你的模型受到低偏差和高方差问题的困扰。那么,应该使用哪种算法来解决问题呢?为什么?

可以使用bagging算法(如随机森林)。因为,低偏差意味着模型的预测值接近实际值,换句话说,该模型有足够的灵活性,以模仿训练数据的分布。这样貌似很好,但是别忘了,一个灵活的模型没有泛化能力,意味着当这个模型用在对一个未曾见过的数据集进行测试的时候,它会令人很失望。在这种情况下,我们可以使用bagging算法(如随机森林),以解决高方差问题。bagging算法把数据集分成重复随机取样形成的子集。然后,这些样本利用单个学习算法生成一组模型。接着,利用投票(分类)或平均(回归)把模型预测结合在一起。另外,为了应对大方差,我们可以:

1.使用正则化技术,惩罚更高的模型系数,从而降低了模型的复杂性。2.使用可变重要性图表中的前n个特征。可以用于当一个算法在数据集中的所有变量里很难寻找到有意义信号的时候。

算法工程师一般考什么,算法工程师有哪几类就业难度如何(3)

6、协方差和相关性有什么区别?

相关性是协方差的标准化格式。协方差本身很难做比较。例如:如果我们计算工资($)和年龄(岁)的协方差,因为这两个变量有不同的度量,所以我们会得到不能做比较的不同的协方差。为了解决这个问题,我们计算相关性来得到一个介于-1和1之间的值,就可以忽略它们各自不同的度量。

7、真阳性率和召回有什么关系?写出方程式。

真阳性率=召回。它们有相同的公式(TP / TP FN)。

8、Gradient boosting算法(GBM)和随机森林都是基于树的算法,它们有什么区别?

最根本的区别是,随机森林算法使用bagging技术做出预测;而GBM是采用boosting技术做预测的。在bagging技术中,数据集用随机采样的方法被划分成n个样本。然后,使用单一的学习算法,在所有样本上建模。接着利用投票或者求平均来组合所得到的预测。bagging是平行进行的,而boosting是在第一轮的预测之后,算法将分类出错的预测加高权重,使得它们可以在后续一轮中得到校正。这种给予分类出错的预测高权重的顺序过程持续进行,一直到达到停止标准为止。随机森林通过减少方差(主要方式)提高模型的精度。生成树之间是不相关的,以把方差的减少最大化。在另一方面,GBM提高了精度,同时减少了模型的偏差和方差。

9:“买了这个的客户,也买了......”亚马逊的建议是哪种算法的结果?

这种推荐引擎的基本想法来自于协同过滤。协同过滤算法考虑用于推荐项目的“用户行为”。它们利用的是其他用户的购买行为和针对商品的交易历史记录、评分、选择和购买信息。针对商品的其他用户的行为和偏好用来推荐项目(商品)给新用户。在这种情况下,项目(商品)的特征是未知的。

10、我知道校正R2或者F值是用来评估线性回归模型的。那用什么来评估逻辑回归模型?

我们可以使用下面的方法:

1.由于逻辑回归是用来预测概率的,我们可以用AUC-ROC曲线以及混淆矩阵来确定其性能。

2.此外,在逻辑回归中类似于校正R2的指标是AIC。AIC是对模型系数数量惩罚模型的拟合度量。因此,我们更偏爱有最小AIC的模型。

3.空偏差指的是只有截距项的模型预测的响应。数值越低,模型越好。残余偏差表示由添加自变量的模型预测的响应。数值越低,模型越好。

栏目热文

算法工程师证书哪里报名(算法工程师考什么证书)

算法工程师证书哪里报名(算法工程师考什么证书)

大家好,这里是网络技术联盟站,我是瑞哥。最近微信上有三个小伙伴咨询我软考的考试时间问题,那么这些小伙伴基本上都是初考,所...

2023-06-17 12:33:49查看全文 >>

算法工程师考试难度(华为算法工程师考试)

算法工程师考试难度(华为算法工程师考试)

最近这张图片火了,这个工资,放在某些吹牛不上税的论坛上面可能就是个搬砖的农民工,放到统计局和每个人的身边,你会发现,我去...

2023-06-17 12:47:52查看全文 >>

算法工程师考哪些证(算法工程师方面证书)

算法工程师考哪些证(算法工程师方面证书)

人工智能技术的发展越来越成熟,相关应用也逐渐走向普通人群,现如今,在国内几乎每个人都使用过人工智能产品,其中最熟悉也最常...

2023-06-17 12:08:28查看全文 >>

算法工程师怎么考取(高级算法工程师是怎样考取的)

算法工程师怎么考取(高级算法工程师是怎样考取的)

记者 | 姜菁玲编辑 | 能打败AI的或许只有AI了。当人类还在惊叹AI的高效之时,成为一名AI算法工程师已经不再是件高...

2023-06-17 12:41:00查看全文 >>

做图像算法有前途吗(图像算法工程师真实收入)

做图像算法有前途吗(图像算法工程师真实收入)

不少青年踊跃应聘琶洲算法类企业文/羊城晚报记者 李春炜 图/羊城晚报记者 蔡嘉鸿120万元年薪招人才!5月27日,广州海...

2023-06-17 12:01:33查看全文 >>

压载水公约的排放要求及处理规定(最新压载水公约)

压载水公约的排放要求及处理规定(最新压载水公约)

海洋生物入侵已成为世界海洋生态环境面临的四大问题之一 ,国际海洋考察理事会(ICES)的数据表明94%的潜在有害海洋生物...

2023-06-17 12:41:02查看全文 >>

最新压载水处理规定(船舶压载水处理系统)

最新压载水处理规定(船舶压载水处理系统)

《上海市船舶污染防治条例》已由上海市第十五届人民代表大会常务委员会第四十七次会议于2022年12月21日通过,现予公布,...

2023-06-17 12:17:08查看全文 >>

压载水更换的三种方式(压载水的正确使用方法)

压载水更换的三种方式(压载水的正确使用方法)

一、 概念范围本篇中货舱及管路的讨论范围主要是:1、货舱:系指干货船的货舱,包括散货船、集装箱船、多用途船、杂货船等船型...

2023-06-17 12:34:42查看全文 >>

压载水处理装置操作步骤(压载水处理装置最新规定)

压载水处理装置操作步骤(压载水处理装置最新规定)

压载水处理装置(也有称压载水管理系统),目前已经广泛使用在船舶上,然而这一设备和技术对很多轮机员都很陌生,尤其该设备基本...

2023-06-17 12:13:03查看全文 >>

压载水什么情况下需要置换(压载水处理有哪几种方式)

压载水什么情况下需要置换(压载水处理有哪几种方式)

今天,国际海事组织《船舶压载水和沉积物控制和管理国际公约》(以下简称《压载水公约》)对中国正式生效。这既是中国海洋环境保...

2023-06-17 12:07:16查看全文 >>

文档排行