在当今这个数据驱动的时代,算法在各个领域都发挥着至关重要的作用。美团作为中国领先的互联网生活服务平台,始终致力于为用户提供高效、便捷的服务。为了选拔具备优秀算法能力的校招生,我们特别准备了本次笔试卷。这些题目将检验您对算法的掌握程度、逻辑思维及问题解决能力。现在,请准备好迎接挑战,展现您的算法才华吧!
6.目前处理非均衡数据分类问题的策略包括( )
A:过采样
B:欠采样
C:代价敏感学习
D:集成学习
参考答案:A,B,C,D
7.下列关于k折交叉验证哪些选项正确? ( )
A:增大k会导致得到交叉验证结果时间变长
B:增大k会导致交叉验证结果的置信度增加
C:如果k=N,那它就是留一法验证,其中N是观测数量。
D:验证的测试集中数据充足,比较容易得到准确的误报率
参考答案:A,B,C
8.以下描述错误的是?()
A:SVM是这样一个分类器,他寻找具有最小边缘的超平面,因此它也经常被称为最小边缘分类器(minimal margin classifier)
B:在聚类分析当中,簇内的相似性越大,簇间的差别越小,聚类的效果就越差。
C:在决策树中,随着树中结点数变得太大,即使模型的训练误差还在继续减低,但是检验误差开始增大,这是出现了模型拟合不足的问题。
D:聚类分析可以看作是一种非监督的分类。
参考答案:A,B,C
9.使用Z-score标准化方法对样本数据进行标准化处理,则处理后的样本数据( )
A:均值为1
B:标准差为1
C:均值为0
D:方差为0
参考答案:B,C
10.以下关于优化算法特点描述正确的是()
A:随机梯度下降(SGD)是一种较为常见的优化算法,经常应用于大规模和稀疏机器学习问题当中。相对于非随机算法,SGD 能更有效的利用信息,在一定程度上加快了训练速度。
B:Momentum模拟物理里动量的概念,使参数更新的方向不仅由当前的梯度决定,也与此前累积的下降方向有关。可以加速sgd在正确方向的更新,并且抑制震荡。
C:Adagrad把所有梯度平方和开根号来除当前的梯度,在学习率方面进行了约束,每个分量有各自不同的学习率。
D:RMSProp中的衰减系数,让参数更新只关注最近一段时间窗口内的梯度,一定程度上可以避免因分母积累得太大而导致的学习率逐渐为0,进而提前结束训练的情况。
参考答案:A,B,C,D
11.下面关于贝叶斯分类器说法正确的是( )
A:贝叶斯的思想是“由因推果”
B:贝叶斯的思想是“执果溯因”
C:可以用极大似然估计法解贝叶斯分类器
D:可以解决无监督学习的问题
参考答案:A,C
12.关于AUC指标说法正确的是( )
A:AUC最小值为0
B:TPR=FPR时,AUC为0.5
C:TPR>FPR时,AUC<0.5
D:AUC最大值为1
参考答案:B,D
13.下列说法正确的是()
A:当训练样本数量趋向于无穷大时,在该数据集上训练的模型变化趋是偏差变小
B:bagging降低方差,boosting降低偏差
C:bagging降低偏差,boosting降低方差
D:泛化误差=方差+偏差+噪声
参考答案:B,D
14.与BP网络对比,CNN网络具有的不同点是( )
A:神经元之间不存在同层连接
B:神经元之间不存在跨层连接
C:权值共享
D:局部连接
参考答案:C,D
15.simple random sampling、systematic sampling和stratified sampling的共同特点是( )
A:抽样过程中每个个体被抽到的可能性相等
B:都是不放回抽样
C:适用于总体中的个体较少的情况
D:都是从总体中逐个抽取来构成研究样本
参考答案:A,B
16.关于batch normalization,以下说法错误的是?()
A:BN可以加速网络收敛
B:BN可以缓解梯度爆炸问题
C:BN没有可学习的参数
D:BN只能放在激活函数之前
参考答案:C,D
17.下列哪些因素会对BP神经网络的训练效果产生影响( )
A:权值初始值
B:阈值初始值
C:学习率
D:隐层神经元个数
参考答案:A,B,C,D

还没有评论呢,快来抢沙发~