1. 过拟合的解决办法

1)增加数据
2)正则项
3)early stopping
4)控制模型复杂度:
a. dropout(我觉得类似于subfeature)
b. 剪枝、控制树深
c. 增大分割平面间隔
5)bagging
6)subsampe & subfeature
7)特征选择、特征降维
8)数据增强(加包含噪声的数据)
9)ensemble

(参考林轩田的《机器学习技法》)
https://blog.csdn.net/u013382288/article/details/80470316

2.以下几种优化方法中,那种对超参数最不敏感?

A. 1SGD(stochastic gradient descent)
B. BGD(batch gradient descent)
C. Adadelta
D. Momentum

神经网络经典五大超参数:
学习率(Learning Rate)、权值初始化(Weight Initialization)、网络层数(Layers)
单层神经元数(Units)、正则惩罚项(Regularizer|Normalization)

显然在这里超参数指的是事先指定的learningrate,而对超参数不敏感的梯度算法是Adadelta,牛顿法。
https://blog.csdn.net/qq_34470213/article/details/79869206
自适应学习速率SGD优化方法比较(SGD,Adagrad,Adadelta,Adam,Adamax,Nadam)https://blog.csdn.net/suixinsuiyuan33/article/details/69229605

3.克莱姆法则是线性代数中一个关于求解线性方程组的定理。对一亿个具有 N 个方程,N 个 未知数的方程组,下列说法正确的是:

A. 当方程组的系数行列式不等于零时,则方程组一定有解;
B. 如果方程组有两个不同的解,那么方程组的系数行列式必定等于零.
C. 如果方程组的系数行列式等于零,那么方程组一定无解
D. 当方插入哪个组的系数行列式不等于零是,则方程组可能有多组解.

n元齐次线性方程组有非零解的充要条件是其系数行列式为零。等价地,方程组有唯一的零解的充要条件是系数矩阵的行列式不为零,其矩阵可逆。
https://baike.baidu.com/item/克莱姆法则/7211518?fr=aladdin

4.快排的最佳情况时间复杂度

在最优的情况下,快速排序算法的时间复杂度为O(nlogn);平均时间复杂度为O(n×log(n));最糟糕时复杂度为O(n^2)

5.简述数理统计中假设检验的基本步骤

假设检验的基本步骤如下:
1、提出检验假设又称无效假设,符号是H0;备择假设的符号是H1。H0:样本与总体或样本与样本间的差异是由抽样误差引起的;H1:样本与总体或样本与样本间存在本质差异;预先设定的检验水准为0.05;当检验假设为真,但被错误地拒绝的概率,记作α,通常取α=0.05或α=0.01。

2、选定统计方法,由样本观察值按相应的公式计算出统计量的大小,如X2值、t值等。根据资料的类型和特点,可分别选用Z检验,T检验,秩和检验和卡方检验等。

3、根据统计量的大小及其分布确定检验假设成立的可能性P的大小并判断结果。若P>α,结论为按α所取水准不显著,不拒绝H0,即认为差别很可能是由于抽样误差造成的,在统计上不成立;如果P≤α,结论为按所取α水准显著,拒绝H0,接受H1,则认为此差别不大可能仅由抽样误差所致,很可能是实验因素不同造成的,故在统计上成立。P值的大小一般可通过查阅相应的界值表得到。

教学中的做法:
1.根据实际情况提出原假设和备择假设;2.根据假设的特征,选择合适的检验统计量;3.根据样本观察值,计算检验统计量的观察值(obs);4.选择许容显著性水平,并根据相应的统计量的统计分布表查出相应的临界值(ctrit);5.根据检验统计量观察值的位置决定原假设取舍。

6.鞍点上的 Hessian 矩阵的描述哪个是正确的(不是正定,也不是负定,也不是半正定,而是 零)

A. 正定矩阵
B. 负定矩阵
C. 半正定矩阵
D. 都不对

神经网络优化问题中的鞍点即一个维度向上倾斜且另一维度向下倾斜的点。
鞍点:梯度等于零,在其附近Hessian矩阵有正的和负的特征值,行列式小于0,即是不定的。
鞍点和局部极值的区别:
鞍点和局部极小值相同的是,在该点处的梯度都等于零,不同在于在鞍点附近Hessian矩阵是不定的,非正定,非负定,非半正定(行列式小于0),而在局部极值附近的Hessian矩阵是正定的。
https://blog.csdn.net/qq_26598445/article/details/80910366

7. 样本总体在区间[-1,1]上服从均匀分布,已知样本 X1,X2,…,Xn 的样本均值 E(X)和样本方差

D(X),则 D(X)=
1 0、1/3、1/3n、3
随机变量:U(a,b)
X的概率密度函数:f(x)=1/(b-a) a<x<b 其它x,f(x)=0;
X的平均值:E(X)=∫(b,a) xf(x)dx=∫(b,a)xdx/(b-a)=0.5x^2/(b-a)|(b-a)=(a+b)/2
X的方差:D(X)=Var(X)=∫(b,a)[x-E(X)]² dx/(b-a)
=∫(b,a)[x-(a+b)/2]² dx/(b-a)
=(b-a)²/12

8. 设随机变量满足:E(X)=μ,D(X)=σ²,则由切比雪夫不等式,由{|X-μ|>=4σ}<=__ 1 1/4、1/2、1/16、1/8

{|X-μ|>=b}<=σ²/b²

【实习】数据分析岗_试题整理相关推荐

  1. 【秋招】腾讯_数据分析岗_面试题整理

    1. 二叉树题目 略 2. 层序遍历算法题 1)由顶向下逐层访问 2)可以用队列存储树,每次打印根节点并将左右节点放进队列 (参考:https://www.cnblogs.com/masterlibi ...

  2. 数据分析岗_面试题整理总结

    偏统计理论知识 1. 扑克牌54张,平均分成2份,求这2份都有2张A的概率. M表示两个牌堆各有2个A的情况:M=4(25!25!) N表示两个牌堆完全随机的情况:N=27!27! 所以概率为:M/N ...

  3. 【面经】数据分析岗_面试题整理总结(持续更新中…)

    偏统计理论知识 1. 扑克牌54张,平均分成2份,求这2份都有2张A的概率. M表示两个牌堆各有2个A的情况:M = C42 * C5025 N表示两个牌堆完全随机的情况:N = C5427 所以概率 ...

  4. 【秋招】招行_数据分析岗_面试题整理

    1. kmeans是啥 一种em过程的聚类方法,先固定类中心将每个点划分到最近的类中,然后更新类中心,通过这种迭代的方法进行聚类. 优点是速度较其它的聚类方法较快,缺点是需要预先设定类的数目,并且对初 ...

  5. 【校招面经】阿里巴巴_数据分析岗_面试笔试题

    (注:以下题目主要来自牛客网等论坛,解答由个人解答,可能会出现错误,并非标准答案,欢迎大家进行讨论) 1. 请说明随机森林较一般决策树稳定的几点原因 1)bagging的方法,多个树投票提高泛化能力 ...

  6. 美团数据分析岗面试题+解题思路

    Abbey |  作者 知乎 |  来源 一份关于美团的数据分析面试题,我用全程用tableau做了一遍,分享给大家.如果有更好的思路可以下面留言共同探讨. 按照数据分析步骤,对问题进行分析. 1 提 ...

  7. 美团数据分析岗面试题分享

    Abbey |  作者 知乎 |  来源 一份关于美团的数据分析面试题,我用全程用tableau做了一遍,分享给大家.如果有更好的思路可以下面留言共同探讨. 按照数据分析步骤,对问题进行分析. 1 提 ...

  8. 爆肝整理!2022年字节跳动 java 后端开发岗面试题整理

    前言 最近有收到很多粉丝朋友私信,说自己在2021年的秋招并不理想,想在这段时间好好准备复习一下好在2022的金三银四里面跳槽,找一份自己喜欢的工作.之前一直没有时间为大家整理,这两天把今年字节跳动的 ...

  9. 牛客 腾讯算法岗 笔试题整理

    牛客腾讯笔试题真题题解 格雷码 # -*- coding:utf-8 -*-class GrayCode:def getGray(self, n):GrayList = []tmp_list_0, t ...

最新文章

  1. 数字转换成中文大小写
  2. JavaScript 如何使用闭包
  3. 信息系统项目管理系列之一:绪论
  4. qt-制作生成dll动态链接库实例
  5. 从操作系统层面描述线程的五种状态
  6. linux自启动配置文件,Linux中如何设置服务自启动?
  7. IOS UIWindow 和 UIScreen
  8. 2019年的代码都写完了吗?不如做个Python进度条看看还剩多少
  9. Java里面as_与Java中的C#关键字“ as”等效
  10. Linux工作笔记030---Centos7.3启动tomcat 输入startup.sh后提示command not found
  11. Word 2003快速输入技巧
  12. python分布式计算框架_分布式计算框架Spark
  13. 漫画:“排序算法” 大总结
  14. ARM SMMU的原理与IOMMU
  15. Java后台调用第三方接口
  16. 万年历,java如何实现日历查询
  17. OpenGL(十七)——Qt OpenGL在三维空间移动位图(会动的星星)
  18. MIB Browser的使用(附安装包)
  19. Rust 限流算法crate调研
  20. SDNU 1014.书的页码问题

热门文章

  1. 钢材和不锈钢切削液-市场现状及未来发展趋势
  2. 【推荐收藏】11种比较常用的时间序列预测模型
  3. 算法与数据结构的基本概念
  4. asp.net mvc 上传到服务器 图片不显示,ASP.NET MVC实现图片上传、图片预览显示
  5. NASA拍摄地球影像 上网直播 (图)
  6. H5页面在IOS微信webview中无法校验视频文件时长问题
  7. 大学生就业寒冬中的冬日暖阳在哪?
  8. 我注册了某音帐号之后。。。(内含推荐算法)
  9. 如何设置计算机待机时屏幕不亮,电脑待机后再次启动显示屏不亮了
  10. Redis入门四:Redis基本配置一:redis常用配置简介;后台运行(daemonize);