统计学习(浙江大学) 中国大学mooc慕课答案2024版 m240113


第一讲 机器学习简介 第一讲测验

1、 机器学习可以用于哪些情形?

A:人类无法解释的专业知识
B:模型需要基于大量数据
C:当人类专业知识不存在
D:模型必须定制
答案: 人类无法解释的专业知识;
模型需要基于大量数据;
当人类专业知识不存在;
模型必须定制

2、 以下哪些属于监督学习?

A:朴素贝叶斯
B:支持向量机
C:聚类
D:决策树
答案: 朴素贝叶斯;
支持向量机;
决策树

3、 机器学习的类型有?

A:半监督学习
B:有监督学习
C:无监督学习
D:强化学习
答案: 半监督学习;
有监督学习;
无监督学习;
强化学习

4、 有监督学习是分类同时定性的,而无监督学习是先聚类后定性的。

A:正确
B:错误
答案: 正确

5、 半监督学习没标签数据的数量常常远大于有标签数据的数量。

A:正确
B:错误
答案: 正确

第二讲 机器学习的评估方法 第二讲测验

1、 不平衡问题的领域有?

A:医学诊断
B:预测罕见事件
C:检测欺诈
D:预测故障/失效
答案: 医学诊断;
预测罕见事件;
检测欺诈;
预测故障/失效

2、 识别任务中,召回率是被预测为“正面”的测试数据中结果是正确的比例。

A:正确
B:错误
答案: 错误
分析:识别任务中,精确度是被预测为“正面”的测试数据中结果是正确的比例,召回率是标签为“正面”的测试数据中预测正确的比例。

第三讲 回归分析 第三讲测验

1、 已知变量x与y正相关,且由观测数据算得x的样本平均值为3,y的样本平均值为3.5,则由该观测数据算得的线性回归方程可能是

A:y=0.4x+2.3
B:y=2x-2.4
C:y=-2x+9.5
D:y=-0.3x+4.4
答案: y=0.4x+2.3

2、 在两个变量的回归分析中,作散点图是为了

A:直接求出回归直线方程
B:直接求出回归方程
C:根据经验选定回归方程的类型
D:估计回归方程的参数
答案: 根据经验选定回归方程的类型

3、 下列两个变量之间的关系,哪个是函数关系

A:学生的性别与数学成绩
B:人的工作环境与健康状况
C:正方形的边长与面积
D:儿子的身高与父亲的身高
答案: 正方形的边长与面积

4、 在线性回归方程y=a+bx中,回归系数b表示

A:当x=0时,y的平均值
B:x变动一个单位时,y的实际变动量
C:y变动一个单位时,x的平均变动量
D:x变动一个单位时,y的平均变动量
答案: x变动一个单位时,y的平均变动量

5、 若每一吨铸铁成本y(元)与铸件废品率x%建立的回归方程y=56+8x,下列说法正确的是

A:废品率每增加1%,成本每吨增加64元
B:废品率每增加1%,成本每吨增加8%
C:废品率每增加1%,成本每吨增加8元
D:废品率每增加1%,成本每吨增加56元
答案: 废品率每增加1%,成本每吨增加8元

6、 若根据x与y之间的一组数据求得两个变量之间的线性回归方程为y=a+bx,已知:数据x的平均值为2,数据y的平均值为3,则

A:回归直线必过点(2,3)
B:回归直线不一定过点(2,3)
C:点(2,3)在回归直线上方
D:点(2,3)在回归直线下方
答案: 回归直线必过点(2,3)

7、 下列结论正确的是

A:函数关系是一种确定性关系
B:相关关系是一种非确定性关系
C:回归分析是对具有函数关系的两个变量进行统计分析的一种方法
D:回归分析是对具有相关关系的两个变量进行统计分析的一种方法
答案: 函数关系是一种确定性关系;
相关关系是一种非确定性关系;
回归分析是对具有相关关系的两个变量进行统计分析的一种方法

8、 广义加性模型由什么特点

A:可以自动对自变量和因变量进行非线性关系的建模
B:非线性拟合可能会提高对因变量的预测精度
C:在保持其他自变量不变的情形下可以分析每个自变量对因变量的单独效应
D:非线性拟合可能会降低对因变量的预测精度
答案: 可以自动对自变量和因变量进行非线性关系的建模;
非线性拟合可能会提高对因变量的预测精度;
在保持其他自变量不变的情形下可以分析每个自变量对因变量的单独效应

9、 广义加性模型的拟合方法有

A:自然样条
B:光滑样条
C:多项式回归
D:局部回归
答案: 自然样条;
光滑样条;
多项式回归;
局部回归

10、 下列说法正确的是

A:当变量之间的相关关系不是线性关系时,也能描述变量之间的相关关系
B:当变量之间的相关关系不是线性关系时,也能直接用线性回归方程描述它们的相关关系
C:把非线性回归化为线性回归为我们解决问题提供了一种方法
D:当变量之间的相关关系不是线性关系时,可以通过适当的变换使其转换为线性关系
答案: 当变量之间的相关关系不是线性关系时,也能描述变量之间的相关关系;
把非线性回归化为线性回归为我们解决问题提供了一种方法;
当变量之间的相关关系不是线性关系时,可以通过适当的变换使其转换为线性关系

11、 为了考察两个变量x和y的线性相关性,甲、乙两个同学各自独立地做10次和15次实验,并且利用线性回归方法,求得回归直线分别为L1和L2。已知在两个人的实验中发现对变量x的观测数据的平均值恰好相等,都为s,对变量y的观测数据的平均值也恰好相等,都为t,那么下列说法错误的是

A:直线L1和L2有交点(s,t)
B:直线L1和L2相交,但交点未必是点(s,t)
C:直线L1和L2由于斜率相等,所以必定平行
D:直线L1和L2必定重合
答案: 直线L1和L2相交,但交点未必是点(s,t);
直线L1和L2由于斜率相等,所以必定平行;
直线L1和L2必定重合

12、 线性假设是指自变量xj的变化对因变量y的影响与其他自变量的的取值无关。

A:正确
B:错误
答案: 错误
分析:线性假设是指无论自变量取xj取何值,它变化一个单位所引起的因变量的变化大小是恒定的,加性假设是指自变量xj的变化对因变量y的影响与其他自变量的的取值无关

13、 “回归函数在边界区域是线性的”这个附加约束使自然样条在边界处产生更稳定的估计

A:正确
B:错误
答案: 正确

14、 在N-W方法中,核函数的带宽h越小,估计的回归函数曲线越光滑,h越大,估计的回归函数曲线波动越大。

A:正确
B:错误

答案: 错误

分析:在N-W方法中,核函数的带宽h越大,估计的回归函数曲线越光滑,h越小,估计的回归函数曲线波动越大。

15、 广义加性模型在保持其他自变量不变的情形下可以分析每个自变量对因变量的单独效应。

A:正确
B:错误
答案: 正确

16、 回归函数刻画了平均意义下因变量与自变量的相依关系。

A:正确
B:错误
答案: 正确

17、 回归分析的研究对象是具有相关关系的变量。

A:正确
B:错误
答案: 正确

18、 回归分析的首要问题是
答案: 估计回归系数

19、 分段多项式回归的回归系数发生的临界点称为
答案: 结点

20、 自然样条是添加了            的样条回归:回归函数在边界区域是线性的。
答案: 边界约束

21、 做样条回归时,如果结点个数过     ,样条的回归曲线将非常曲折;反之,将过于平坦。
答案: 多

22、 在光滑样条回归的目标函数中,                 的作用是使得回归函数尽可能拟合训练数据
答案: 损失函数

第四讲 回归方法 第四讲测验

1、 随机森林中分类树的多样性来自于?

A:样本扰动,但没有自变量扰动
B:自变量扰动,但没有样本扰动
C:样本扰动和自变量扰动
D:既没有样本扰动也没有自变量扰动
答案: 样本扰动和自变量扰动

2、 k最近邻法中,随着参数k的变大,最近邻分类器的偏差和方差将如何变化?

A:偏差增大,方差增大
B:偏差增大,方差减小
C:偏差减小,方差增大
D:偏差减小,方差减小
答案: 偏差增大,方差减小

3、 分类树和回归树分别被用于预测什么类型的变量?

A:定性变量,定性变量
B:定性变量,定量变量
C:定量变量,定量变量
D:定量变量,定性变量
答案: 定性变量,定量变量

4、 k最近邻法的基本要素有?

A:k的选择
B:观测类别
C:决策规则
D:距离度量
答案: k的选择;
决策规则;
距离度量

5、 目前集成树的产生方法大致可以分为两类。以下哪些算法属于个体分类树之间不存在强依赖、可同时生成的并行化方法这一类?

A:Bagging
B:Boosting
C:随机森林
D:AdaBoost
答案: Bagging;
随机森林

6、 在分类树中,哪些指标可以作为二叉分裂的准则。

A:RSS
B:分类错误率
C:基尼指数
D:互熵
答案: 分类错误率;
基尼指数;
互熵

7、 LDA和QDA都假设每一类观测服从正态分布,但是LDA假设每一类观测都有自己的方差(或者协方差矩阵)。

A:正确
B:错误
答案: 错误
分析:LDA和QDA都假设每一类观测服从正态分布,但是LDA假设所有类的方差(或者协方差矩阵)是相同的,QDA假设每一类观测都有自己的方差(或者协方差矩阵)。

8、 在构建回归树的过程中,一般采用递归二叉分裂的方法来划分自变量空间。这种方法的贪婪性体现在构建树的每一过程中,“最优”分裂仅限于某一局部过程,而不是针对全局过程。

A:正确
B:错误
答案: 正确

9、 在分类树中,节点的纯度越高,则互熵的值越大。

A:正确
B:错误
答案: 错误
分析:在分类树中,节点的纯度越高,则互熵的值越小。

10、 从偏差-方差权衡的角度看,AdaBoost主要关注降低偏差,因此AdaBoost能基于泛化性能相当弱的分类器构建出很强的集成分类器。

A:正确
B:错误
答案: 正确

11、 贝叶斯分类器将待判别的样本分类到使得样本的后验概率达到最大的那个类中。

A:正确
B:错误
答案: 正确

12、 k最近邻法具有显式的学习过程。

A:正确
B:错误
答案: 错误

13、 一般,我们采用什么方法来估计逻辑斯蒂模型中的参数?
答案: 极大似然

14、 决策树是采用什么策略处理问题的一种方法?
答案: 分而治之

15、 在构建回归树的过程中,我们一般采用什么方法将自变量空间划分为J个矩形区域?
答案: 递归二叉分裂

16、 什么就是通过构建并整合多棵分类树来完成分类任务?
答案: 集成学习


下方是付费阅读内容:本平台商品均为虚拟商品,无法用作二次销售,不支持退换货,请在购买前确认您需要购买的资料准确无误后再购买,望知悉!

暂无优惠



完整答案需点击上方按钮支付5元购买,所有答案均为章节测试答案,购买后上方矩形框将出现已付费的隐藏内容。



不知道怎么购买?点此查看购买教程!


点关注,不迷路,微信扫一扫下方二维码

关注我们的公众号:阿布查查  随时查看答案,网课轻松过


为了方便下次阅读,建议在浏览器添加书签收藏本网页

电脑浏览器添加/查看书签方法

1.按键盘的ctrl键+D键,收藏本页面

2.下次如何查看收藏的网页?

点击浏览器右上角-【工具】或者【收藏夹】查看收藏的网页


手机浏览器添加/查看书签方法

一、百度APP添加/查看书签方法

1.点击底部五角星收藏本网页

2.下次如何查看收藏的网页?

点击右上角【┇】-再点击【收藏中心】查看

二、其他手机浏览器添加/查看书签方法

1.点击【设置】-【添加书签】收藏本网页

2.下次如何查看收藏的网页?

点击【设置】-【书签/历史】查看收藏的网页

阿布查查 » 统计学习(浙江大学) 中国大学mooc慕课答案2024版 m240113
+
账户
更新
搜索
帮助
主页