我们建立一个5000个特征,100万数据的机器学习模型.我们怎么有效地应对这样的大数据训练()A.我们随机抽取一些样本,在这些少量样本之上训练B.我们可以试用在线机器学习算法C.我们应用PCA算法降维,减少特征数D.B和CE.A和BF.以上所有 - 牛搜题

题目

我们建立一个5000个特征,100万数据的机器学习模型.我们怎么有效地应对这样的大数据训练()

A.我们随机抽取一些样本,在这些少量样本之上训练

B.我们可以试用在线机器学习算法

C.我们应用PCA算法降维,减少特征数

D.B和C

E.A和B

F.以上所有

相似考题

1.我们想要减少数据集中的特征数,即降维.选择以下适合的方案()1.使用前向特征选择方法2.使用后向特征排除方法3.我们先把所有特征都使用,去训练一个模型,得到测试集上的表现.然后我们去掉一个特征,再去训练,用交叉验证看看测试集上的表现.如果表现比原来还要好,我们可以去除这个特征.4.查看相关性表,去除相关性最高的一些特征A.1和2B.2,3和4C.1,2和4D.All

2.数据是我们要处理的（），数据模型是数据的（）。

3.机器学习和数据科学间是存在交集的。例如，逻辑回归可以用来研究关系，也可以用来做预测。我们可以将数据科学和机器学习想象成一个“谱”，较容易解释的模型更靠近数据科学一侧，“黑箱”模型则更靠近机器学习一侧。

4.我们想要减少数据集中的特征数,即降维.选择以下适合的方案:( )A.使用前向特征选择方法B.使用后向特征排除方法C.我们先把所有特征都使用,去训练一个模型,得到测试集上的表现.然后我们去掉一个特征,再去训练,用交叉验证看看测试集上的表现.如果表现比原来还要好,我们可以去除这个特征.D.查看相关性表,去除相关性最高的一些特征

更多“我们建立一个5000个特征,100万数据的机器学习模型.我们怎么有效地应对这样的大数据训练()A.我们 ”相关问题

第1题：

当一个较为复杂的机器学习模型对于训练数据集杰出表现，而对于验证或是实际数据表现较差，此类现象我们称之为（）。通过代表性不足的数据训练出来的机器模型对于验证或是实际数据表现较差，我们称这种现象为（）。

过拟合
第2题：

1、海浪数值模拟数据一般不能作为机器学习模型的训练数据。

ABC
第3题：

我们要用概率模型对数据和标签进行学习，需要数据/标签对服从某种概率分布，称为。

正确
第4题：

97、在拿到一个具体的大数据问题之后，在建立解决问题的模型前，我们首先一般应该做哪些工作
A．概览数据，了解问题背景
B．清洗数据
C．调整模型参数
D．特征的构造与筛选

正确
第5题：

4、机器学习和数据科学间是存在交集的。例如，逻辑回归可以用来研究关系，也可以用来做预测。我们可以将数据科学和机器学习想象成一个“谱”，较容易解释的模型更靠近数据科学一侧，“黑箱”模型则更靠近机器学习一侧。

对

相关内容