题海
让大学四年没有难题
首页
搜题
登陆
题目详情
多选题
k-近邻算法的基本要素不包括
A.
距离度量
B.
k值的选择
C.
样本大小
查看答案
学科:
机器学习(2024年)
时间:
2024-12-02 00:34:42
相关题目
相关作业
题目1
多选题
在分类实验中,按照正常的顺序对以下的项目执行流程进行排序
A. 拆分数据、并对数据做归一化处理
B. 加载数据
C. 选择不同的算法
D. 训练模型并评价模型
题目2
多选题
<img src="https://tihai-oss-cloud.itihey.com/img/7a8182e1fdc7a62a6c35976ed5114237.png"> 在上图中,绿色圆点为待定点,若执行KNN算法,请问当K分别为1,2,3,4,5时,绿色圆点分别属于那个类别
A. 红蓝红蓝红
B. 红红蓝蓝蓝
C. 红红红蓝蓝
D. 蓝蓝红红红
题目3
多选题
这是一个标准的KNN算法实现 Plain Text# -*- coding: utf-8 -*-import numpy as npimport operatorclass KNN(object): def __init__(self, k=3): self.k = k def fit(self, x, y): self.x = x self.y = y def _square_distance(self, v1, v2): return np.sum(np.square(v1-v2)) def _vote(self, ys): ys_unique = np.unique(ys) vote_dict = {} for y in ys: if y not in vote_dict.keys(): vote_dict[y] = 1 else: vote_dict[y] += 1 sorted_vote_dict = sorted(vote_dict.items(), key=operator.itemgetter(1), reverse=True) return sorted_vote_dict[0][0] def predict(self, x): y_pred = [] for i in range(len(x)): dist_arr = [self._square_distance(x[i], self.x[j]) for j in range(len(self.x))] sorted_index = np.argsort(dist_arr) top_k_index = sorted_index[:self.k] y_pred.append(self._vote(ys=self.y[top_k_index])) return np.array(y_pred) def score(self, y_true=None, y_pred=None): if y_true is None and y_pred is None: y_pred = self.predict(self.x) y_true = self.y score = 0.0 for i in range(len(y_true)): if y_true[i] == y_pred[i]: score += 1 score /= len(y_true) return score 请问以上算法中: Plain Text for i in range(len(x)): dist_arr = [self._square_distance(x[i], self.x[j]) for j in range(len(self.x))] 这两条语句的作用是什么? Plain TextPlain Text
A. 不知道
B. 利用 _square_distance求距离
C. 计算待求的X的每一个样本与原始数据集中每一个样本的距离
D. 计算原始数据集中每一个样本之间的距离
题目4
多选题
在构建决策树时,需要计算每个用来划分数据特征的得分,选择分数最高的特征,以下可以作为得分的是
A. 熵
B. 基尼系数
C. 信息增益
D. 以上都是
题目5
多选题
关于k-近邻算法说法错误的是
A. k-近邻算法是机器学习
B. k代表分类个数
C. k的选择对分类结果没有影响
D. 距离计算方法不同,效果也可能有显著差别
题目6
多选题
k-近邻算法的基本要素不包括
A. 距离度量
B. k值的选择
C. 样本大小
题目7
多选题
Logistics模型解决
A. 回归问题
B. 分类问题
C. 推理问题
D. 聚类问题
题目8
多选题
在决策树算法中,ID3算法使用什么指标来选择最优特征
A. 信息增益
B. 信息增益比
C. 基尼不纯度
D. 卡方检验
题目9
多选题
C4.5算法使用什么指标来选择最优特征
A. 信息增益
B. 信息增益比
C. 基尼不纯度
D. 卡方检验
题目10
多选题
在现实生活中,以下属于分类问题的有
A. 垃圾邮件过滤
B. 新冠疫情什么时候结束
C. 这个学期是否还会返校
D. 剪刀饰头游戏中猜测对方的出什么
下载
题海APP
拍照搜题更快捷
海量题库
无搜索限制
快捷拍照搜题
扫描他!然后带走我~