分类和回归是数据挖掘和机器学习中通常处理的两个主要预测问题。
分类是寻找或发现有助于将数据分成多个分类类别(即离散值)的模型或函数的过程。 在分类中,根据输入中给出的一些参数将数据分类到不同的标签下,然后为数据预测标签。
派生的映射函数可以以“IF-THEN”规则的形式展示。 分类过程处理数据可以分为二进制或多个离散标签的问题。
举个例子,假设想根据之前记录的一些参数来预测A队获胜的可能性。 然后会有两个标签是和否。 机器学习,分类,回归
回归是寻找用于将数据区分为连续实数值而不是使用类或离散值的模型或函数的过程。 它还可以根据历史数据识别分布运动。 因为回归预测模型预测一个数量,因此,模型的技能必须报告为这些预测中的错误
在回归中举一个类似的例子,在前面记录的一些参数的帮助下,我们发现某些特定区域下雨的可能性。 然后有一个与雨相关的概率。
分类和回归的比较:
对比项 | 分类 | 回归 |
---|---|---|
基础 | 映射函数用于将值映射到预定义的类。 | 映射函数用于将值映射到连续输出。 |
涉及预测 | 离散值 | 连续值 |
预测数据的性质 | 无序 | 有序 |
计算方法 | 通过测量均方根误差 | 测量精度 |
示例 | 算法决策树、逻辑回归等 | 回归树(随机森林)、线性回归等。 |