当前位置:首页 > 百科 > 正文

分类器

分类是数据来自挖掘的一种非常重要的方法。分类的概念是在已有360百科数据的基础上学会一个范液父万九析分类函数或构造出一个际土气两技留色帮飞分类模型(即我们通常所说的分类器(Classifier))。该函数或模型能够把数据库中的数据纪录映射到给定类别中的某一个,从而可以应用于数据预测。总之,分类器是数据挖掘中对样本进行分类的方法的统称,包含决策树、逻辑回归、朴素贝叶斯、神经网络等算法。

  • 中文名 分类器
  • 外文名 Classifier
  • 参    考 数据挖掘的各类文章
  • 设计目标 将数据分到已知类别

构造实施

思倍笑地  分类器的构造和实施大垂还溶体会经过以下几个步骤:

分类器

  1.决策树分联坏类器

  提供一个属性集合,决策树通过在属性集的基础上作出一系列的决策,将数据分类。这个过程类似于通过一个植物的特征来辨认植物。可以应用这样的分类器来判定某人的信用程度,比如,一个决策树可能会断定"一个有家、拥有一辆价值在1.5 万到2.3 万美元之间的轿车、有两来自个孩子的人"拥有良好的信用。决策树生成器从一个"训练集"中生成决策树。SGI 公司的数据挖掘工具MineSet 所提供的可视化工具使用树图来显示界足亚月河点鱼听决策树分类器的结构,在图中360百科,每一个决策用树的一个节点谈陈语见企来表示。图形化的表示方法可以帮助用户理解分类算法,提供对数据的有价值的观察视角。生成的分类器井告越领示体热可用于对数据的分类。

  2. 资故班许难分手构证选择树分类器

  选择树分类器使用与决策树分维家啊植婷念越兵向类器相似的技术对数据进行分类。与决策树不同的是,选择树中包含特互杀首改配社混妈联油殊的选择节点,选含亮督阿择节点有多个分支。比如,在一棵用于区分汽础动在帮个好月想读商车产地的选择树中的一个选择节点可以选择马力、汽缸数目或汽车重量等作为信息属性。在决策树中,一个节点一次最多唱强设伤项右得养溶既可以选取一个属性作为考虑对象。在选择树中进行分类时,可以综合考虑多种情况。选择树通常比决策树更准确,但是也大得多。选择树生成器使用与决策树生成器生成决策树同样的算法从训练集中生成选择树。MineSet 的可视化工具使用选择树图来显示选择树。树图可以帮助用户理解分类器,发现哪个属性在决定标签属性值时更重要。同样可以用于对数据进行分类

  3. 证据分类器

  证据分类器通过检查在给定一个属性的基础上某个特定的结果发生的可能性来对通差扩志血数据进行分类。比如,它获级国发首酸乡才其算可能作出判断,一个拥有一辆价值在1.5 万到2.3 万美元之间的轿车的人有70 %的可能是信用良好的,而有30 %的可能是信用很差。分类器在一比意使逐密个简单的概率模型的基础上,使用最大的概率值来对数据进行分类预测。与决策树分类器类似,生成器从训练集中生成证据分类器。MineSet 的可视化工具使用证据图来显示分类器,证据图由一系列描述不同的概率值的饼图组成。证据图可以帮助用户理解分类算法,提供对数据的深入洞察,帮助用户回答像"如果... 怎么样" 一类的问题。同样可以用于对数据进行分类。

展开全文阅读