﻿<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:trackback="http://madskills.com/public/xml/rss/module/trackback/" xmlns:wfw="http://wellformedweb.org/CommentAPI/" xmlns:slash="http://purl.org/rss/1.0/modules/slash/"><channel><title>IT博客-Impossible is Nothing !-随笔分类-Data Mining</title><link>http://www.cnitblog.com/kinns/category/2246.html</link><description>

   如果我QQ上线但又没有给你发消息. 那请你原谅 因为我那时候正专心于我的事业中. 但这并不代表我没有把你放在第一位 恰恰因为我把你放在了第一位 所以才利用没有和你在一起的时间做完我该做的事. 而当我们在一起的时候. 我才能全心全意地和你在一起</description><language>zh-cn</language><lastBuildDate>Sat, 01 Oct 2011 23:46:17 GMT</lastBuildDate><pubDate>Sat, 01 Oct 2011 23:46:17 GMT</pubDate><ttl>60</ttl><item><title>DM学习笔记</title><link>http://www.cnitblog.com/kinns/archive/2006/03/26/8116.html</link><dc:creator>kinns</dc:creator><author>kinns</author><pubDate>Sun, 26 Mar 2006 15:30:00 GMT</pubDate><guid>http://www.cnitblog.com/kinns/archive/2006/03/26/8116.html</guid><wfw:comment>http://www.cnitblog.com/kinns/comments/8116.html</wfw:comment><comments>http://www.cnitblog.com/kinns/archive/2006/03/26/8116.html#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://www.cnitblog.com/kinns/comments/commentRss/8116.html</wfw:commentRss><trackback:ping>http://www.cnitblog.com/kinns/services/trackbacks/8116.html</trackback:ping><description><![CDATA[数据集成与转换:<br />
i. 数据集成处理<br />
   1.模式集成<br />
   2.冗余问题<br />
   3.数据值冲突检测与消除<br />
<br />
ii.数据转换处理<br />
   1.平滑处理: 帮助出去数据中的噪声. 主要方法有: bin方法 聚类方法和回归方法<br />
   2.合计处理: 对数据进行总结或合计操作<br />
   3.数据泛化处理: 用更抽象的概念来取代低层次或数据层的对象. 如年龄属性映射到更高层次的概念: 如青年 中年 老年<br />
   4.规格化: 将数据映射到指定范围中.<br />
   5.属性构造: 根据已有属性构造新属性.<br />
 <br />
  数据规格化三种方法:<br />
   1.最大最小规格化方法: v'=(v-MIN)*(NEW_MAX-NEW_MIN)/(MAX - MIN) + NEW_MIN;<br />
   2.零均值规格化法: v' = (v-A)/σ; A 为属性的均值 σ 为属性的偏差<br />
   3.十基数变换规格法:v' = v/10^j; j 为使 |max(v')|<1
的最小值
<br />
To be continued.<br /><img src ="http://www.cnitblog.com/kinns/aggbug/8116.html" width = "1" height = "1" /><br><br><div align=right><a style="text-decoration:none;" href="http://www.cnitblog.com/kinns/" target="_blank">kinns</a> 2006-03-26 23:30 <a href="http://www.cnitblog.com/kinns/archive/2006/03/26/8116.html#Feedback" target="_blank" style="text-decoration:none;">发表评论</a></div>]]></description></item></channel></rss>