﻿<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:trackback="http://madskills.com/public/xml/rss/module/trackback/" xmlns:wfw="http://wellformedweb.org/CommentAPI/" xmlns:slash="http://purl.org/rss/1.0/modules/slash/"><channel><title>IT博客-xianglj-随笔分类-computation geometry</title><link>http://www.cnitblog.com/xianglj/category/3216.html</link><description /><language>zh-cn</language><lastBuildDate>Thu, 29 Sep 2011 10:15:07 GMT</lastBuildDate><pubDate>Thu, 29 Sep 2011 10:15:07 GMT</pubDate><ttl>60</ttl><item><title>计算几何常用算法介绍</title><link>http://www.cnitblog.com/xianglj/archive/2005/10/08/3140.html</link><dc:creator>模式识别技术</dc:creator><author>模式识别技术</author><pubDate>Sat, 08 Oct 2005 06:41:00 GMT</pubDate><guid>http://www.cnitblog.com/xianglj/archive/2005/10/08/3140.html</guid><wfw:comment>http://www.cnitblog.com/xianglj/comments/3140.html</wfw:comment><comments>http://www.cnitblog.com/xianglj/archive/2005/10/08/3140.html#Feedback</comments><slash:comments>3</slash:comments><wfw:commentRss>http://www.cnitblog.com/xianglj/comments/commentRss/3140.html</wfw:commentRss><trackback:ping>http://www.cnitblog.com/xianglj/services/trackbacks/3140.html</trackback:ping><description><![CDATA[<P>1. 矢量减法</P>
<P><BR>设二维矢量 P = （x1,y1） ，Q = (x2,y2)<BR>则矢量减法定义为： P - Q = ( x1 - x2 , y1 - y2 )<BR>显然有性质 P - Q = - ( Q - P )<BR>如不加说明，下面所有的点都看作矢量，两点的减法就是矢量相减；</P>
<P><BR>2.矢量叉积</P>
<P><BR>设矢量P = （x1,y1） ，Q = (x2,y2)<BR>则矢量叉积定义为：&nbsp; P × Q = x1*y2 - x2*y1&nbsp;&nbsp; 得到的是一个标量<BR>显然有性质 P × Q = - ( Q × P )&nbsp;&nbsp; P × ( - Q ) = - ( P × Q )<BR>如不加说明，下面所有的点都看作矢量，点的乘法看作矢量叉积；</P>
<P>叉乘的重要性质：</P>
<P>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &gt; 若 P × Q&nbsp; &gt; 0 ,&nbsp; 则P 在Q的顺时针方向<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &gt; 若 P × Q&nbsp; &lt; 0 ,&nbsp; 则P 在Q的逆时针方向<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &gt; 若 P × Q&nbsp; = 0 ,&nbsp; 则P 与Q共线，但可能同向也可能反向</P>
<P><BR>3.判断点在线段上</P>
<P><BR>设点为Q，线段为P1P2 ，判断点Q在该线段上的依据是：</P>
<P>( Q - P1 ) × ( P2 - P1 ) = 0&nbsp; 且 Q 在以 P1，P2为对角顶点的矩形内</P>
<P><BR>4.判断两线段是否相交</P>
<P><BR>我们分两步确定两条线段是否相交：</P>
<P>(1)．&nbsp;&nbsp; 快速排斥试验</P>
<P>设以线段 P1P2 为对角线的矩形为R， 设以线段 Q1Q2 为对角线的矩形为T，如果<BR>R和T不相交，显然两线段不会相交；</P>
<P>(2)．&nbsp;&nbsp; 跨立试验</P>
<P>如果两线段相交，则两线段必然相互跨立对方，如图1所示。在图1中，P1P2跨立<BR>Q1Q2 ，则矢量 ( P1 - Q1 ) 和( P2 - Q1 )位于矢量( Q2 - Q1 ) 的两侧，即<BR>( P1 - Q1 ) × ( Q2 - Q1 )&nbsp; *&nbsp; ( P2 - Q1 ) × ( Q2 - Q1 )&nbsp; &lt;&nbsp; 0<BR>上式可改写成<BR>&nbsp;&nbsp; ( P1 - Q1 ) × ( Q2 - Q1 )&nbsp; *&nbsp; ( Q2 - Q1 ) × ( P2 - Q1 )&nbsp; &gt;&nbsp; 0<BR>当( P1 - Q1 ) × ( Q2 - Q1 ) = 0 时，说明( P1 - Q1 ) 和 ( Q2 - Q1 )共线，<BR>但是因为已经通过快速排斥试验，所以 P1 一定在线段 Q1Q2上；同理，<BR>( Q2 - Q1 ) ×( P2 - Q1 )&nbsp; = 0 说明 P2 一定在线段 Q1Q2上。</P>
<P>所以判断P1P2跨立Q1Q2的依据是：</P>
<P>( P1 - Q1 ) × ( Q2 - Q1 )&nbsp; *&nbsp; ( Q2 - Q1 ) × ( P2 - Q1 )&nbsp; ≥&nbsp; 0</P>
<P>同理判断Q1Q2跨立P1P2的依据是：</P>
<P>( Q1 - P1 ) × ( P2 - P1 )&nbsp; *&nbsp; ( P2 - P1 ) × ( Q2 - P1 )&nbsp; ≥&nbsp; 0</P>
<P>至此已经完全解决判断线段是否相交的问题。</P>
<P><BR>5.判断线段和直线是否相交</P>
<P><BR>如果线段 P1P2和直线Q1Q2相交，则P1P2跨立Q1Q2，即：</P>
<P>( P1 - Q1 ) × ( Q2 - Q1 )&nbsp; *&nbsp; ( Q2 - Q1 ) × ( P2 - Q1 )&nbsp; ≥&nbsp; 0</P>
<P><BR>6.判断矩形是否包含点</P>
<P><BR>只要判断该点的横坐标和纵坐标是否夹在矩形的左右边和上下边之间。</P>
<P>6.判断线段、折线、多边形是否在矩形中</P>
<P>因为矩形是个凸集，所以只要判断所有端点是否都在矩形中就可以了。</P>
<P>7.判断矩形是否在矩形中</P>
<P>只要比较左右边界和上下边界就可以了。</P>
<P>8.判断圆是否在矩形中</P>
<P>圆在矩形中的充要条件是：圆心在矩形中且圆的半径小于等于圆心到矩形四边的距<BR>离的最小值。</P>
<P>9.判断点是否在多边形中</P>
<P>以点P为端点，向左方作射线L，由于多边形是有界的，所以射线L的左端一定在多<BR>边形外，考虑沿着L从无穷远处开始自左向右移动，遇到和多边形的第一个交点的<BR>时候，进入到了多边形的内部，遇到第二个交点的时候，离开了多边形，……所<BR>以很容易看出当L和多边形的交点数目C是奇数的时候，P在多边形内，是偶数的话<BR>P在多边形外。</P>
<P>但是有些特殊情况要加以考虑。如果L和多边形的顶点相交，有些情况下交点只能<BR>计算一个，有些情况下交点不应被计算（自己画个图就明白了）；如果L和多边形<BR>的一条边重合，这条边应该被忽略不计。为了统一起见，我们在计算射线L和多边<BR>形的交点的时候，1。对于多边形的水平边不作考虑；2。对于多边形的顶点和L相<BR>交的情况，如果该顶点是其所属的边上纵坐标较大的顶点，则计数，否则忽略；<BR>3。对于P在多边形边上的情形，直接可判断P属于多边行。由此得出算法的伪代码<BR>如下：</P>
<P><BR>1. count ← 0;<BR>2. 以P为端点，作从右向左的射线L;<BR>3. for 多边形的每条边s<BR>4.&nbsp;&nbsp; do if P在边s上<BR>5.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; then return true;<BR>6.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; if s不是水平的<BR>7.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; then if s的一个端点在L上且该端点是s两端点中纵坐标较大的端点<BR>9.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; then count ← count+1<BR>10.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; else if s和L相交<BR>11.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; then count ← count+1;<BR>12. if count mod 2 = 1<BR>13.&nbsp;&nbsp; then return true<BR>14.&nbsp;&nbsp; else return false;</P>
<P>其中做射线L的方法是：设P'的纵坐标和P相同，横坐标为正无穷大（很大的一个正<BR>数），则P和P'就确定了射线L。这个算法的复杂度为O(n)。</P>
<P><BR>10.判断线段是否在多边形内</P>
<P>线段在多边形内的一个必要条件是线段的两个端点都在多边形内；</P>
<P>如果线段和多边形的某条边内交（两线段内交是指两线段相交且交点不在两线段的<BR>端点），因为多边形的边的左右两侧分属多边形内外不同部分，所以线段一定会有<BR>一部分在多边形外。于是我们得到线段在多边形内的第二个必要条件：线段和多边<BR>形的所有边都不内交；</P>
<P>线段和多边形交于线段的两端点并不会影响线段是否在多边形内；但是如果多边形<BR>的某个顶点和线段相交，还必须判断两相邻交点之间的线段是否包含与多边形内部。<BR>因此我们可以先求出所有和线段相交的多边形的顶点，然后按照X-Y坐标排序，这样<BR>相邻的两个点就是在线段上相邻的两交点，如果任意相邻两点的中点也在多边形内，<BR>则该线段一定在多边形内。证明如下：</P>
<P>命题1：</P>
<P>如果线段和多边形的两相邻交点P1 ，P2的中点P' 也在多边形内，则P1, P2之间的<BR>所有点都在多边形内。</P>
<P>证明：</P>
<P>假设P1,P2之间含有不在多边形内的点，不妨设该点为Q，在P1, P'之间，因为多边<BR>形是闭合曲线，所以其内外部之间有界，而P1属于多边行内部，Q属于多边性外部，<BR>P'属于多边性内部，P1-Q-P'完全连续，所以P1Q和QP'一定跨越多边形的边界，因此<BR>在P1,P'之间至少还有两个该线段和多边形的交点，这和P1P2是相邻两交点矛盾，故<BR>命题成立。证毕</P>
<P>由命题1直接可得出推论：</P>
<P>推论2：</P>
<P>设多边形和线段PQ的交点依次为P1,P2,……Pn，其中Pi和Pi+1是相邻两交点，线段<BR>PQ在多边形内的充要条件是：P，Q在多边形内且对于i =1, 2,……, n-1，Pi ,Pi+1<BR>的中点也在多边形内。</P>
<P>在实际编程中，没有必要计算所有的交点，首先应判断线段和多边形的边是否内交<BR>，倘若线段和多边形的某条边内交则线段一定在多边形外；如果线段和多边形的每<BR>一条边都不内交，则线段和多边形的交点一定是线段的端点或者多边形的顶点，只<BR>要判断点是否在线段上就可以了。</P>
<P>至此我们得出算法如下：</P>
<P><BR>1. if 线端PQ的端点不都在多边形内<BR>2.&nbsp;&nbsp; then return false;<BR>3. 点集pointSet初始化为空;<BR>4. for 多边形的每条边s<BR>5.&nbsp;&nbsp; do if 线段的某个端点在s上<BR>6.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; then 将该端点加入pointSet;<BR>7.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; else if s的某个端点在线段PQ上<BR>8.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; then 将该端点加入pointSet;<BR>9.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; else if s和线段PQ相交&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; // 这时候可以肯定是内交<BR>10.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; then return false;<BR>11. 将pointSet中的点按照X-Y坐标排序，X坐标小的排在前面，<BR>&nbsp;&nbsp;&nbsp; 对于X坐标相同的点，Y坐标小的排在前面；<BR>12. for pointSet中每两个相邻点 pointSet[i] , pointSet[ i+1]<BR>13.&nbsp;&nbsp;&nbsp; do if pointSet[i] , pointSet[ i+1] 的中点不在多边形中<BR>14.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; then return false;<BR>15. return true;</P>
<P><BR>这个算法的复杂度也是O(n)。其中的排序因为交点数目肯定远小于多边形的顶点数<BR>目n，所以最多是常数级的复杂度，几乎可以忽略不计。</P>
<P><BR>11.判断折线在多边形内</P>
<P><BR>只要判断折线的每条线段是否都在多边形内即可。设折线有m条线段，多边形有n个<BR>顶点，则复杂度为O(m*n)。</P>
<P><BR>12.判断多边形是否在多边形内</P>
<P>只要判断多边形的每条边是否都在多边形内即可。判断一个有m个顶点的多边形是<BR>否在一个有n个顶点的多边形内复杂度为O(m*n)。</P>
<P><BR>13.判断矩形是否在多边形内</P>
<P><BR>将矩形转化为多边形，然后再判断是否在多边形内。</P>
<P><BR>14.判断圆是否在多边形内</P>
<P><BR>只要计算圆心到多边形的每条边的最短距离，如果该距离大于等于圆半径则该圆在<BR>多边形内。计算圆心到多边形每条边最短距离的算法在后文阐述。</P>
<P><BR>15.判断点是否在圆内</P>
<P>计算圆心到该点的距离，如果小于等于半径则该点在圆内。</P>
<P>16.判断线段、折线、矩形、多边形是否在圆内</P>
<P>因为圆是凸集，所以只要判断是否每个顶点都在圆内即可。</P>
<P>17.判断圆是否在圆内</P>
<P>设两圆为O1,O2，半径分别为r1, r2，要判断O2是否在O1内。先比较r1，r2的大小<BR>，如果r1&lt;r2则O2不可能在O1内；否则如果两圆心的距离大于r1 - r2 ，则O2不在<BR>O1内；否则O2在O1内。</P>
<P>18.计算点到线段的最近点</P>
<P>如果该线段平行于X轴（Y轴），则过点point作该线段所在直线的垂线，垂足很容<BR>易求得，然后计算出垂足，如果垂足在线段上则返回垂足，否则返回离垂足近的端<BR>点；</P>
<P>如果该线段不平行于X轴也不平行于Y轴，则斜率存在且不为0。设线段的两端点为<BR>pt1和pt2，斜率为：<BR>k = ( pt2.y - pt1. y ) / (pt2.x - pt1.x );<BR>该直线方程为：<BR>y = k* ( x - pt1.x) + pt1.y<BR>其垂线的斜率为 - 1 / k，<BR>垂线方程为：<BR>y = (-1/k) * (x - point.x) + point.y<BR>联立两直线方程解得：<BR>x&nbsp; =&nbsp; ( k^2 * pt1.x + k * (point.y - pt1.y ) + point.x ) / ( k^2 + 1)<BR>y&nbsp; =&nbsp; k * ( x - pt1.x) + pt1.y;</P>
<P>然后再判断垂足是否在线段上，如果在线段上则返回垂足；如果不在则计算两端点<BR>到垂足的距离，选择距离垂足较近的端点返回。</P>
<P>19.计算点到折线、矩形、多边形的最近点</P>
<P>只要分别计算点到每条线段的最近点，记录最近距离，取其中最近距离最小的点即<BR>可。</P>
<P>20.计算点到圆的最近距离</P>
<P>如果该点在圆心，则返回UNDEFINED<BR>连接点P和圆心O，如果PO平行于X轴，则根据P在O的左边还是右边计算出最近点的<BR>横坐标为centerPoint.x - radius 或 centerPoint.x + radius， 如图4 (a)所示；<BR>如果PO平行于Y轴，则根据P在O的上边还是下边计算出最近点的纵坐标为<BR>centerPoint.y + radius 或 centerPoint.y - radius， 如图4 (b)所示。</P>
<P>如果PO不平行于X轴和Y轴，则PO的斜率存在且不为0，如图4(c)所示。这时直线PO<BR>斜率为<BR>k = （ P.y - O.y ）/&nbsp; ( P.x - O.x )<BR>直线PO的方程为：<BR>y = k * ( x - P.x) + P.y<BR>设圆方程为:<BR>(x - O.x ) ^2 + ( y - O.y ) ^2 = r ^2，<BR>联立两方程组可以解出直线PO和圆的交点，取其中离P点较近的交点即可。</P>
<P>21.计算两条共线的线段的交点</P>
<P>对于两条共线的线段，它们之间的位置关系有图5所示的几种情况。<BR>图5(a)中两条线段没有交点；图5 (b) 和 (d) 中两条线段有无穷焦点；图5 (c)<BR>中两条线段有一个交点。设line1是两条线段中较长的一条，line2是较短的一条，<BR>如果line1包含了line2的两个端点，则是图5(d)的情况，两线段有无穷交点；如<BR>果line1只包含line2的一个端点，那么如果line1的某个端点等于被line1包含的<BR>line2的那个端点，则是图5(c)的情况，这时两线段只有一个交点，否则就是<BR>图5(c)的情况，两线段也是有无穷的交点；如果line1不包含line2的任何端点，<BR>则是图5(a)的情况，这时两线段没有交点。</P>
<P><BR>22.计算线段或直线与线段的交点</P>
<P>设一条线段为L0 = P1P2，另一条线段或直线为L1 = Q1Q2 ，要计算的就是L0和L1<BR>的交点。</P>
<P>1.首先判断L0和L1是否相交（方法已在前文讨论过），如果不相交则没有交点，<BR>否则说明L0和L1一定有交点，下面就将L0和L1都看作直线来考虑。</P>
<P>2.如果P1和P2横坐标相同，即L0平行于Y轴<BR>&nbsp; a)若L1也平行于Y轴，<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; i.若P1的纵坐标和Q1的纵坐标相同，说明L0和L1共线，假如L1是直线的话他们有<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 无穷的交点，假如L1是线段的话可用"计算两条共线线段的交点"的算法求他们<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 的交点（该方法在前文已讨论过）；<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; ii.否则说明L0和L1平行，他们没有交点；<BR>&nbsp; b)若L1不平行于Y轴，则交点横坐标为P1的横坐标，代入到L1的直线方程中可以计<BR>&nbsp;&nbsp;&nbsp; 算出交点纵坐标；<BR>3.如果P1和P2横坐标不同，但是Q1和Q2横坐标相同，即L1平行于Y轴，则交点横<BR>坐标为Q1的横坐标，代入到L0的直线方程中可以计算出交点纵坐标；<BR>4.如果P1和P2纵坐标相同，即L0平行于X轴<BR>&nbsp; a)若L1也平行于X轴，<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; i.若P1的横坐标和Q1的横坐标相同，说明L0和L1共线，假如L1是直线的话他们<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 有无穷的交点，假如L1是线段的话可用"计算两条共线线段的交点"的算法求<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 他们的交点（该方法在前文已讨论过）；<BR>&nbsp;&nbsp;&nbsp;&nbsp; ii.否则说明L0和L1平行，他们没有交点；</P>
<P>&nbsp;&nbsp; b)若L1不平行于X轴，则交点纵坐标为P1的纵坐标，代入到L1的直线方程中可以计<BR>&nbsp;&nbsp;&nbsp;&nbsp; 算出交点横坐标；<BR>5.如果P1和P2纵坐标不同，但是Q1和Q2纵坐标相同，即L1平行于X轴，则交点纵坐标<BR>为Q1的纵坐标，代入到L0的直线方程中可以计算出交点横坐标；<BR>6.剩下的情况就是L1和L0的斜率均存在且不为0的情况<BR>&nbsp;&nbsp; a)计算出L0的斜率K0，L1的斜率K1 ；<BR>&nbsp;&nbsp; b)如果K1 = K2<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; i.如果Q1在L0上，则说明L0和L1共线，假如L1是直线的话有无穷交点，假如L1<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 是线段的话可用"计算两条共线线段的交点"的算法求他们的交点（该方法在<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 前文已讨论过）；<BR>&nbsp;&nbsp;&nbsp;&nbsp; ii.如果Q1不在L0上，则说明L0和L1平行，他们没有交点。<BR>&nbsp;&nbsp; c)联立两直线的方程组可以解出交点来</P>
<P>说明：这个算法并不复杂，但是要分情况讨论清楚，尤其是当两条线段共线的情况<BR>需要单独考虑，所以在前文将求两条共线线段的算法单独写出来。另外，一开始就<BR>先利用矢量叉乘判断线段与线段（或直线）是否相交，如果结果是相交，那么在后<BR>面就可以将线段全部看作直线来考虑。</P>
<P>23.求线段或直线与折线、矩形、多边形的交点</P>
<P>分别求与每条边的交点即可。</P>
<P>24.求线段或直线与圆的交点<BR></P>
<P><BR>设圆心为O，圆半径为r，直线（或线段）L上的两点为P1,P2。<BR>1.如果L是线段且P1，P2都包含在圆O内，则没有交点；否则进行下一步<BR>2.如果L平行于Y轴，<BR>&nbsp; a)计算圆心到L的距离dis<BR>&nbsp; b)如果dis &gt; r 则L和圆没有交点；<BR>&nbsp; c)利用勾股定理，可以求出两交点坐标，如图6(a)所示；但要注意考虑L和圆的相<BR>&nbsp;&nbsp;&nbsp; 切情况<BR>3.如果L平行于X轴，做法与L平行于Y轴的情况类似；<BR>4.如果L既不平行X轴也不平行Y轴，可以求出L的斜率K，然后列出L的点斜式方程<BR>，和圆方程联立即可求解出L和圆的两个交点；<BR>5.如果L是线段，对于2，3，4中求出的交点还要分别判断是否属于该线段的范围内。</P>
<P>&nbsp;</P><img src ="http://www.cnitblog.com/xianglj/aggbug/3140.html" width = "1" height = "1" /><br><br><div align=right><a style="text-decoration:none;" href="http://www.cnitblog.com/xianglj/" target="_blank">模式识别技术</a> 2005-10-08 14:41 <a href="http://www.cnitblog.com/xianglj/archive/2005/10/08/3140.html#Feedback" target="_blank" style="text-decoration:none;">发表评论</a></div>]]></description></item><item><title>数据挖掘聚类算法一览</title><link>http://www.cnitblog.com/xianglj/archive/2005/09/20/2783.html</link><dc:creator>模式识别技术</dc:creator><author>模式识别技术</author><pubDate>Tue, 20 Sep 2005 01:33:00 GMT</pubDate><guid>http://www.cnitblog.com/xianglj/archive/2005/09/20/2783.html</guid><wfw:comment>http://www.cnitblog.com/xianglj/comments/2783.html</wfw:comment><comments>http://www.cnitblog.com/xianglj/archive/2005/09/20/2783.html#Feedback</comments><slash:comments>5</slash:comments><wfw:commentRss>http://www.cnitblog.com/xianglj/comments/commentRss/2783.html</wfw:commentRss><trackback:ping>http://www.cnitblog.com/xianglj/services/trackbacks/2783.html</trackback:ping><description><![CDATA[<TABLE>
<TBODY>
<TR>
<TD id=fontzoom style="WORD-BREAK: break-all" vAlign=top colSpan=2 height=600><FONT color=#555555>聚类分析是数据挖掘中的一个很活跃的研究领域，并提出了许多聚类算法。<BR>这些算法可以被分为划分方法、层次方法、基于密度方法、基于网格方法和<BR>基于模型方法。<BR>1 划分方法(PAM:PArtitioning method)&nbsp;&nbsp;首先创建k个划分，k为要创建的划分个数；然后利用一个循环<BR>定位技术通过将对象从一个划分移到另一个划分来帮助改善划分质量。典型的划分方法包括：<BR>k-means,k-medoids,CLARA(Clustering LARge Application),<BR>CLARANS(Clustering Large Application based upon RANdomized Search). <BR>FCM<BR><BR>2 层次方法(hierarchical method)&nbsp;&nbsp;创建一个层次以分解给定的数据集。该方法可以分为自上<BR>而下（分解）和自下而上（合并）两种操作方式。为弥补分解与合并的不足，层次合<BR>并经常要与其它聚类方法相结合，如循环定位。典型的这类方法包括：<BR>第一个是;BIRCH(Balanced Iterative Reducing and Clustering using Hierarchies) 方法，它首先利用树的结构对对象集进行划分；然后再利<BR>用其它聚类方法对这些聚类进行优化。<BR>第二个是CURE(Clustering Using REprisentatives) 方法，它利用固定数目代表对象来表示相应聚类；然后对各聚类按照指定<BR>量（向聚类中心）进行收缩。<BR>第三个是ROCK方法，它利用聚类间的连接进行聚类合并。<BR>最后一个CHEMALOEN，它则是在层次聚类时构造动态模型。<BR><BR>3 基于密度方法，根据密度完成对象的聚类。它根据对象周围的密度（如<BR>DBSCAN）不断增长聚类。典型的基于密度方法包括：<BR>&nbsp;&nbsp;DBSCAN(Densit-based Spatial Clustering of Application with Noise):该算法通过不断生长足够高密<BR>度区域来进行聚类；它能从含有噪声的空间数据库中发现任意形状的聚类。此方法将一个聚类定义<BR>为一组“密度连接”的点集。<BR>&nbsp;&nbsp;OPTICS(Ordering Points To Identify the Clustering Structure):并不明确产生一<BR>个聚类，而是为自动交互的聚类分析计算出一个增强聚类顺序。。<BR><BR>4 基于网格方法，首先将对象空间划分为有限个单元以构成网格结构；然后利<BR>用网格结构完成聚类。<BR>&nbsp;&nbsp;&nbsp;&nbsp;STING(STatistical INformation Grid) 就是一个利用网格单元保存的统计信息进行基<BR>于网格聚类的方法。<BR>&nbsp;&nbsp;&nbsp;&nbsp;CLIQUE(Clustering In QUEst)和Wave-Cluster 则是一个将基于网格与基于密度相结合的方<BR>法。<BR><BR>5 基于模型方法，它假设每个聚类的模型并发现适合相应模型的数据。典型的<BR>基于模型方法包括：<BR><BR>&nbsp;&nbsp;&nbsp;&nbsp;统计方法COBWEB:是一个常用的且简单的增量式概念聚类方法。它的输入对象是采<BR>用符号量（属性-值）对来加以描述的。采用分类树的形式来创建<BR>一个层次聚类。<BR>&nbsp;&nbsp;&nbsp;&nbsp;CLASSIT是COBWEB的另一个版本.。它可以对连续取值属性进行增量式聚<BR>类。它为每个结点中的每个属性保存相应的连续正态分布（均值与方差）；并利<BR>用一个改进的分类能力描述方法，即不象COBWEB那样计算离散属性（取值）<BR>和而是对连续属性求积分。但是CLASSIT方法也存在与COBWEB类似的问题。<BR>因此它们都不适合对大数据库进行聚类处理.<BR><BR>&nbsp;&nbsp; 神经网络方法SOM,LVQ(Learning Vector Quantization)</FONT><BR></TD></TR></TBODY></TABLE></HTM><img src ="http://www.cnitblog.com/xianglj/aggbug/2783.html" width = "1" height = "1" /><br><br><div align=right><a style="text-decoration:none;" href="http://www.cnitblog.com/xianglj/" target="_blank">模式识别技术</a> 2005-09-20 09:33 <a href="http://www.cnitblog.com/xianglj/archive/2005/09/20/2783.html#Feedback" target="_blank" style="text-decoration:none;">发表评论</a></div>]]></description></item></channel></rss>