ک-اوسط خوشہ چینی
Appearance
اصطلاح | term |
---|---|
ک-اوسط خوشہ چینی |
k-means clustering |
احصاء میں ک-اوسط خوشہ چینی طریقہ ہے خوشۂ تحلیل کا، جس کا مقصد n مشاہدات کو k خوشہ جات میں بٹوارہ کرنا ہے جہاں ہر مشاہدہ اس خوشہ سے متعلق سمجھا جائے گا جس کے اوسط سے وہ قریب ترین ہو۔
بیان
[ترمیم]مشاہدات (x1, x2, …, xn)
کا طاقم دیا ہو،
جہاں ہر مشاہدہ d-بُعد حقیقی سمتیہ ہے، ک-اوسط خوشہ چینی کا ارادہ ان مشاہدات کو k طاقموں (k < n)
S = {S1, S2, …, Sk}
میں بٹوارہ کرنے کا ہوتا ہے، اس طرح کہ خوشہ-میں مربع کے حاصل جمع کی تصغیر ہو:
جہاں μi
اوسط ہے طاقم Si
میں نقاط کا۔
- Demonstration of the standard algorithm
-
1) k initial "means" (in this case k=3) are randomly selected from the data set (shown in color).
-
2) k clusters are created by associating every observation with the nearest mean. The partitions here represent the Voronoi diagram generated by the means.
-
3) The centroid of each of the k clusters becomes the new means.
-
4) Steps 2 and 3 are repeated until convergence has been reached.