k-means clustering
آزاد دائرۃ المعارف، ویکیپیڈیا سے
| اصطلاح | term |
|---|---|
|
ک-اوسط خوشہ چینی |
k-means clustering |
احصاء میں ک-اوسط خوشہ چینی طریقہ ہے خوشۂ تحلیل کا، جس کا مقصد n مشاہدات کو k خوشہ جات میں بٹوارہ کرنا ہے جہاں ہر مشاہدہ اس خوشہ سے متعلق سمجھا جائے گا جس کے اوسط سے وہ قریب ترین ہو۔
بیان [ترمیم]
مشاہدات (x1, x2, …, xn) کا طاقم دیا ہو، جہاں ہر مشاہدہ d-بُعد حقیقی سمتیہ ہے، ک-اوسط خوشہ چینی کا ارادہ ان مشاہدات کو k طاقموں (k < n)
S = {S1, S2, …, Sk}
میں بٹوارہ کرنے کا ہوتا ہے، اسطرح کہ خوشہ-میں مربع کے حاصل جمع کی تصغیر ہو:
جہاں μi اوسط ہے طاقم Si میں نقاط کا۔
- Demonstration of the standard algorithm
-
2) k clusters are created by associating every observation with the nearest mean. The partitions here represent the Voronoi diagram generated by the means.
-
3) The centroid of each of the k clusters becomes the new means.
