k-means clustering

آزاد دائرۃ المعارف، ویکیپیڈیا سے
:چھلانگ بطرف رہنمائی، تلاش
اصطلاح term

ک-اوسط خوشہ چینی

k-means clustering

احصاء میں ک-اوسط خوشہ چینی طریقہ ہے خوشۂ تحلیل کا، جس کا مقصد n مشاہدات کو k خوشہ جات میں بٹوارہ کرنا ہے جہاں ہر مشاہدہ اس خوشہ سے متعلق سمجھا جائے گا جس کے اوسط سے وہ قریب ترین ہو۔


بیان[ترمیم]

مشاہدات (x1, x2, …, xn) کا طاقم دیا ہو، جہاں ہر مشاہدہ d-بُعد حقیقی سمتیہ ہے، ک-اوسط خوشہ چینی کا ارادہ ان مشاہدات کو k طاقموں (k < n)

S = {S1S2, …, Sk}

میں بٹوارہ کرنے کا ہوتا ہے، اسطرح کہ خوشہ-میں مربع کے حاصل جمع کی تصغیر ہو:

\underset{\mathbf{S}} \operatorname{arg\,min} \sum_{i=1}^{k} \sum_{\mathbf x_j \in S_i} \left\| \mathbf x_j - \boldsymbol\mu_i \right\|^2

جہاں μi اوسط ہے طاقم Si میں نقاط کا۔

مزید[ترمیم]