احصائی اختبار مفروضہ

آزاد دائرۃ المعارف، ویکیپیڈیا سے
:چھلانگ بطرف رہنمائی، تلاش
اصطلاح term

مفروضہ
اختبار
نمونہ
احصائیہ
عدیمہ
وقعت
متبادل
سطح
قدر
آبادی
قسم

hypothesis
test
sample
statistic
null
significance
alternate
level
value
population
type

تجرباتی معطیات سے کسی مفروضہ کے سچ یا جھوٹ ہونے کا اندازہ احتمال نظریہ کے اصولوں کے مطابق لگائے جانے کو احصائی اختبار مفروضہ کہتے ہیں۔

تعاریف[ترمیم]

  • نمونہ: کسی تجربہ یا مشاہدہ سے حاصل ہونے والے معطیات کو احصائی زبان میں نمونے (یا نمونہ جات) کہتے ہیں۔ ان معطیات کا ماخذ تصادفی ہوتا ہے، اسلیے ان ماخذ کو تصادفی متغیر سمجھا جاتا ہے۔
  • آبادی:وہ گروہ جس سے (کے) ہم نمونہ جات حاصل کریں، کو احصائی زبان میں "آبادی" کہا جاتا ہے۔
  • احصائیۂ اختبار: احصائیہ اختبار نمونہ جات کا متعین کردہ دالہ ہوتا ہے۔ اس لیے احصائیہ اختبار بھی تصادفی متغیر ہوتا ہے۔ اس کی مدد سے نمونہ جات اور کسی مفروضہ کے درمیان مطابقت کو جانچا جاتا ہے۔ اگر مشاہدات (نمونہ جات) کو ہم X_1, X_2, X_3, \cdots ,X_n لکھیں، جن کی تعداد n ہے، تو آبادی کے اوسط کے لیے ایک عام استعمال ہونے والا اختبار احصائیہ
Y = \frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}}

ہے، جہاں \bar{X} = \frac{1}{n} \sum_{i=1}^n X_i مشاہدات کا نمونہ اوسط ہے، \mu_0 تصادفی متغیر X_i کا عدیمہ مفروضہ کے تحت اوسط ہے، اور \sigma تصادفی متغیر X_i کا معیاری انحراف۔

  • عدیمہ مفروضہ:وہ بیان جس کی وقعت ناپنے کے لیے "احصائی اختبار مفروضہ" کا استعمال کیا جائے۔ وقعت ناپنے کا یہ "احصائی اختبار" یوں بنایا جاتا ہے کہ مشاہدات کی روشنی میں عدیمہ مفروضہ کے خلاف شہادت کا معائنہ کیا جا سکے۔ عدیمہ مفروضہ عام طور پر "کوئی اثر نہٰیں"، یا "کوئی فرق نہیں پڑتا" جیسی صورت کا بیان ہوتا ہے۔ عدیمہ مفروضہ کو عموماً H_0 لکھا جاتا ہے۔
  • متبادل مفروضہ: وہ بیان جو عدیمہ مفروضہ کے جھوٹ ہونے کی صورت میں سچا ثابت ہو۔ اسے عموماً H_a لکھا جاتا ہے۔
  • P-قدر: یہ فرض کرتے ہوئے کہ "عدیمہ مفروضہ" سچ ہے،P-قدر وہ احتمال ہے کہ "احصایہ اختبار" کی قدر احصایہ کی مشاہداتی قدر سے زیادہ دور ہو گی۔ P-قدر جتنا کم ہو گی، اتنا ہی عدیمہ مفروضہ کو رَد کرنے کے لیے شہادت زیادہ ہو گی۔ تصویر 1 میں احصائیہ Y معیاری معمول توزیع شدہ دکھایا گیا ہے۔ اگر مشاہدات کے بعد Y کی قدر \ y=2.197 آتی ہے تو P-قدر (دو طرفی اختبار کے لیے) سرخ رنگ کے رقبہ کے برابر ہو گی،
\hbox{P-value} = \Pr(Y \ge 2.197286)+ \Pr(Y \le-2.197286) =0.014+0.014= 0.028
  • احصائی وُقعت:مشاہدہ (یا تجربہ) کرنے سے پہلے یہ مقرر کر لیا جاتا ہے کہ اگر P-قدر کسی خاص عدد \alpha سے کم ہوئی، تو عدیمہ مفروضہ کو جھوٹ قرار دیتے ہوئے متبادل مفروضہ کو سچ سمجھا جائے گا۔ \alpha کو وقعت سطح کہا جاتا ہے۔ اگر P-قدر کم ہو \alpha سے، تو ہم کہتے ہیں کہ مشاہدادت احصائی طور پر وقعت رکھتے ہیں، سطح \alpha پر۔
  • طاقت:کسی سطح \alpha کے اختبار کے لیے، وہ احتمال کہ عدیمہ مفروضہ رَد کر دیا جائے گا، جب متبادل مفروضہ درست ہو کسی اوسط \mu کے ساتھ۔ ظاہر ہے کہ یہ احتمال (طاقت) اوسط \mu کا دالہ ہوتا ہے۔
  • غلطیاں: فیصلہ میں دو قسم کی غلطیاں ہو سکتی ہیں۔ اگر اصل میں مفروضہ H_0 سچ ہو مگر اختبار کے زریعہ فیصلہ "رَد H_0" ہو، تو اس غلطی کو قسم I کی غلطی کہتے ہیں۔ اگر اصل میں مفروضہ H_a سچ ہو مگر اختبار کا فیصلہ "قبول H_0" ہو، تو اس غلطی کو قسم II کی غلطی کہتے ہیں۔
اصل حالت
H0 سچ Ha سچ
اختبار پر رَد H0 غلطی قسم I صحیح فیصلہ
مبنی فیصلہ قبول H0 صحیح فیصلہ غلطی قسم II

اگر اختبار کی وقعت سطح \alpha مقرر ہو تو \alpha ہی قسم I غلطی کی قدر ہے۔ متبادل مفروضہ H_a کے اوسط \mu کے لیے اگر اختبار کی طاقت \ \hbox{power}(\mu) ہے، تو قسم II غلطی کی قدر \ \beta=1-\hbox{power}(\mu) ہو گی۔



تصویر ا

آبادی کی اوسط کا احصائی اختبار[ترمیم]

مثال 1 (معلوم تفاوت)[ترمیم]

ایک دواساز ادارہ ایک محلول بناتا ہے جس میں فاعل جزو کی کوئی خاص اوسط ارتکاز \mu ہوتی ہے۔ دواسازی کے طریقہ کار سے یہ معلوم ہے کہ اس جزو کا معیاری انحراف \sigma=0.01 گرام فی لیٹر ہے۔ تظبیطِ کیفیت کے لیے محلول کے نمونہ جات کا ارتکاز ناپا جاتا ہے۔ ان مشاہدات سے ہم یہ جاننا چاہتے ہیں کہ کیا فاعل جزو کی ارتکاز 0.90005 گرام فی لیٹر ہے؟ اس لیے عدیمہ مفروضہ ہو گا

 H_0: \, \mu = 0.90005

اور متبادل مفروضہ

 H_a: \, \mu \ne 0.90005

مشاہدات کو ہم X_1, X_2, X_3, \cdots ,X_n لکھتے ہیں، جن کی تعداد n ہے۔ اس "احصائی اختبار مفروضہ" مسلئہ کے لیے ہم اختبار احصائیہ

Y = \frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}}

چنتے ہیں، جہاں \bar{X} = \frac{1}{n} \sum_{i=1}^n X_i مشاہدات کا نمونہ اوسط ہے۔ مرکزی حد مسلئہ اثباتی کی رو سے احصائیہ Y معیاری معمول توزیع شدہ سمجھا جائے گا (تصویر 1, عدیمہ مفروضہ H_0 کے تحت)

\mu_Y=E(Y)=0, \,\, \sigma_Y=1

غور کرو کہ اس احصائیہ کے استعمال کی وجہ سے تصادفی متغیر Y کا اوسط صفر اور معیاری انحراف 1 ہو جاتا ہے (عدیمہ مفروضہ کے تحت)۔

اب ہم یہ توقع نہیں کرتے کہ ناپے جانے والے مشاہدات کا ارتکاز عین \mu_0=0.90005 ہو گا۔ اگر مشاہدات کا نمونہ اوسط \mu_0=0.90005 سے خاصا دور ہؤا تو ہم عدیمہ مفروضہ کو رَد کر دیں گے۔ مشاہدات سے پہلے ہم احصائی وقعت کی سطح \alpha=0.05 مقرر کرتے ہیں۔ یعنی اگر احصایہ کی P-قدر \alpha سے کم ہوئی تو ہم عدیمہ مفروضہ کو رد کر سکیں گے۔ فرض کرو کہ ارتکاز چار بار تجربہ سے ناپا جاتا ہے اور

\ X_1=0.917, X_2=0.985, X_3=0.963, X_4=0.911

اسلیے \bar{X}=0.944 اور احصایہ کی قدر

Y = \frac{0.944-0.90005}{0.01/\sqrt{4}}=2.197

اوسط \mu_0 سے 2.197\sigma فاصلہ پر ہے۔ تصویر میں (معمول توزیع) ہم دیکھتے ہیں کہ y=2.197 کے لیے P-قدر 0.028 ہے:

\hbox{P-value} = \Pr(Y>2.197)+ \Pr(Y<-2.197) =0.014+0.014= 0.028

چونکہ یہ \alpha=0.05 سے کم ہے، اس لیے ہم عدیمہ مفروضہ کو رد کر دیتے ہیں، یعنی محلول میں فاعل جزو کا ارتکاز 0.90005 نہیں ہے۔

فیصلہ اور وقعت[ترمیم]

کچھ مسائل میں دو مفروضوں کے درمیان فیصلہ کرنے کی ضرورت ہوتی ہے۔ ان میں P-قدر اور وقعت \alpha سطح کا موازنہ کر کے فیصلہ کر لیا جاتا ہے۔ دوسرے مسائل میں فیصلے کی ضرورت نہیں ہوتی، ان میں P-قدر بتا دینا کافی ہوتا ہے جس سے پڑھنے والا اندازہ لگا سکتا ہے کہ عدیمہ مفروضہ کے خلاف شواہد کی وقعت کیا ہے۔

طاقت[ترمیم]

چونکہ اختبار کی سطح 5 فیصد مقرر ہے (\alpha=0.5)، اس لیے عدیمہ مفروضہ اس وقت رَد ہوتا ہے جب \{Y>1.96\} یا \{Y<-1.96\}۔ یعنی ارتکاز کے نمونہ اوسط کی قدر بنتی ہے،

Y = \frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}}= \frac{\bar{X}-0}{.01/\sqrt{4}} >1.96  \,\,,\, \bar{X}>0.90985
Y = \frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}}= \frac{\bar{X}-0}{.01/\sqrt{4}} <-1.96  \,\,,\, \bar{X}<0.89025

اب اگر مفروضہ H_1 کے تحت ارتکاز کی اوسط \mu_1=0.917 ہے، تو متبادل مفروضہ سچ مانا جائے گا اگر

Y > \frac{\bar{X}-\mu_1}{\sigma/\sqrt{n}}= \frac{0.90985-0.917}{.01/\sqrt{4}} =-1.43
Y < \frac{\bar{X}-\mu_1}{\sigma/\sqrt{n}}= \frac{0.89025-0.917}{.01/\sqrt{4}} =-5.35

(خیال رہے کہ تصادفی متغیر Y معیاری معمول توزیع شدہ ہے۔) اس لیے اختبار کی طاقت \mu_1=0.917 کے لیے

\Pr(Y>-1.43) + \Pr(Y < -5.35) \approx 0.9236+0 = 0.9236

(92.4%) ہو گی۔

نامعلوم تفاوت[ترمیم]

اگر مشاہدات (نمونہ جات) کو ہم X_1, X_2, X_3, \cdots ,X_n لکھیں، جن کی تعداد n ہے، تو آبادی کے اوسط کے لیے ایک عام استعمال ہونے والا اختبار احصائیہ

Y = \frac{\bar{X}-\mu}{\sigma/\sqrt{n}}

ہے، جہاں \bar{X} = \frac{1}{n} \sum_{i=1}^n X_i مشاہدات کا نمونہ اوسط ہے، \mu تصادفی متغیر X_i کا اوسط ہے، اور \sigma تصادفی متغیر X_i کا معیاری انحراف۔ جب نمونہ جات معمول توزیع شدہ ہوں، تو احصائیہ Y بھی معمول توزیع شدہ ہو گا۔ مگر اگر تفاوت \sigma^2 معلوم نہ ہو، تو اسے مشاہدات کی مدد سے یوں تخمینہ کرتے ہوئے

s^2= \frac{1}{n-1} \sum_{k=1}^{n} \left( X_k-\bar{X}\right)^2

احصائیہ

T = \frac{\bar{X}-\mu}{s/\sqrt{n}}

استعمال کیا جاتا ہے۔ یہ T احصائیہ t-توزیع شدہ () ہوتا ہے (جب مشاہدات معمول توزیع شدہ ہوں)۔ اوپر کی مثال میں احصائیہ کی اقدار (P-قدر وغیرہ) t-توزیع کو استعمال کرتے ہوئے نکالی جائیں گی۔