تبادلۂ خیال:نظریۂ اطلاعات

آزاد دائرۃ المعارف، ویکیپیڈیا سے
Jump to navigation Jump to search

کئی بار ایسا ہوا ہے کہ ایک ہی عنوان کو ایک جگہ کلک کریں تو صفحہ خالی ملتا ہے اور کسی اور جگہہ سے وہ معلومات سے بھرا ہوا ملتا ہے۔ شاید لنکس کا کوئی مسلہ ہے۔ زیر نظر صفحے کو میں نے اب ایک اور جگہہ بھی دیکھا ہے۔ Gujjar123 11:31, 22 نومبر 2008 (UTC)

  • اگر آپ کوئی مثال دے سکیں تو مزید تحقیق کی جا سکتی ہے۔--Urdutext 12:16, 22 نومبر 2008 (UTC)

برانے مضمون کا قطعہ- برائے تصیح[ترمیم]

پرانے مضمون کا یہ قطعہ یہاں نیچے منتقل کیا گیا ہے۔ اس پر اعتراض یہ ہے کہ حروف کے احتمالات زبان کے کسی بڑے نمونے سے اخذ کرنا ضروری ہیں، نہ کہ اس جملہ سے جس کی ترمیز مقصود ہے۔ --Urdutext 22:39, 27 دسمبر 2009 (UTC)


معلومات کی پیمائش[ترمیم]

معلومات کی پیمائش کے لیے Probability Theory کا سہارا لیا جاتا ہے۔ چنانچہ کسی پیغام میں معلومات ماپنے کے لیے ہم اس پیغام میں ہر حرف کا تعدد معلوم کرتے ہیں۔ اس پیغام میں ہر حرف بھی معلومات کی ایک مقررہ مقدار رکھتا ہے ۔ چنانچہ ایک حرف میں معلومات کی مقدار معلوم کرنے کے لیے پہلے ہم اس کا احتمال کا حساب لگاتے ہیں
احتمال = (پیغام میں اس حرف کی تعداد)/(پیغام میں کل حروف)
اس حرف میں کل معلومات اس کلیے سے معلوم کی جا سکتی ہیں:

جہاں p(x) = Pr({ event x}) اس واقعہ کے رونما ہونے کا احتمال ہے۔
لاگرتھم کی اساس 2 ہے.


مثال:
پیغام = "کام، کام اور کام"
اس پیئام میں کل 16 حروف استعمال ہو‎ۓ ہیں

حرف تعداد حرف احتمال حرف حرفی معلومات درمائلت (Entropy)
ک 3 بار 2.42 0.45
ا 4 بار 2.00 0.50
م 3 بار 2.42 0.45
، 1 بار 4.00 0.25
و 1 بار 4.00 0.25
ر 1 بار 4.00 0.25
خالی جگہہ 3 بار 2.42 0.45
میزان 16 1 2.61

اس جملے میں حرف میں معلومات کی مقدار اس حرف کے احتمال کے لحاظ سے متفرق ہے۔ ہر حرف کی اوسط معلومات اس جملے کے لیے 2.61 اس طرح کل 16 حروف کے لیے16x2.61 یا تقریبا 42 بٹ (ثنائی اعداد) کی ضرورت ہو گی۔
اس کے مقابلے میں ہم دیکھتے ہیں کہ وکی پیڈیا اسی جملے کو ذخیرہ کرنے کے لیے 16*16 یا 256 بٹیں استعمال کرتا ہے (کیونکہ ہر یونی کوڈ حرف 16 بٹ پر مشتمل ہوتا ہے)۔


اصطلاح term

اطلاعات
لاتیقن
واقعہ
درمائلت

Information
uncertainty
Event
Entropy


Information function plot.png

چند الفاظ[ترمیم]

  • reliable کے لیۓ rely یعنی بھروسا یا اعتبار کی وجہ سے ؛ متعبر زیادہ مناسب لگتا ہے۔ مستند ، authentic کے لیۓ موزوں معلوم ہوتا ہے۔
  • gain کے لیۓ اگر حصول کہیں مبالغہ پیدا نا کرے تو مناسب ہے اور اگر ابہام کا اندیشہ ہو تو ربح ہی بہترین معلوم ہوتا ہے۔
  • ابہام اور مبہم ، ambiguous کے لیۓ زیادہ قریب ہیں؛ equivocation کے لیۓ ملتبس ، قریب آتا ہے اور اردو میں بھی مستعمل ہے (دیکھیۓ)۔
  • distort یعنی dis + tort کے لیۓ بہترین مفہوم ، الٹا گھمانا اور بگاڑ وغیرہ بنتا ہے لیکن دونوں الفاظ مبہم ہیں۔ مسخ قریب ہے لیکن بعض طبی مضامین میں (جیسے آنکھ میں پیدا ہونے والا distortion) میں موزوں نہیں آئے گا۔ بگاڑ سے قریب ایک لفظ انحنا ہے جو اردو میں بھی ملتا ہے لیکن یہ محض طبی اور طبیعیاتی مفاہیم تک زیادہ بہتر لگتا ہے۔ ایک آخری قریب ترین لفظ عوج کا ملتا ہے جو اردو میں بھی پایا جاتا ہے (دیکھیۓ بالائی ربط) اور اپنے عربی معنوں میں distortion سے قریب لگتا ہے (عربی لغت) اگر اس پر اتفاق ہو تو ماخوذات درج ذیل ہونگے۔ یہ میرا خیال تھا جو درج کرا اور آخر میں ایک بار اور عرض ہے کہ مسخ بھی استعمال کیا جاسکتا ہے۔
    • distort = عوج
    • distortion = اعواج
    • distorted = معوج

--سمرقندی 09:57, 29 دسمبر 2009 (UTC)