চি-স্কোয়ার পরিসংখ্যান কী?
একটি চি-স্কোয়ার ( χ 2) পরিসংখ্যান এমন একটি পরীক্ষা যা পরিমাপ করে যে কীভাবে প্রত্যাশাগুলি প্রকৃত পর্যবেক্ষণের ডেটা (বা মডেল ফলাফল) এর সাথে তুলনা করে। চি-বর্গাকার পরিসংখ্যান গণনায় ব্যবহৃত ডেটা অবশ্যই এলোমেলো, কাঁচা, পারস্পরিক একচেটিয়া, স্বাধীন ভেরিয়েবল থেকে আঁকা এবং একটি বৃহত পরিমাণে নমুনা থেকে আঁকা থাকতে হবে। উদাহরণস্বরূপ, একটি মুদ্রা 100 বার টসানোর ফলাফলগুলি এই মানদণ্ডগুলি পূরণ করে।
চি-স্কোয়ার টেস্টগুলি প্রায়শই হাইপোথিসিস টেস্টিংয়ে ব্যবহৃত হয়।
চি-স্কোয়ারের সূত্র
2c2 = ∑ (Oi − Ei) 2 কোথাও: c = স্বাধীনতার ডিগ্রি = পর্যবেক্ষণ করা মান (গুলি) E = প্রত্যাশিত মান (গুলি) আরম্ভ {সারিবদ্ধ} & \ চি ^ 2_সি = \ যোগফল \ frac {(ও_আই - ই_আই) ^ 2} {E_i} \ & \ টেক্সটবিএফ {যেখানে:} \ & সি = \ পাঠ্য freedom স্বাধীনতার ডিগ্রি \\ \\ এবং ও = \ পাঠ্য {পর্যবেক্ষণ করা মান (গুলি)} \ এবং ই = \ পাঠ্য {প্রত্যাশিত মান (গুলি) } \ \ শেষ {সারিবদ্ধ} 2c2 = ∑Ei (Oi −Ei) 2 যেখানে: c = স্বাধীনতার ডিগ্রি = পর্যবেক্ষিত মান (গুলি) ই = প্রত্যাশিত মান (গুলি)
চি-স্কোয়ারের পরিসংখ্যান আপনাকে কী বলে?
চি-বর্গক্ষেত্রের দুটি প্রধান পরীক্ষা রয়েছে: স্বাধীনতার পরীক্ষা, যা সম্পর্কের একটি প্রশ্ন জিজ্ঞাসা করে, যেমন, "লিঙ্গ এবং স্যাট স্কোরগুলির মধ্যে কোনও সম্পর্ক আছে কি?" এবং পুরোপুরি ফিটনেস পরীক্ষা, যা "যদি কোনও মুদ্রা 100 বার নষ্ট হয় তবে এটি 50 বার এবং লেজ 50 বার আসবে?"
এই পরীক্ষাগুলির জন্য, পরীক্ষার মধ্যে ভেরিয়েবল এবং নমুনার মোট সংখ্যার ভিত্তিতে একটি নির্দিষ্ট নাল অনুমানকে বাতিল করা যায় কিনা তা নির্ধারণ করতে স্বাধীনতার ডিগ্রি ব্যবহার করা হয় util
উদাহরণস্বরূপ, শিক্ষার্থীরা এবং কোর্সের পছন্দ বিবেচনা করার সময়, 30 বা 40 শিক্ষার্থীর একটি নমুনা আকার উল্লেখযোগ্য ডেটা তৈরি করার পক্ষে যথেষ্ট বড় নয়। 400 বা 500 শিক্ষার্থীর নমুনা আকার ব্যবহার করে অধ্যয়ন থেকে একই বা অনুরূপ ফলাফল পাওয়া আরও বৈধ।
অন্য উদাহরণে, একটি মুদ্রা 100 বার টাসিং বিবেচনা করুন। 100 বার ন্যায্য মুদ্রা ছোঁড়ার প্রত্যাশিত ফলাফলটি হ'ল 50 বার মাথা আসবে এবং লেজ 50 বার আসবে। আসল ফলাফলটি হতে পারে যে মাথাগুলি 45 বার উঠে আসে এবং লেজগুলি 55 বার আসে। চি-বর্গাকার পরিসংখ্যান প্রত্যাশিত ফলাফল এবং প্রকৃত ফলাফলের মধ্যে কোনও তাত্পর্য দেখায়।
চি-স্কোয়ার্ড টেস্টের উদাহরণ
কল্পনা করুন যে এলোমেলো পোলটি পুরুষ এবং মহিলা উভয়ই আলাদা ভোটার জুড়ে নেওয়া হয়েছিল। যে ব্যক্তিরা প্রতিক্রিয়া দেখিয়েছিল তাদের লিঙ্গ অনুসারে শ্রেণিবদ্ধ করা হয়েছিল এবং তারা প্রজাতন্ত্র, গণতান্ত্রিক বা স্বতন্ত্র। রিপাবলিকান, গণতান্ত্রিক এবং স্বতন্ত্র লেবেলযুক্ত কলামগুলি সহ একটি গ্রিড এবং পুরুষ এবং মহিলা লেবেলযুক্ত দুটি সারি কল্পনা করুন। ধরুন ২, ০০০ জন উত্তরদাতাদের তথ্য নিম্নরূপ:
চি স্কোয়ারের পরিসংখ্যান গণনা করার প্রথম পদক্ষেপটি প্রত্যাশিত ফ্রিকোয়েন্সিগুলি সন্ধান করা। এগুলি গ্রিডে প্রতিটি "সেল" এর জন্য গণনা করা হয়। যেহেতু দুটি শ্রেণীর লিঙ্গ এবং তিনটি রাজনৈতিক দৃষ্টিভঙ্গি রয়েছে তাই মোট ছয়টি প্রত্যাশিত ফ্রিকোয়েন্সি রয়েছে। প্রত্যাশিত ফ্রিকোয়েন্সি জন্য সূত্রটি হ'ল:
E (r, c) = n (r) × c (r) নরওয়ে: r = সারি প্রশ্ন প্রশ্নে = কলামে প্রশ্নোত্তর = সংশ্লিষ্ট মোট \ শুরু {সারিবদ্ধ} & E (r, c) = \ frac {n (r) বার সি (আর)} {n} \ & \ টেক্সটবিএফ {যেখানে: in \\ & r = \ পাঠ্য question প্রশ্নে সারি} \ & c = \ পাঠ্য question প্রশ্নে কলাম} \ & n = \ পাঠ্য ing সম্পর্কিত মোট} \ \ শেষ {সারিবদ্ধ} E (r, c) = nn (r) × c (r) যেখানে: r = সারিতে প্রশ্নাবলীতে = প্রশ্নে কলাম = সংশ্লিষ্ট মোট
এই উদাহরণে, প্রত্যাশিত ফ্রিকোয়েন্সিগুলি হ'ল:
- E (1, 1) = (900 x 800) / 2, 000 = 360E (1, 2) = (900 x 800) / 2, 000 = 360E (1, 3) = (200 x 800) / 2, 000 = 80E (2, 1) = (900 x 1, 200) / 2, 000 = 540E (2, 2) = (900 x 1, 200) / 2, 000 = 540E (2, 3) = (200 x 1, 200) / 2, 000 = 120
এর পরে, নীচের সূত্রটি ব্যবহার করে চি স্কোয়ার স্ট্যাটিস্টিকগুলি গণনা করতে এগুলি ব্যবহার করা হয়:
চি-স্কোয়ার্ড = ∑2E (আর, সি) যেখানে: ও (আর, সি) = প্রদত্ত সারির এবং কলামের জন্য পর্যবেক্ষণ করা ডেটা \ শুরু {সারিবদ্ধ} & \ পাঠ্য {চি-স্কোয়ার্ড} = \ যোগফল rac frac {^ 2} (E (r, c)} \ & \ textbf {যেখানে:} \ & O (r, c) = \ পাঠ্য the প্রদত্ত সারি এবং কলামের জন্য data \\ \ প্রান্ত {সারিবদ্ধ} চি-স্কোয়ারড = (E (r, c) 2 যেখানে: O (r, c) = প্রদত্ত সারি এবং কলামের জন্য পর্যবেক্ষণ করা ডেটা
এই উদাহরণে, প্রতিটি পর্যবেক্ষণকৃত মানের জন্য প্রকাশটি হ'ল:
- ও (1, 1) = (400 - 360) 2/360 = 4.44O (1, 2) = (300 - 360) 2/360 = 10O (1, 3) = (100 - 80) 2/80 = 5O (2, 1) = (500 - 540) 2/540 = 2.96O (2, 2) = (600 - 540) 2/540 = 6.67O (2, 3) = (100 - 120) 2/120 = 3.33
চি-স্কোয়ার স্ট্যাটিস্টিকস এর পরে এই মানগুলির যোগফল বা 32.41 এর সমান। এরপরে ফলাফলটি যদি পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ হয় বা না হয়, তবে আমরা আমাদের সেট-আপে স্বাধীনতার ডিগ্রি প্রদত্ত, একটি চি-স্কোয়ার স্ট্যাটিস্টিক টেবিলটি দেখতে পারি।
