دسته بندی داده ها – شاهراه رسیدن به جدول فراوانی
هنگام کار با دادههای آماری، ممکن است با تعداد داده بسیار زیاد مواجه شوید. مثلاً آیا میتوانید وضعیت نمرات درس زبان انگلیسی یک مدرسه بزرگ 200 نفری را تک تک بررسی کنید؟ قطعاً نه!
چگونه میتوانیم این همه داده پراکنده را که جمعآوری شده است بررسی کنیم و به نتیجه برسیم؟ با دسته بندی داده ها متناسب با موضوع آماری و تشکیل جدول فراوانی آن.دامنه تغییرات، طول هر دسته، میانگین کل، مرکز هر دسته و فراوانی دستهها را بدست آورید. کدام گروه برنده جایزه میشوند؟ در کدام گروه دانشآموزان از لحاظ نمره به هم نزدیکترند؟
حل 1:
برای بدست آوردن دامنه تغییرات، باید بزرگترین و کوچکترین داده را مشخص کنیم (در کل دادهها): 20 و 14/25، پس دامنه تغییرات برابر است با: 20–14/25=5/75
برای محاسبه طول هر دسته، از تفاضل بیشترین و کمترین نمره هر گروه استفاده میکنیم:
طول دسته 1: 19/5–16=3/5
طول دسته 2: 20–14/25=5/75
طول دسته 3: 20–19=1
میانگین نمرات کل کلاس:
برای محاسبه مرکز هر دسته بزرگترین و کوچکترین نمره هر گروه را با هم جمع کرده و به 2 تقسیم میکنیم:
x¯¯¯=SNx¯¯¯=17+19+16/5+…+19/75+1914x¯¯¯=18
مرکز دسته 1: 19/5+162=17/75 ؛
مرکز دسته 2: 20+14/252=17/125 ؛
مرکز دسته 3: 20+192=19/5 .
فراوانی دسته، همان تعداد دادههای هر گروه است:
فراوانی دسته 1: 5 عدد
فراوانی دسته 2: 5 عدد
فراوانی دسته 3: 4 عدد.
گروهی برنده چایزه است که بهترین میانگین را داشته باشد. پس میانگین هر گروه را محاسبه میکنیم:
میانگین گروه 1: x¯¯¯1=17+…+165=17/6
میانگین گروه 2:x¯¯¯2=20+…+14/255=17/15
میانگین گروه 3: x¯¯¯3=19/5+…+194=19/56
بنابراین گروه 3 با میانگین بالاتر برنده جایزه خواهد بود.
حال میتوانیم موارد بدست آمده را به شکل جدول هم دستهبندی کنیم:طول دسته، معیاری برای نزدیک بودن دادهها در دسته بندی داده ها:
برای پاسخ به سؤال در مورد این که کدام گروه از لحاظ نمره به هم نزدیکتر بودهاند، میتوان از طول دسته استفاده کرد؛ چون نشان میدهد بهترین و بدترین نمره چقدر فاصله دارند. در این مورد، گروه 3 با طول دسته 1 بهترین عملکرد را داشتهاند.
مثال 2: اگر میانگین 5 نمره درسی شما 17/5 باشد، با گرفتن نمرههای 19 و 15 در دو آزمون بعدی وضعیت نمره شما بهتر خواهد بود یا خیر؟
حل 2:
میانگین 5 نمره درسی شما 17/5 بوده است؛ بنابراین طبق فرمول میانگین x¯¯¯=SN→17/5=S5 مجموع نمرات او (S) برابر است با: S=5×17/5=87/5
برای تعیین وضعیت، باید میانگین قبلی و میانگین جدید را با هم مقایسه کرد. برای بدست آوردن میانگین جدید:
x¯¯¯=SN=87/5+19+157
x¯¯¯=121/57≃17/35
به دلیل کاهش میانگین، نمره او کاهش یافته است.میانگین نمرات کلاس، از تقسیم (مجموع حاصلضرب فراوانی در مرکز دسته) بر (مجموع فراوانیها = تعداد دادهها) بدست میآید:
x¯¯¯=45230≃15/07
همچنین نمودار فراوانی آن به این صورت خواهد بود: