المساعد الشخصي الرقمي

مشاهدة النسخة كاملة : مبادىْ الاحصاء لطلبة كليات المجتمع في الاردن د.جبر البنا


د.جبر البنا
01-09-2013, 07:35 PM
مبادىْ الاحصاء لطلبة كليات المجتمع
اعداد :د.جبر البنا
دكتوراة مناهج وتدريس الرياضيات – عمان الاردن

كلية القادسية
قسم العلوم الادراية المادة: مبادئ الاحصاء
قسم العلوم الادارية والمالية المدرس : د.جبر البنا
العام الدراسي 2012-2013 الفصل : الاول
[فقط الأعضاء المسجلين والمفعلين يمكنهم رؤية الوصلات]
الفصل الدراسي الاول

ملف المادة

هدف المقرر:-
نحن نعيش في عصر المعلومات وعالم الأعمال يتطلب منا اليوم معالجة وتنظيم وتقديم وتفسير كميات كبيرة منها وطبيعتها الكمية. والمهارات التي نحن بحاجة إليها في التعامل مع هذه المعلومات مرتبطة بعلم الإحصاء (statistics).
فالإحصاء : هو العلم الذي يبحث في جميع البيانات الخاصة لمختلف الظواهر وتصنيف هذه البيانات في جداول منظمة وتمثيلها بيانيا علي شكل رسومات أو صور توضيحية وكذلك تحليل البيانات واستخلاص النتائج منها واستخدامها في اتخاذ القرار المناسب ومقارنة الظواهر ببعضها ومحاولة استنتاج علاقات بينها.وعلم الإحصاء أيضا نفسه هو فرع من علم الرياضيات متعلق بمعالجة مختلف البيانات الإحصائية عن العالم وهو عبارة عن مجموعة من الأساليب والعمليات الإحصائية الخاصة بمعالجة البيانات الكمية أو الرقمية.
وصف المقرر:- يتضمن هذا المقرر ماهية الإحصاء ومجالات استخدامه، والطريقة الإحصائية، والعينات، وتبويب البيانات وجدولتها وتمثيلها بيانيا، والتوزيعات التكرارية، ومقاييس النـزعة المركزية، ومقاييس التشتت، والانحدار، والارتباط، والاحتمالات.
المخرجات المتوقعة من التدريس: أو الأهداف التربوية العامة
يتوقع من الطالب بعد دراسة "مبادىء الاحصاء" ، في نهاية هذا الفصل الدراسي أن يكون قادرا على:ـ
1. حساب مقاييس النـزعة المركزية، مقاييس التشتت، معادلة خط الانحدار بين متغيرين،
2. تمثيل البيانات الأولية والتوزيعات التكرارية من خلال البيانات المعطاة بيانيا مما يساعده على فهم ووصف البيانات والتعرف على صفاتها وخواصها.
3. التعرف على مفهوم الارتباط وكيفية حسابه وتفسيره.
4. أن يؤمن بأهمية النهج الإحصائي في حياته.
5. أن يستخلص تقاطعات مهمة في حياته من المفاهيم الإحصائية.

المعارف والمهارات المستهدفة للمقرر : -
اكساب الطلاب مهارات استخدام الاساليب الاحصائية في مجالات عديدة.
أ- الاهداف السلوكية: يتوقع من الطالب أن يحقق الأهداف السلوكية التالية خلال هذا الفصل:
1- استخدام الاساليب الاحصائية لجمع البيانات.
2- استخدام الاساليب الاحصائية لعرض البيانات.
3- استخدام الاساليب الاحصائية للتنبؤ.
4- معرفة بعلم الإحصاء، وخطوات البحث العلمي، وأنواع العينات.
5- معرفة بأساليب العروض البيانية.
6- يستطيع أن يبني جدول تكراري بناء على ما تعلمه بشكل صحيح.
7- يميز بين مقاييس المركزية ومقاييس التشتت.
8- يعرف الارتباط والانحدار.
9- يحلل نتائج معامل الارتباط بين متغيرين.
10- يبين أهمية الإحصاء بالنهج الإحصائي في حياته.
ب- المهارات الذهنية: تمكين الطالب على ان يكون الطالب قادراَ على تحديد و اختيار أي من الطرق تكون مناسبة لجمع البيانات.



المصادر المساندة : يمكن الاعتماد على اي مصدر من مصادر اساسيات الاحصاء أو مبادئ الاحصاء وعلي سبيل المثال وليس الحصر
اسم الكتاب اسم المؤلف اسم الناشر سنة النشر
مبادئ الإحصاء فاروق عبد العظيم وأخرون دار المعرفة الجامعية 2003
الإحصاء مفاهيم أساسية عبدالله عبدالحليم وأخرون دار المعرفة الجامعية 2003
حسن محمد حسن أساسيات الإحصاء وتطبيقاته دار المعرفة الجامعية 1992



التقييم:
الامتحانات العلامة الموعد
الاول 20علامة يحدد من قبل الاستاذ
الثاني 20 درجة يحدد من قبل الاستاذ
المشاركات و حل واجبات التقارير ( الفصل الاول ) 10علامات يومي أو اسبوعي
المجموع 50درجة حسب التقويم السنوي
النهائي 50درجة حسب جدول الامتحانات المحدد من قبل القسم
المجموع الكلي 100 درجة عند اعطء النتائج المهائية

















محتويات المقرر وتوزيعه على أسابيع الفصل الدراسي الاول و الثاني :

الاسبوع الموضوع الفصل
الاسبوع الاول : الاهمية ، تعريف ، مجالات التطبيق ، اساليب تبويب البيانات ...... الخ ف1
الاسبوع الثاني: تصنيف و تبويب البيانات و انواعها ف1
الاسبوع الثالث: الجداول الاحصائية و الرسوم البيانية ف1
الاسبوع الرابع: كيفية رسم الاشكال الهندسية ( المدرج التكراري ، المضلع التكراري ، المنحني التكراري ..الخ) ف1
الأسبوع الخامس: بعض الرموز الاحصائية ( خصائصها و اشتقاقاتها ) ف2
الاسبوع السادس و السابع : مقايس النزعة المركزية ( الوسط الحسابي ، الوسيط ، المنوال ، الوسط التوافقي) في حالة البيانات الغير مبوبة ف2
الاسبوع الثامن و التاسع: مقايس النزعة المركزية ( الوسط الحسابي ، الوسيط ، المنوال ، الوسط التوافقي) في حالة البيانات المبوبة ف2
الاسبوع العشر امتحان الفصل الدراسي الاول
الاسبوع الحادي عشر: مقايس التشتت ( المدى ، الانحراف المتوسط ، الانحراف المعياري ، التباين) في حالة البيانات الغير مبوبة ف3
الاسبوع الثاني و الثالث عشر: مقايس التشتت ( المدى ، الانحراف المتوسط ، الانحراف المعياري ، التباين) في حالة البيانات المبوبة ف3
الاسبوع الرابع عشر: معامل الاختلاف ( لاهمية و كيفية حسابها و الهدف منه) ف3
الأسبوع الخامس عشر: معامل الارتباط ( الاهمية ، الهدف من دراسته ، أنواع الارتباط) ف4
الأسبوع السادس عشر: معامل الارتباط البسيط و معامل الارتباط الجزئي ف4
الاسبوع السابع عشر: معامل الارتباط الرتب ف4
الاسبوع الثامن عشر امتحان الفصل الدراسي الثاني
الاسبوع التاسع عشر الانحدار الخطي ( الاهمية و الهدف من تطبيقها) بالاظافة الى كيفية حساب معامل الانحدار البسيط ف5











الفصل الأول : المقدمة
1- تعريف علم الإحصاء :
هو العلم أو مجموعة القواعد والطرق والنظريات التي تهتم بجمع البيانات وتبويبها وعرضها بيانياً ثم تحليلها وتفسيرها وإجراء المقارنات واستنتاج العلاقات بهدف استخدامها في اتخاذ القرارات المناسبة .
من هذا التعريف يمكن أن تستنتج عدد من الملاحظات وهي :
1 - أن المراحل الاساسيه للعملية الإحصائية هي 4 مراحل :
1- جمع البيانات.
2- تبويب البيانات .
3- العرض البياني للبيانات .
4- تحليل البيانات.
2 - الهدف الأساسي من العملية الاحصائيه هو تحليل البيانات وتفسيرها.
3 - يمكن تطبيق عملية الإحصاء في مختلف المجالات.
4 - أن البيانات هي المجال الرئيسي لمراحل علم الإحصاء

2- أنواع البيانات :هناك نوعين من أنواع البيانات :
1- بيانات الوصفية
2- بيانات الكمية
وكل نوع ينقسم إلى قسمين كما هو موضح في الجدول الأتي :
البيانات الوصفية البيانات الكميه
بيانات وصفيه اسميه
مثل تصنيف المواليد(ذكور/ إناث)
بيانات وصفيه ترتيبية
مثل التقديرات : (ممتاز, جيد) بمعنى أنها ترتب الممتاز في الأول ثم الجيد جدا ثم الجيد
وهكذا .
بيانات كميه متصلة
وهي التي تأخذ جميع القيم داخل نطاق معين مثلا : ( أعمار عمال مصنع ن20إلى60 )
يعني قبل العشرين المصنع ما يوصف وبعد ال60 عادة التقاعد , فالقيم هنا مابين ال20 وال60 بيانات كمية منقطعة
وهي التي تأخذ قيماً منقطعة عن بعض مثلا :
(عدد أفراد الاسره : أسره أفرادها 4 وأسرة أفرادها 8 وهكذا ) و
ممكن لا يكون هناك أسرة عدد أفرادها مابين ال4 وال8
إذا البيانات هنا منقطعة

والبيانات الكميه يعبر عنها بأرقام , ويمكن ترتيبها تصاعدياً وتنازلياً , وكذلك يمكن إجراء العمليات الحسابية عليها…


3- جمع البيانات : جمع وتبويب وعرض بياني وتحليل . ونختصر جمع البيانات في النقاط التالية :
1- هي المرحلة الأولى من مراحل علم الإحصاء وهي المرحلة الأساسية والمهمة .
2- تعتبر أكثر تكلفة وأكثر جهد .
3- يٌنشأ لها أجهزة ومؤسسات متخصصة .
4- مصادر البيانات :
المصدر الأول : المصادر التاريخية للبيانات :
وتشمل الإحصاءات والنشرات الإحصائية التي تصدرها المؤسسات الحكومية والخاصة والأهلية لتبين أوجهة التغير والتطور في المجال الذي تختص به هذه المؤسسات . وهذه البيانات هي من مسؤولية هذه الشركة أو المؤسسة .
- ونلاحظ على هذا المصدر 4 ملاحظات :
1- عدم توفر جميع البيانات . (لا تغطي جميع اوجة البحث)
2- قد تكون قديمة . (لم تحدث)
3- قد تكون غير دقيقة , وقد تكون من جهة غير موثوق فيها (الغرض من البيانات الدعاية فقط) .
4- قد لا تكون البيانات المنشورة تغطي جميع جوانب البحث .
المصدر الثاني : المصادر الميدانية للبيانات :
يلجأ الباحث لجمع البيانات بنزوله للميدان يبحث هو أو عن طريق الاستبيانات الخاصة بذلك يحصل منهم على البيانات مباشرة , ويمكن أن يشمل أفراد أو أجزاء أو أن يشمل عينة من الإطار .
( يقوم هو بنفسه بجمع البيانات وتعبئه الاستبيانات )
5- أساليب البحث الميداني :
إذا قرر الباحث ان يبحث بنفسه فله أن يختار أسلوبين :
أ‌- الحصر الشامل .
ب‌- العينات .
الأسلوب الأول : تعريف المجتمع الإحصائي (الحصر الشامل) :
وهو جميع المفردات التي يجمعها إطار معين , أو مجموعة من الخصائص المشتركة العامة . (مثل عدد خلايا في شعبه)يلاحظ علية :
1. الشمول
2. تنوع المجتمعات الإحصائية :( بشري – نباتي - حيواني )
3. المجتمع الإحصائي قد يكون محدود أو غير محدود . ( محدود بقاعه معينه بكلية وقد يكون غير محدود بمجتمع معين )
4. جميع أفراد المجتمع يجمعهم أطار معين وخصائص معينة .

الأسلوب الثاني : للبحث الميداني ( العينات ) :
تعريف العينات : نختار جزء من المجتمع لأخذ عينات وعمل البحث .
مزاياه :
1- توفير الوقت والجهد .
2- يوفر عليك عملة الإتلاف .وتعمل على جزء معين .
عيوبه :
1.عدم دقة النتائج . ( قد يكون لديك 3 ألاف طالب وأنت تعمل البحث على 100 طالب , فالمعلومات هنا قد لا تكون دقيقة ) .
2. قد لا تكون نهائية.

الإشكال البيانية أو العرض الهندسي للبيانات
من أجل إعطاء فكرة واضحة و دقيقة و سريعة عن البيانات المبوبة فأنها تعرض بهيئة رسوم بيانية و أشكال هندسية متعددة و بشكل عام سوف نخصص المحور الأفقي أ, الأحداث السيني للتكرارات(Y- axis) لفئات المتغير بينما نخصص المحور العمودي ( X- axis )
و دائما بيداء تقسيم المحورين من الصفر.
1- المدرج التكراري Histogram : و هو عبارة عن مستطيلات قاعدة كل منها تمثل طول الفئة في التوزيع التكراري و ارتفاع كل منها تمثل القيمة التكرارية المقابلة لتلك الفئة ولرسم المدرج التكراري نتبع الخطوات التالية.
أ – رسم المحور الأفقي X و المحور العمودي Y
ب- تدرج المحور الأفقي إلى أقسام متساوية بحيث يشمل جميع الحدود للفئات و يفضل ترك مسافة صغيرة بين نقطة الصفر و الحد الأدنى للفئة الأولى ( فيما إذا كانت بداية الفئة الأولى لا تساوي صفر) و يقسم المحور العمودي إلى أقسام متساوية بحيث تشمل على أكبر التكرارات .
ج ـ يرسم على كل فئة مستطيلا رأسياَ تمثل قاعدته طول الفئة و ارتفاعه تمثل تكرار الفئة.

2- المضلع التكراري Frequency Polygon
هو خط بياني لتكرار الفئة المقابلة لمركز الفئة و لرسم المضلع التكراري يجب استخراج مراكز الفئات كما يمكن رسمه من خلال توصيل القواعد العليا للمستطيلات المكونة للمدرج التكرار

3- المنحنى التكراري Frequency Curve
هو عبارة عن منحني يمر بمعظم النقاط الواقعة على مراكز الفئات و التي ارتفاعها يمثل التكرارات . و هناك نوعان من المنحنى التكراري
أ- المنحنى التكراري المتجمع الصاعد: لغرض تحديد عدا النوع من التوزيعات يجب تحديد المتغيرات العشوائية ثم تحديد الحدود العليا للفئات و بعد ذلك يتم تعين النقاط التي إحداثياتها أزواج القيم للحدود العليا للفئات و التكرارات المتجمعة الصاعدة.
ب ـ منحنى التوزيعات التكرارية المتجمعة النازلة: يتم في هذا النوع من التوزيعات و عند رسم المنحنى التكراري المتجمع النازل تحديد الحدود الدنيا للفئات و بعد ذلك تحدد النقاط التي تمثل أزواج القيم للحدود الدنيا للفئات و التكرارات المتجمعة النازلة
الفصـــل الثاني
مقاييس النزعة المركزية
Central Tendency measurement
مقدمة
في كثير من النواحي التطبيقية يكون الباحث في حاجة إلى حساب بعض المؤشرات التي يمكن الاعتماد عليها في وصف الظاهرة من حيث القيمة التي تتوسط القيم أو تنزع إليها القيم ، ومن حيث التعرف على مدى تجانس القيم التي يأخذها المتغير، وأيضا ما إذا كان هناك قيم شاذة أم لا . والاعتماد على العرض البياني وحدة لا يكفى ، ولذا يتناول هذا الفصل، والذي يليه عرض بعض المقاييس الإحصائية التي يمكن من خلالها التعرف على خصائص الظاهرة محل البحث، وكذلك إمكانية مقارنة ظاهرتين أو أكثر ، ومن أهم هذه المقاييس ، مقاييس النزعة المركزية والتشتت .

مقاييس النزعة المركزية
تسمى مقاييس النزعة المركزية بمقاييس الموضع أو المتوسطات ، وهى القيم التي تتركز القيم حولها ، ومن هذه المقاييس ، الوسط الحسابي ، والمنوال ، والوسيط ، والوسط التوافقي وفيما يلي عرض لأهم هذه المقاييس


1- الوسط الحسابي Arithmetic Mean
من أهم مقاييس النزعة المركزية ، وأكثرها استخداما في النواحي التطبيقية ، ويمكن حسابه للبيانات المبوبة وغير المبوبة ، كما يلي :

أولا: الوسط الحسابي للبيانات غير المبوبة
يعرف الوسط الحسابي بشكل عام على أنه مجموع القيم مقسوما على عددها . فإذا كان لدينا n من القيم ، ويرمز لها بالرمز : .
فإن الوسط الحسابي لهذه القيم ، ونرمز له بالرمز يحسب بالمعادلة التالية :

حيث يدل الرمز على المجموع .

مثـال
فيما يلي درجات 8 طلاب في مادة الإحصاء .

34 32 42 37 35 40 36 40

والمطلوب إيجاد الوسط الحسابي لدرجة الطالب في الامتحان .

الحـل
لإيجاد الوسط الحسابي للدرجات تطبق المعادلة رقم (3-1) كما يلي:



أي أن الوسط الحسابي لدرجة الطالب في اختبار مادة الإحصاء يساوي 37 درجة

ثانيا: الوسط الحسابي للبيانات المبوبة
من المعلوم أن القيم الأصلية ، لا يمكن معرفتها من جدول التوزيع التكراري ، حيث أن هذه القيم موضوعة في شكل فئات ، ولذا يتم التعبير عن كل قيمة من القيم التي تقع داخل حدود الفئة بمركز هذه الفئة ، ومن ثم يؤخذ في الاعتبار أن مركز الفئة هو القيمة التقديرية لكل مفردة تقع في هذه الفئة.
فإذا كانت k هي عدد الفئات ، وكانت هي مراكز هذه الفئات، هي التكرارات ، فإن الوسط الحسابي يحسب بالمعادلة التالية:




مثـال
الجدول التالي يعرض توزيع 40 تلميذ حسب أوزانهم .

فئات الوزن 32-34 34-36 36-38 38-40 40-42 42-44
عدد التلاميذ 4 7 13 10 5 1

والمطلوب إيجاد الوسط الحسابي.
الحــل
لحساب الوسط الحسابي باستخدام المعادلة رقم (3-2) يتم إتباع الخطوات التالية :
1- إيجاد مجموع التكرارات . 2- حساب مراكز الفئات .
3- ضرب مركز الفئة في التكرار المناظر له ، وحساب المجموع
4- حساب الوسط الحسابي بتطبيق المعادلة رقم (3-2) .


مراكز الفئات

التكرارات

فئات الوزن
(C )
4 33=132
(32+34) 2=33
4 32-34
7 36=252
36 7 35-37
13 39=507
39 13 38-40
10 42=420
42 10 41-43
5 45=225
45 5 44-46
1 48=48
48 1 47-49
1584 40 المجموع

إذا الوسط الحسابي لوزن التلميذ هو :

أي أن متوسط وزن التلميذ يساوي 39.6 k.g


2- الوسيط Median
هو أحد مقاييس النزعة المركزية، والذي يأخذ في الاعتبار رتب القيم ، ويعرف الوسيط بأنه القيمة التي يقل عنها نصف عدد القيم ، ويزيد عنها النصف الآخر ، أي أن 50% من القيم أقل منه، 50% من القيم أعلى منه. وفيما يلي كيفية حساب الوسيط في حالة البيانات غير مبوبة ، والبيانات المبوبة.

أولا: الوسيط للبيانات غير المبوبة
لبيان كيف يمكن حساب الوسيط للبيانات غير المبوبة ، نتبع الخطوات التالية:
• ترتب القيم تصاعديا .
• تحديد رتبة الوسيط، وهي : رتبة الوسيط =
• إذا كان عدد القيم (n) فردي فإن الوسيط هو:




• إذا كان عدد القيم زوجي، فإن الوسيط يقع بين القيمة رقم ، والقيمة رقم ، ومن ثم يحسب الوسيط بتطبيق المعادلة التالي:



مثـال
تم تقسيم قطعة أرض زراعية إلى 17 وحدة تجريبية متشابهة ، وتم زراعتها بمحصول القمح ، وتم استخدام نوعين من التسميد هما : النوع (a) وجرب على 7 وحدات تجريبية ، والنوع (b) وجرب على 10 وحدات تجريبية ، وبعد انتهاء الموسم الزراعي ، تم تسجيل إنتاجية الوحدة بالطن / هكتار ، وكانت على النحو التالي :

1.5 2.3 3 2 3.25 2.75 1.2 النوع (a)
3 2.5 4 1.5 2.5 2 3.75 3.5 1.8 4.5 النوع (b)

والمطلوب حساب وسيط الإنتاج لكل نوع من السماد المستخدم، ثم قارن بينها.

الحـل
أولا : حساب وسيط الإنتاج للنوع الأول (a)
• ترتيب القيم تصاعديا :


• عدد القيم فردى
• إذا رتبة الوسيط هي: .
• ويكون الوسيط هو القيمة رقم 4 ، أي أن وسيط الإنتاج للنوع a هو:
طن / هكتار
ثانيا : حساب وسيط الإنتاج للنوع الثاني (b) :
• ترتيب القيم تصاعديا .


• عدد القيم زوجي إذا
• رتبة الوسيط هي : .
• الوسيط = الوسط الحسابي للقيمتين الواقعتين في المنتصف (رقم 5 ،6 ) .
طن / هكتار
وبمقارنة النوعين من السماد ، نجد أن وسيط إنتاجية النوع (a) أقل من وسيط إنتاجية النوع (b) ، أي أن : .

ثانيا: الوسيط للبيانات المبوبة
لحساب الوسيط من بيانات مبوبة في جدول توزيع تكراري ، يتم إتباع الخطوات التالية .
• تكوين الجدول التكراري المتجمع الصاعد .
• تحديد رتبة الوسيط :

• ويحسب الوسيط ، بتطبيق المعادلة .













حيث أن :
: هي الحد الأدنى للفئة الوسيطية المقابلة لأكبر تكرار.
: طول الفئة الوسيطية
: تكرار الفئة الوسيطية.
: التكرار المتجمع الصاعد السابق للفئة الوسيطية

-3المنوال Mode
يعرف المنوال بأنه القيمة الأكثر شيوعا أو تكرارا ، ويكثر استخدامه في حالة البيانات الوصفية ، لمعرفة النمط ( المستوى ) الشائع، ويمكن حسابه للبيانات المبوبة وغير المبوبة كما يلي:

أولا: حساب المنوال في حالة البيانات غير المبوبة



ثانيا: حساب المنوال في حالة البيانات المبوبة.





حيث أن :
Lk : الحد الأدنى لفئة المنوال المقابلة لأكبر تكرار.
: تكرار الفئة المنوالية
: التكرار السابق للفئة المنوالية
: التكرار اللاحق للفئة المنوالية
: طول فئة المنوال

4- الوسط التوافقي Harmonic mean
هو مقلوب الوسط الحسابي لمقلوب القيم و يتم حسابه وفق الصيغة التالية:

أولا: حساب الوسط التوافقي في حالة البيانات غير المبوبة



مثال: أوجد الوسط التوافقي للبيانات التالية:

2 , 5 , 3 , 4 , 7 , 8 , 8




ثانيا: حساب الوسط التوافقي في حالة البيانات المبوبة
الوسط التوافقي لمراكز الفئات X1, X2,… ,Xn والمرجح بالتكرارات المناظرة
f1,f2,…,fn يكون







































الفصل الثالث
مقاييس التشتت أو الاختلاف
Dispersion Measurements
مقدمة
عند مقارنة مجموعتين من البيانات ، يمكن استخدام شكل التوزيع التكراري، أو المنحنى التكراري ، وكذلك بعض مقاييس النزعة المركزية ، مثل الوسط الحسابي والوسيط ، والمنوال ، والإحصاءات الترتيبية ، ولكن استخدام هذه الطرق وحدها لا يكفي عند المقارنة ، فقد يكون مقياس النزعة المركزية للمجموعتين متساوي ، وربما يوجد اختلاف كبير بين المجموعتين من حيث مدى تقارب وتباعد البيانات من بعضها البعض ، أو مدى تباعد أو تقارب القيم عن مقياس النزعة المركزية .
ومثال على ذلك ، إذا كان لدينا مجموعتين من الطلاب ، وكان درجات المجموعتين كالتالي :

88 67 85 81 78 70 63 المجموعة الأولى
77 74 75 78 77 78 73 المجموعة الثانية

لو قمنا بحساب الوسط الحسابي لكل مجموعة ، نجد أن الوسط الحسابي لكل منهما يساوي 76 درجة ، ومع ذلك درجات المجموعة الثانية أكثر تجانسا من درجات المجموعة الأولى . من أجل ذلك لجأ الإحصائيون إلى استخدام مقاييس أخرى لقياس مدى تجانس البيانات، أو مدى انتشار البيانات حول مقياس النزعة المركزية، ويمكن استخدامها في المقارنة بين مجموعتين أو أكثر من البيانات، ومن هذه المقاييس ، مقاييس التشتت ، والالتواء ، و التفرطح ، وسوف نركز في هذا الفصل على مقاييس التشتت .

مقاييس التشتت Dispersion Measurements
من هذه المقاييس: المدى ، الانحراف المتوسط ، والانحراف المعياري ، والتباين
1- المدى Rang: هو أبسط مقاييس التشتت ، ويحسب المدى في حالة البيانات غير المبوبة بتطبيق المعادلة التالية .
R = XL - Xs
وأما المدى في حالة البيانات المبوبة له أكثر من صيغة، ومنها المعادلة التالية:

المدى = (الحد الأعلى للفئة الأخيرة) – (الحد الأدنى للفئة الأولى )


مثـال
الجدول التكراري التالي يبين توزيع 60 مزرعة حسب المساحة المنزرعة بالذرة بالألف دونم .

45-50 39-44 33-38 27-32 21-26 15-20 المساحة
3 12 18 15 9 3 عدد المزارع

والمطلوب حساب المدى للمساحة المنزرعة بالذرة .

الحـل
المدى = (الحد الأعلى للفئة الأخيرة) – (الحد الأدنى للفئة الأولى )
المدى = 50 – 15 = 35 دونم R = 50 – 15 = 35

2- الانحراف المتوسط Mean Deviation (MD)
هو أحد مقاييس التشتت، ويعرف بأنه مجموعة الانحرافات المطلقة لقيم المتغير العشوائي عن نقطة اختيارية ( A ) مقسومة على عدد القيم و غالبا ما يأخذ القيمة ( A ) أحد مقاييس النزعة المركزية الثلاثة ( الوسط الحسابي ، الوسيط ، المنوال ) ، فإن الانحراف المتوسط (MD) يحسب بتطبيق المعادلة التالية:



وهذه الصيغة تستخدم في حالة البيانات غير المبوبة .
مثـال:
إذا كانت الطاقة التصديرية لخمس محطات لتحليه المياه بالمليون متر مكعب كما يلي:
4 , 5 , 2 , 10 , 7
أوجد قيمة الانحراف المتوسط للطاقة التصديرية بالاعتماد على
1- الوسط الحسابي
2- الوسيط





الحـل
لحساب قيمة الانحراف المتوسط يتم استخدام المعادلة أعلى
1- الوسط الحسابي :

ويتم تكوين الجدول التالي :


الانحرافات المطلقة

لانحرافات

الانحرافات المطلقة

الانحرافات

الطاقة التصديرية


1 4-5= -1 1.6 4 - 5.6 = -1.6 4
0 5-5 = 0 0.6 5 - 5.6 = -0.6 5
3 2-5 = -3 3.6 2 - 5.6 = -3.6 2
5 10-5 = 5 4.4 10 - 5.6 = 4.4 10
2 7-5= 2 1.4 7 - 5.6 = 1.4 7
11 11.6 0 Sum

• إذا الانحراف المتوسط بالاعتماد على الوسط الحسابي قيمته هي :
(مليون متر مكعب)
2- إيجاد الانحراف المتوسط بالاعتماد على الوسيط
Me = 5


وفي حالة البيانات المبوبة، يحسب الانحراف المتوسط باستخدام المعادلة التالية .



حيث أن هو تكرار الفئة ، هو مركز الفئة ، A هو أما الوسط الحسابي أو الوسيط أو المنوال .

مثـال:
يبين الجدول التكراري التالي توزيع40 أسرة حسب الإنفاق الشهري بالألف الدولارات .
18 – 21 14 – 17 10 - 13 6 - 9 2 - 5 الإنفاق
8 10 13 8 1 عدد الأسرة
أوجد الانحراف المتوسط بالاعتماد على ( الوسط الحسابي (







الحـــــل
لحساب الانحراف المتوسط ، يتم تطبيق المعادلة الخاصة بالانحراف المتوسط في حالة البيانات المبوبة، ويتبع الآتي
• تكوين جدول لحساب مكونات المعادلة:


الوسط الحسابي


مركز الفئة
عدد الأسر
حدود الإنفاق
9.6 9.6 3.5 3.5 1 2 - 5
44.8 5.6 60 7.5 8 6 - 9
20.8 1.6 149.5 11.5 13 10 - 13
24 2.4 155 15.5 10 14 – 17
51.2 6.4 156 19.5 8 18 – 21
150.4 524 40 sum

إذا الانحراف المتوسط هو :


3- التباين Variance
هو أحد مقاييس التشتت ، وأكثرها استخداما في النواحي التطبيقية ، ويعبر عن متوسط مربعات انحرافات القيم عن وسطها الحسابي. ويحسب التباين من بيانات العينة كتقدير لتباين المجتمع ، فإذا كانت قراءات عينة عشوائية حجمها n هي ، ، فإن تباين العينة ويرمز له بالرمزs2 هو:



حيث أن هو الوسط الحسابي لقراءات العينة ، أي أن : ، وتباين العينة
4- الانحراف المعياري Standard Deviation
عند استخدام التباين كمقياس من مقاييس التشتت، نجد أنه يعتمد علي مجموع مربعات الانحرافات، ومن ثم لا يتمشى هذا المقياس مع وحدات قياس المتغير محل الدراسة ، من أجل ذلك لجأ الإحصائيين إلى مقياس منطقي يأخذ في الاعتبار الجذر ألتربيعي للتباين ، لكي يناسب وحدات قياس المتغير، وهذا المقياس هو الانحراف المعياري.
إذا الانحراف المعياري ، هو الجذر ألتربيعي الموجب للتباين ، أي أن:




مقاييس التشتت النسبية Relative measures of dispersion
قد يتطلب الأمر في بعض الأحيان إجراء مقارنة بين تشتت مجموعتين أو أكثر من القيم المختلفة من حيث الوسط الحسابي أو أن قيم مفردات كل مجموعة مقاسه بوحدات قياس تختلف عن الأخر . و عندئذ فان مقاييس التشتت أيا كان سوف لن يكون نافعا لوحده في إجراء مقارنات من هذا النوع ، إنما يستوجب الأمر إيجاد مقياس تشتت أخر أكثر ملائمة لهذه الحالات ، هذا النوع من المقاييس تسمى بمقاييس التشتت النسبي وهي:

1- معامل التشتت المستند إلى الانحراف المتوسط Mean deviation of dispersion coefficient
افرض ان M.D(A) تمثل الانحراف المتوسط المحتسبة على أساس نقطة اختيارية (A) وقد تكون ( الوسط الحسابي أو الوسيط أو المنوال ) عندئذ يعرف معامل التشتت للمتوسط على نحو الأتي:


2- معامل التشتت المستند إلى الانحراف المعياري ( معامل الاختلاف) Coefficient of Variation (C.V)
افرض ان يمثل الوسط الحسابي لمجموعة من القيم ، و أ، (S ) يمثل الانحراف المعياري لها . عندئذ يعرف معامل الاختلاف و الذي نرمز له بالرمز (C.V) على النحو الأتي:


إن معامل الاختلاف يعتبر بحق أفضل معاملات التشتت الأنفة الذكر كونه يعتمد على أفضل مقاييس النزعة المركزية و أفضل مقاييس التشتت . إن هذا المعامل يوضح نسبة حصة كل وحدة من وحدات الوسط الحسابي و الانحراف المعياري و عليه عند إجراء مقارنة بين قيم مجموعتين ثم مقارنة معامل الاختلاف للمجموعة الأولى مع معامل الاختلاف للمجموعة الثانية ، عندئذ يقال عن المجموعة بأنها أكثر تجانسا إذا كان معامل الاختلاف اقل من الأخر.








الفصل الرابع
معامل الارتباط
ِAuto Correlation
لاحظنا في الفصول السابقة الطرق و الأساليب المختلفة في جمع البيانات و تصنيف و تبويب البيانات ، كذلك عملية استخراج بعض المقاييس التي تعطي فكرة أكثر و وضوحا عن تلك البيانات كالمتوسطات و مقاييس التشتت ، إن هذه الطرق و الأساليب استندت على البيانات المجمعة عن متغير واحد فقط سواء كانت هذه البيانات مبوبة في توزيع تكراري أم غير ذلك . وفي أحوال كثير يواجه الباحث حالات تتطلب دراسة متغيرين أو أكثر في آن واحد لبيان طبيعة و نوع العلاقة التي تربط بها هذه المتغيرات ، عليه فان هذا الفصل سوف يخصص لدراسة مقاييس أخرى تحدد درجة و نوع وشكل العلاقة بين متغيرين أو أكثر.

الارتباط الخطي Linear Correlation
أن مفهوم الارتباط الخطي يقترن بحالة وجود متغيرين أو أكثر ترتبط مع البعض بعلاقات خطية معينة على سبيل المثال العلاقة بين طول الشخص و وزنه ، العلاقة بين تحصيل الطالب المتخرج من الكلية و معدل درجاته في الثانوية و مستوى ألمعاشي لأسرته ، العلاقة بين نسبة الشفاء من مرض معين و كمية الجرعة من الدواء المخصص للمريض و عمر المريض. فإذا كان التغير في إحدى المتغيرات يؤثر في تغير متغير أخر أو مجموعة متغيرات أخرى عندئذ يقال أن هذه المتغيرات مرتبطة فيما بينها و إذا كان المتغيرين المرتبطين ( أو مجموعة من المتغيرات المترابطة) يتغيران (تتغير) بنفس الاتجاه أي زيادة أو نقصان في إحداهما تؤدي إلى الزيادة أو النقصان في الأخر ( الأخرى) عندئذ يقال أن الارتباط ما بينهما هو ارتباط موجب ، على سبيل المثال زيادة طول الشخص يتوقع أن يقابلها زيادة في وزنه. انخفاض في دخل الفرد يتوقع عنه انخفاض في إنفاقه على بعض السلع. أما إذا كان المتغيرين المرتبطين ( أ, مجموعة من المتغيرات المرتبطة) يتغيران (تتغير) باتجاه معاكس أي زيادة أ, نقصان في إحداهما تؤدي إلى نقصان (زيادة) في الأخر ( الأخرى)، عندئذ يقال أن الارتباط ما بينهما هو ارتباط سالب على سبيل المثال زيادة سعر الوحدة من سلعة معينة يتوقع إن يؤدي إلى انخفاض في الطلب على تلك السلعة ، انخفاض في درجات الحرارة يتوقع أن ينجم عنه زيادة الطلب على الوقود.
و يقال أن الارتباط بين المتغيرين أو أكثر هو ارتباط تام perfect إذا كان التغير في إحداهما متناسب مع التغير في الأخر على سبيل المثال إن الارتباط بين درجة الحرارة المئوية و درجة الحرارة الفهرنهايتية هو ارتباط تام باعتبار إن التغير في الأول متناسب مع التغير في الثاني. F=(9/5)C+32







الارتباط الخطى البسيط Simple Correlation
إذا كان الغرض من التحليل هو تحديد نوع وقوة العلاقة بين متغيرين ، يستخدم تحليل الارتباط ، وأما إذا كان الغرض هو دراسة وتحليل أثر أحد المتغيرين على الآخر ، يستخدم تحليل الانحدار، وفي هذا الفصل يتم عرض أسلوب تحليل الارتباط الخطي البسيط، أي في حالة افتراض أن العلاقة بين المتغيرين تأخذ الشكل الخطي .
الغرض من تحليل الارتباط الخطى البسيط
الغرض من تحليل الارتباط الخطي البسيط هو تحديد نوع وقوة العلاقة بين متغيرين، ويرمز له في حالة المجتمع بالرمز (رو)، وفي حالة العينة بالرمز ، وحيث أننا في كثير من النواحي التطبيقية نتعامل مع بيانات عينة مسحوبة من المجتمع، سوف نهتم بحساب معامل الارتباط في العينة كتقدير لمعامل الارتباط في المجتمع، ومن التحديد السابق للغرض من معامل الارتباط، نجد أنه يركز على نقطتين هما:

• نوع العلاقة:ـ وتأخذ ثلاث أنواع حسب إشارة معامل الارتباط كما يلي:
1- إذا كانت إشارة معامل الارتباط سالبة (r < 0 ) توجد علاقة عكسية بين المتغيرين، بمعنى أن زيادة أحد المتغيرين يصاحبه انخفاض في المتغير الثاني، والعكس.
2- إذا كانت إشارة معامل الارتباط موجبة(r > 0 ) توجد علاقة طردية بين المتغيرين، بمعنى أن زيادة أحد المتغيرين يصاحبه زيادة في المتغير الثاني، والعكس .
3- إذا كان معامل الارتباط قيمته صفرا ( r = 0 ) دل ذلك على انعدام العلاقة بين المتغيرين.

قوة العلاقة:ـ ويمكن الحكم على قوة العلاقة من حيث درجة قربها أو بعدها عن ، حيث أن قيمة معامل الارتباط تقع في المدى( -1 < r < 1 )، وقد صنف بعض الإحصائيين درجات لقوة العلاقة يمكن تمثيلها على الشكل التالي

درجات قوة معامل الارتباط


1- معامل الارتباط الخطي البسيط Simple Linear Correlation Coefficient
يعرف معامل الارتباط الخطي البسيط بأنه القيمة العددية للعلاقة الخطية بين متغيرين و تحسب من القانون الأتي:




2- معامل الارتباط الجزئي Partial Correlation Coefficient
يلاحظ في بعض الأحيان و جود ارتباط بين متغيرين يعزي جزئيا إلى ارتباط متغير ثالث مرتبط مع كلا المتغيرين . لنفرض إن المتغيرين X1,X2 مرتبطين و هناك متغير أخر X3 مرتبط مع كلا المتغيرين و إننا نرغب في قياس درجة الارتباط بين X1,X2 باستبعاد اثر المتغير الثالث X3 على كلا المتغيرين.إن المعامل الذي يقيس درجة ارتباط متغيرين باستبعاد اثر الثالث يدعى بمعامل الارتباط الجزئي . على سبيل المثال الارتباط بين طول الفرد X1 و وزنه X2 يتأثر بارتباط عمر الفرد X3 مع كل من X1,X2 ، كذلك الارتباط بين دخل الأسرة الشهري X1 و إنفاقها الشهري X2 يتأثر بارتباط عدد أفراد الأسرة X3 مع كل من X1,X2 ، على سبيل المثال عدد السكائر المدخنة X1 يوميا و الإصابة بنوع معين من أمراض الرئة X2 يتأثر بارتباط عمر المدخن X3 و عدد سنوات التدخين X4 مع كل من X1,X2. و يمكن إيجاد قيمة معامل الارتباط الجزئي وفق ما يلي: افرض إن X1,X2,X3 تمثل ثلاثة متغيرات عشوائية بحيث أن المتغيرين X1,X2 مرتبطين و أن X3 مرتبط مع كل من X1,X2 و افرض أن على أساس عينة من المفردات قوامها n تم الحصول على القياسات المتناظرة لهذه المتغيرات
((X1i , X2i , X3i ), i=1,2,3………n) و أن معامل الارتباط البسيط بين متغيرين منهما هو r12 , r13 , r23 عندئذ فان معامل الارتباط الجزئي بين X1,X2 باستبعاد اثر الثالث X3 هو


و في حالة وجود أربعة متغيرات و نرغب في حساب الارتباط الجزئي بين الأول و الثاني باستبعاد اثر الثالث و الرابع فان هذا المعامل هو






3- معامل الارتباط الرتب لسبيرمان Spear mans rank correlation Coefficient
افرض إن X,Y متغيرين من النوع الوصفي و افرض إن البيانات المستحصل عليها من X,y على أساس عينة عشوائية من المفردات قوامها n هي بهيئة صفات غير قابلة للقياس الكمي .
افرض إن (Xi , Yi , i=1,2,3,…..n) ممكنة الترتيب تصاعديا أو تنازليا وفق معيار معين يمتاز به كل متغير ( مثلا تقديرات درجات مجموعة من الطلبة يمكن ترتيبها تصاعديا على أساس معيار الأقل إلى اعلي درجة أو العكس ) عندئذ استنادا لهذا الترتيب و لكل متغير يمكن تخصيص قيم سلسلة الإعداد الطبيعية ( 1,2,3,……,n) لصفات الترتيب بحيث إن كل صفة يخصص لها احد إعداد هذه السلسة ، في حالة عدم تكرار أيه صفة منها (وقد يكون التخصيص تنازلي ) و سوف نوضح حالة التكرار بعض الصفات و أسلوب علاج ذلك في أمثلة. و القانون المستخدم لإيجاد الارتباط لمثل هذه الحالات:



الانحدار الخطي البسيط Simple Linear regression

يعرف الانحدار الخطي البسيط بأنه عملية تقدير العلاقة الخطية بين متغيرين أحداهما مستقل و الأخر تابع . إن مفهوم الانحدار الخطي البسيط يقترن بمفهوم الارتباط الخطي البسيط . و يهدف الانحدار الخطي البسيط إلى تقدير قيم عددية لمعالم النموذج ، أي تقدير قيم عددية لكل من (a,b) و معادلة خط الانحدار البسيط هي كالأتي:






ومن أعلاه نلاحظ بان ،â هي دالة بدلالة قياسات مفردات العينة (Xi,Yi) إن â تمثل في الحقيقة مقطع خط الانحدار مع المحور الصادي Y إي ما نعنيه قيمة Y التقديرية عندما X=0 و إذا كانت 0=â عندئذ يقال إن خط الانحدار يمر من نقطة الأصل (0,0) وان تسمى معامل الانحدار أي مقياس يوضح مقدار تغير Y إذا ما تغيرت X بوحدة واحدة و يلاحظ إن قد تكون موجبة أو سالبة تبعا لقيمة الانحراف المعياري لــX,Y ( Sxy) إذا كانت موجبة أم سالبة فقيمة الموجبة تعني إن العلاقة بين X,Y موجبة و القيمة السالبة لها تعني إن العلاقة سالبة (عكسية) و غالبا ما يقال لما سبق أنة تم تقدير معادلة الانحدار ( Y / X ) أي إيجاد معادلة الانحدار فيها المتغير التابع هو Y و المستقل X و العكس ممكن.