บทที่2

สถิติบรรยาย

สถิติบรรยาย ( Descriptive statistics ) คือ สถิติที่ใช้ในการศึกษาข้อเท็จจริงจากกลุ่มข้อมูลที่รวบรวมมาได้ เพื่อให้ทราบรายละเอียดเกี่ยวกับลักษณะของข้อมูลกลุ่มนั้นโดยไม่ได้สรุปอ้างอิงผลการศึกษาไปยังกลุ่มข้อมูลกลุ่มอื่นหรือสรุปอ้างอิงไปยังประชากรที่ศึกษา การบรรยายสรุปลักษณะของกลุ่มข้อมูลได้แก่ การแจกแจงความถี่ การวัดตำแหน่งการเปรียบเทียบ การวัดแนวโน้มเข้าสู่ส่วนกลางและการกระจายข้อมูล เป็นต้น ดังนั้นในบทนี้จึงได้นำเสนอของสถิติภาคบรรยาย  ดังมีรายละเอียด ดังนี้ 

 1. การแจกแจงความถี่

            การแจกแจงความถี่เป็นการนำข้อมูลที่เป็นค่าของตัวแปรที่เราสนใจมาจัดเรียงตามลำดับความมากน้อย และแบ่งเป็นช่วงเท่าๆกัน จำนวนข้อมูลในแต่ละช่วงคะแนน เรียกว่า ความถี่ ในกรณีที่ความแตกต่างระหว่างคะแนนสูงสุดกับคะแนนต่ำสุดไม่มาก ไม่จำเป็นต้องแบ่งช่วงคะแนนเป็นกลุ่ม ในแต่ละช่วงมี 1 คะแนนก็ได้ การแจกแจงความถี่มีจุดมุ่งหมายเพื่อให้ทราบภาพรวมของการแจกแจงข้อมูลทั้งหมดอย่างเป็นระบบ การจัดระบบและนำเสนอข้อมูลในเบื้องต้น สามารถนำเสนอข้อมูลในรูปของตารางและแผนภูมิ ในที่นี้จะขอแยกเป็น 2 ส่วนในการนำเสนอ คือ ตารางแจกแจงความถี่ และกราฟและแผนภูมิแบบต่างๆ

1.1 ตารางการแจกแจงความถี่

การสร้างตารางการแจกแจงความถี่ ทำได้ 2 แบบ คือ

1) การแจกแจงความถี่ของลักษณะที่สนใจที่เป็นไปได้ทั้งหมด

2) การแจกแจงความถี่สำหรับค่าในแต่ละช่วงของลักษณะที่สนใจ

1) การแจกแจงความถี่ของลักษณะที่สนใจที่เป็นไปได้ทั้งหมด

            การแจกแจงความถี่แบบนี้ใช้กับข้อมูลที่มีจำนวนลักษณะที่เป็นไปได้ทั้งหมดไม่มากนัก เช่น จำแนกตามเพศ คือ ชาย หญิง จำแนกตามระดับการศึกษา  จำแนกตามอาชีพหลัก เป็นต้น ดังตัวอย่างต่อไปนี้

ตัวอย่าง จากการสำรวจนิสิตที่สอบคัดเลือกเข้าคณะครุศาสตร์ ในปีการศึกษา 2544 โดยแจกแจงความถี่ ( นิสิต ) ตามเพศ ได้ดังนี้

 

               เพศ

จำนวนนิสิต ( คน )

ชาย

155

หญิง

174

รวม

329


          2)  การแจกแจงความถี่สำหรับค่าในแต่ละช่วงของลักษณะที่สนใจ

            การแจกแจงความถี่แบบนี้ใช้กับข้อมูลที่มีจำนวนลักษณะที่เป็นไปได้ทั้งหมดจำนวนมาก เช่น ศึกษารายได้ของคนไทยทั้งหมด หรืออายุของคนไทยทั้งหมด เป็นต้น ดังนั้นในการแจกแจงความถี่จึงควรแบ่งข้อมูลทั้งหมดออกเป็นช่วงๆที่ต่อเนื่องกัน โดยแต่ละช่วงประกอบด้วยข้อมูลหลายๆค่า ทำให้ลดจำนวนค่าที่เป็นไปได้ทั้งหมดลง ดังตัวอย่างต่อไปนี้

ตัวอย่าง ถ้าเลือกตัวอย่างนิสิตหญิง มา 100 คน สอบถามความสูงแล้วจัดเป็นช่วง ๆ ได้ 5 ชั้น ดังนี้

 

ความสูงของนิสิตหญิง ( เซ็นติเมตร )

จำนวนนิสิต

135 – 144

145 – 154

155 – 164

165 – 174

175 - 184

5

18

42

27

8

รวม

100

 

การสร้างตารางแจกแจงความถี่สำหรับค่าในแต่ละช่วงของลักษณะที่สนใจมีขั้นตอนในการสร้าง ดังนี้

ขั้นตอนการสร้างตารางแจกแจงความถี่

            1.  หาค่าพิสัยของข้อมูล (R)

                        พิสัย ( Range ) =          ค่าสูงสุด – ค่าต่ำสุด

2.  กำหนดจำนวนชั้น ( k )

k  =  1+3.3 log N

            3.  คำนวณหาความกว้างของชั้น ( Class  interval )

                        I   =  ความกว้างของชั้น  =            พิสัย               =     R

                                                                     จำนวนชั้น                      k

           4.  คำนวณหาขีดจำกัด ( class  limit )

                        ขีดจำกัดล่างของชั้นแรก   =    ค่าต่ำสุด -  ( I x k – R ) / 2

                หรือ ใช้ค่าต่ำสุดเป็นขีดจำกัดบน ของชั้นต่ำสุดของการแจกแจง

           5. คำนวณจุดกึ่งกลางของแต่ละชั้น ( Midpoint )

                            จุดกึ่งกลางชั้น    =  (ขีดจำกัดบน + ขีดจำกัดล่าง) / 2

            6. คำนวณหาขีดจำกัดชั้นที่แท้จริง ( class  boundaries )

                        ขีดจำกัดชั้นที่แท้จริง  =  ( ขีดจำกัดบนของชั้น + ขีดจำกัดล่างของชั้นถัดไป ) / 2

7. นับจำนวนค่าของข้อมูล ( ความถี่ ) ในแต่ละชั้น

เมื่อได้จำนวนแล้วสามารถหาความถี่สะสม ความถี่สัมพัทธ์ และร้อยละโดย

การหาความถี่สะสม จะเริ่มหาผลบวกของความถี่ที่เริ่มจากชั้นแรกบวกไปเรื่อยๆเมื่อถึงชั้นนั้นๆ    

การหาความถี่สัมพัทธ์ หรือสัดส่วน (proportion) ของชั้นใดก็นำความถี่ของชั้นนั้นหารด้วยความถี่ทั้งหมดและเมื่อคูณด้วยร้อยจะเรียกว่าเปอร์เซ็นต์หรือร้อยละ

 

ตัวอย่าง     ถ้าคะแนนสอบของนิสิตที่เรียนวิชาสถิติ  จำนวน  80 คน เป็นดังนี้

68           84           75           82           68           90           62           88           76           93        54          79

73           79           88           73           60           93           71           59           85           75        64          82

61           65           75           87           74           62           95           78           63           72        65          94

96           78           89           61           75           95           60           79           83           71        70          7  9

62           67           97           78           85           76           65           71           75            72        65         80

73           57           88           78           62           76           52           74           77              86        67         73    81      72           63           76           75                85           77            78    

     พิสัย  =  97 –52   =    45

     ต้องการสร้างตารางที่มีจำนวนชั้น  =  8 ชั้น

     ความกว้างของชั้น   =    พิสัย  / จำนวนชั้น

                                     =     45 / 8    =     5.62      6

        

ขีดจำกัดชั้น

ขีดจำกัดที่แท้จริง

จุดกึ่งกลางชั้น

ความถี่

51 – 56

57 – 62

63 – 68

69 – 74

75 – 80

81 – 86

87 – 92

93 - 98

50.5 – 56.5

56.5 – 62.5

62.5 – 68.5

68.5 – 74.5

74.5 – 80.5

80.5 – 86.5

86.5 – 92.5

92.5 – 99.5

53.5

59.5

65.6

71.5

77.5

83.5

89.5

95.5

1

11

11

13

22

9

6

7

รวม

 

 

80

 

 

ตารางแสดงการแจกแจงความถี่สัมพันธ์ของคะแนนสอบ

 

ชั้นที่

ขีดจำกัด

ความถี่

fi

ความถี่สัมพัทธ์

(fi   / S fi  )

ความถี่สะสม

S fi

ร้อยละ

1

2

3

4

5

6

7

8

51 – 56

57 – 62

63 – 68

69 – 74

75 – 80

81 – 86

87 – 92

93 - 99

1

11

11

13

22

9

6

7

1/80  = .0125

11/80 = .1375

11/80 = .1375

13/80  = .1625

22/80 = .275

9/80 = .1125

6/80 = .075

7/80 = .0875

1

12

23

36

58

67

73

80

1.25

13.75

13.75

16.25

27.50

11.25

 7.50

8.75

 

รวม

80

1

 

100.00

1.2 กราฟและแผนภูมิแบบต่างๆ

            การบรรยายหรือนำเสนอข้อมูลด้วยกราฟและแผนภูมิแบบต่างๆ จะทำให้ง่ายต่อการเปรียบเทียบ โดยแบ่งเป็น 4 ประเภทใหญ่ โดยแต่ละประเภทมีลักษณะย่อย ดังนี้ คือ

1)      แผนภูมิแท่ง ( Bar chart )

       - แผนภูมิแท่งเชิงเดี่ยว (Simple Bar chart )

       - แผนภูมิแท่งเชิงซ้อน (Multiple Bar chart )

       2) แผนภูมิวงกลม( Pie chart )

       3) ฮิสโตแกรม (Histogram)

       4) กราฟเส้น

-          กราฟเส้นเชิงเดี่ยว ( Simple Line chart )

-          กราฟเส้นเชิงซ้อน ( Multiple Line chart )

-          รูปหลายเหลี่ยมแห่งความถี่ (Frequency polygon)

-          กราฟความถี่สะสม(Ogive curve)

-          กราฟเส้นโค้ง (Smooth curve)

1)      แผนภูมิแท่ง (Bar Chart)   ประกอบด้วยแท่งรูปสี่เหลี่ยมผืนผ้าที่มีความกว้างเท่ากันทุกแห่ง ส่วนความสูงจะขึ้นอยู่กับขนาดของข้อมูล ถ้าเป็นการเปรียบเทียบข้อมูลเพียงลักษณะเดียว เรียกว่า  แผนภูมิแท่งเชิงเดี่ยว (Simple Bar Chart)  ถ้าเป็นการเปรียบเทียบข้อมูลตั้งแต่ 2 ลักษณะขึ้นไป เรียกว่า แผนภูมิแท่งเชิงซ้อน (Multiple Bar chart )

 

ตัวอย่าง    แผนภูมิแท่งเชิงเดี่ยว เปรียบเทียบจำนวนนักเรียน จำแนกตามโรงเรียนต่างๆ

 

 

 

 

 

 

 

 

 

                                   

แผนภูมิแสดงจำนวนนักเรียนจำแนกตามโรงเรียน

 

ตัวอย่าง  แผนภูมิแท่งเชิงซ้อน  เปรียบเทียบจำนวนนักเรียนจำแนกตามอายุและเพศ

 

 

 

 

 

 

 

 

 


                                                  

แผนภูมิแสดงจำนวนนักเรียนจำแนกตามอายุและเพศ

 

2)      แผนภาพวงกลม (Pie Chart ) เป็นการแสดงข้อมูลในรูปวงกลมโดยแบ่งวงกลมเป็น

ส่วนย่อยๆตามลักษณะสัดส่วนต่างๆโดยให้เนื้อที่ในวงกลม (360 องศา) เป็น ร้อยเปอร์เซ็นต์แล้วเทียบสัดส่วนหรือเปอร์เซ็นต์เป็นองศา

 

 

ตัวอย่าง  แผนภาพวงกลม  เปรียบเทียบจำนวนนักเรียน จำแนกตามโรงเรียนต่างๆ

 

 

 

 

 

 

 

 


                           แผนภาพ  แสดงจำนวนนักเรียนจำแนกตามโรงเรียน

3)  ฮิสโตแกรม (Histogram)  เป็นการนำข้อมูลที่ได้แจกแจงความถี่แล้วในตารางแจกแจง

ความถี่มาแสดงเป็นภาพ ซึ่งประกอบด้วยแท่งสี่เหลี่ยมผืนผ้า โดยแกนนอนแบ่งออกเป็นช่วงๆความกว้างของแต่ละช่วงเท่ากับความกว้างของชั้น  จุดกึ่งกลางของแท่งสี่เหลี่ยมแต่ละแท่งเป็นจุดกึ่งกลางของแต่ละชั้น ความสูงของแท่งสี่เหลี่ยมแต่ละแท่งจะเป็นความถี่ของแต่ละชั้น

 

ตัวอย่าง ฮิสโตแกรม แสดงจำนวนนักเรียนในแต่ละช่วงอายุ

 

                                          

                                         แผนภาพแสดงจำนวนนักเรียนจำแนกตามช่วงอายุ

4) กราฟเส้น  (Line Chart) เป็นการเสนอข้อมูลที่ทำให้เห็นการเปลี่ยนแปลงที่ชัดเจน แบ่งได้

หลายลักษณะ คือ

-          กราฟเส้นเชิงเดี่ยว ( Simple Line chart )

-          กราฟเส้นเชิงซ้อน ( Multiple Line chart )

-          รูปหลายเหลี่ยมแห่งความถี่ (Frequency polygon)

-          กราฟความถี่สะสม(Ogive curve)

-          กราฟเส้นโค้ง (Smooth curve)

(1) กราฟเส้นเชิงเดี่ยว (Simple Line Chart) เป็นกราฟที่แสดงการเปรียบเทียบข้อมูลโดยพิจารณาลักษณะของข้อมูลเพียงลักษณะเดียว เช่น จำนวนครอบครัวที่มีรายได้ต่างๆกัน

 


                            แผนภาพแสดงจำนวนครอบครัวจำแนกตามจำนวนบุตร

(1)               แผนภาพเชิงซ้อน (Multiple Line Chart)

 

 

 

 

 

 

กราฟเส้นแสดงจำนวนครอบครัวจำแนกตามรายได้

 

2) กราฟเส้นเชิงซ้อน ( Multiple Line chart ) เป็นกราฟที่แสดงการเปรียบเทียบข้อมูลโดยพิจารณาลักษณะของข้อมูลตั้งแต่ 2 ลักษณะขึ้นไป  เช่น จำนวนครอบครัวจำแนกตามรายได้และโรงเรียน

 

 

 

 

 

 

 

 

 

 


กราฟเส้นเชิงซ้อนแสดงจำนวนครอบครัวจำแนกตามรายได้และโรงเรียน

(3) รูปหลายเหลี่ยมแห่งความถี่ (Frequency polygon)หรือโพลิกอน เป็นการเสนอข้อมูลให้มีความเด่นชัดขึ้น ซึ่งแสดงโดยลากเส้นตรงเชื่อมต่อระหว่างค่ากึ่งกลางชั้นของฮิสโตแกรม แต่ต้องเพิ่มในฮิสโตแกรมอีก 2 ชั้น คือ ชั้นต่ำสุดและชั้นสูงสุด โดยชั้นที่เพิ่มขึ้นอีก 2 ชั้นมีค่าความถี่เท่ากับ ศูนย์                     

                                          

 

                                                            โพลิกอนอายุของนักเรียน

(4)    กราฟความถี่สะสม (Ogive curve) เป็นการนำเสนอข้อมูลอีกแบบซึ่งแสดงให้ทราบถึงความถี่ที่เกิดขึ้น โดยการหาความถี่สะสม ต้องเริ่มหาผลบวกของความถี่โดยเริ่มตั้งแต่ชั้นแรก

 

 

                       

 

                             กราฟความถี่สะสมจำแนกตามอายุของนักเรียน

(5)    กราฟเส้นโค้ง (Smooth curve) เป็นเส้นโค้งที่เกิดจากการปรับโพลิกอนให้เป็นเส้นโค้งเรียบ โดยพื้นที่ใต้เส้นโค้งเท่ากับพื้นที่ในโพลิกอน

 

                                   

                                  กราฟเส้นโค้งความถี่จำแนกตามอายุของนักเรียน

 

2. การวัดตำแหน่งการเปรียบเทียบ

            เป็นการบอกให้ทราบว่าค่าที่ได้มานั้นมีตำแหน่งอยู่ที่ใด หรือส่วนใดของค่าทั้งหมด เป็นการแสดงให้เห็นความสัมพันธ์ระหว่างค่าที่ได้กับข้อมูลทั้งหมด เช่น ครูผู้สอนต้องการแสดงให้เห็นว่าส่วนสูงของนักเรียนก.มีความสัมพันธ์กับส่วนสูงของเพื่อนในชั้นอย่างไร การที่จะบอกว่า นักเรียน ก.สูง 160 ซม. นั้นไม่ได้สื่อความหมายอย่างไร จึงต้องใช้การวัดตำแหน่งการเปรียบเทียบ

ได้แก่

1)  เปอร์เซ็นต์ไทล์ ( Percentile )

ค่าเปอร์เซ็นต์ไทล์ P หมายถึง ค่าของข้อมูลที่มีจำนวนข้อมูลที่มีค่าต่ำกว่า อยู่ P %  และมีจำนวนข้อมูลที่มีค่ามากกว่าอยู่ ( 100- P) %

ตำแหน่งเปอร์เซนไทล์ P หมายถึง ตำแหน่งที่บอกให้ทราบว่ามีข้อมูลอยู่ Pส่วนในร้อยส่วนที่มีค่าของข้อมูลต่ำกว่าค่าของข้อมูล ณ ตำแหน่ง P

การหาเปอร์เซ็นต์ไทล์

การหาเปอร์เซ็นต์ไทล์สำหรับข้อมูลที่ไม่ได้จัดกลุ่ม    มีขั้นตอน ดังนี้

1. เรียงลำดับข้อมูล n ค่าจากน้อยไปมาก

2. คำนวณหาตำแหน่ง P ( n + 1 ) ถ้าผลลัพธ์เป็นเลขไม่ลงตัวให้ปัดเป็นเลขจำนวนเต็มที่มีค่าใกล้เคียงมากที่สุด                                         100

 

ตัวอย่าง  จงหาเปอร์เซ็นต์ไทล์ที่  68  ของข้อมูลต่อไปนี้

            6.3       6.6       7.6       3.0       9.5       5.9       6.1       5.0       3.6

 

เรียงลำดับข้อมูล 9 ค่าจากน้อยไปมาก ดังนี้

                        3.0                   3.6       5.0       5.9       6.1       6.3       6.6       7.6       9.5

            คำนวณหาตำแหน่ง 68 ( 9 + 1 )       =   6.8   »  7

                                                   100

            ค่าเปอร์เซ็นต์ไทล์ที่  68  ของข้อมูล      =   6.6

 

การหาเปอร์เซ็นต์ไทล์สำหรับข้อมูลที่แจกแจงความถี่  มีสูตรในการคำนวณ ดังนี้

                        Pr     =   L +   I   [ n x r    -   Sfi  ]   /  fr

                              100

เมื่อ L      =     ขีดจำกัดล่างของอันตรภาคชั้นที่มี Pr  อยู่

       I       =      ความกว้างของอันตรภาคชั้น

       r       =     ตำแหน่งเปอร์เซ็นต์ไทล์ที่ต้องการหา

      n       =     จำนวนข้อมูลทั้งหมด

                             Sfi        =     ความถี่สะสมของอันตรภาคชั้นที่ต่ำกว่า L

                                                    fr          =     ความถี่ของชั้น L

ก่อนที่จำนำสูตรนี้ไปหาจะต้องทราบก่อนว่า Pr  ควรจะอยู่อันตรภาคชั้นใด โดยเปรียบเทียบ ค่า n x r                                               

กับความถี่สะสม                                                                                                                           100

          

ตัวอย่าง  การคำนวณหาเปอร์เซ็นต์ไทล์สำหรับข้อมูลที่แจกแจงความถี่

จงหาเปอร์เซ็นต์ไทล์ที่ 20และ 80ของข้อมูลความสูงของนักเรียนที่กำหนดไว้ในตารางแจกแจงความถี่ ดังนี้

 

ขีดจำกัดที่แท้จริงของชั้น

ความถี่ ( f )

ความถี่สะสม (S f )

134.5-144.5

144.5-154.5

154.5-164.5

164.5-174.5

174.5-184.5

5

18

42

27

8

5

23

65

92

100

รวม

100

 

 

จากความถี่สะสมชั้นที่ 2 มี  S f = 23 ดังนั้น เปอร์เซ็นต์ไทล์ที่ 20 จะอยู่ในชั้นที่ 2

 

การหาเปอร์เซ็นต์ไทล์ที่ 20 ได้  L =  144.5   I = 10   r = 20  n = 100 Sfi  = 5   fr   = 18

    P20  =                L +   I   [ n x 20    -   Sfi  ]   /  fr

                              100

                   =            144.5 + 10 ( 100 x 20    -   5  ]   /  18

                                     100

                    =              144.5+ 8.33          =   152.83

ส่วนเปอร์เซ็นต์ไทล์ที่ 80  จากความถี่สะสมชั้นที่ 4 มี  S f = 92 ดังนั้น เปอร์เซ็นต์ที่ 80 จะอยู่ในชั้นที่ 4ได้  L =  164.5   I = 10   r = 80  n = 100 Sfi   = 65   fr   = 27

    P 80 =                L +   I   [ n x 80    -   Sfi  ]   /  fr

                                  100

                   =            164.5 + 10  [ ( 100 x 80    -  65  ]   /  27

                                         100

                    =              164.5+ 5.55          =   170.05

 

2)      ควอไทล์ (Quartiles )  

ควอไทล์เป็นการแบ่งข้อมูลออกเป็น 4 ส่วนเท่าๆกัน ส่วนละ 25 %โดยเรียงลำดับ

ข้อมูลจากน้อยไปมาก ดังนั้น

ค่าควอไทล์1(Q1) หมายถึงค่าของข้อมูลที่มีจำนวนข้อมูลที่มีค่าต่ำกว่า Q1อยู่ 25 % 

ค่าควอไทล์2(Q2) หมายถึงค่าของข้อมูลที่มีจำนวนข้อมูลที่มีค่าต่ำกว่า Q2อยู่ 50 %

และมีจำนวนข้อมูลที่มีค่ามากกว่า Q2อยู่ 50 %

ค่าควอไทล์3(Q3) หมายถึงค่าของข้อมูลที่มีจำนวนข้อมูลที่มีค่าต่ำกว่า Q3อยู่ 75 % 

และมีจำนวนข้อมูลที่มีค่ามากกว่า Q3อยู่ 25 %

  ตำแหน่งควอไทล์ หมายถึง ตำแหน่งที่บอกให้ทราบว่ามีข้อมูลอยู่ Xส่วนในสี่ส่วน

ที่มีค่าของข้อมูลต่ำกว่าค่าของข้อมูล ณ ตำแหน่ง X

การคำนวณหาควอไทล์สำหรับข้อมูลที่ไม่ได้จัดกลุ่ม

-          เรียงลำดับข้อมูล n ค่า จากน้อยไปหามาก

-          สำหรับการคำนวณหาค่า Q1 ให้คำนวณ (n+1)/4  ถ้าผลลัพธ์เป็นเลขไม่ลงตัวให้ปัดให้เป็นเลขจำนวนเต็มที่มีค่าใกล้เคียงมากที่สุด

ส่วนการหาค่า Q3ให้คำนวณหา 3 (n+1)/4  และปัดให้เป็นเลขจำนวนเต็มที่ใกล้เคียงมากที่สุด

สำหรับการหาควอไทล์ สำหรับข้อมูลที่แจกแจงความถี่  มีสูตรในการคำนวณ ดังนี้

                       

                                         QK     =   L +   I   [ n x k    -   Sfi  ]   /  fk             

                                                                         4

เมื่อ L      =     ขีดจำกัดล่างของอันตรภาคชั้นที่มี QK อยู่

       I       =      ความกว้างของอันตรภาคชั้น

       k      =     ตำแหน่งควอไทล์ที่ต้องการหา

      n       =     จำนวนข้อมูลทั้งหมด

                             Sfi      =     ความถี่สะสมของอันตรภาคชั้นที่ต่ำกว่า L

                                                    fk           =     ความถี่ของชั้น L

พิสัยควอไทล์  คือความแตกต่างระหว่างควอไทล์บน (Q3)และควอไทล์ล่าง (Q1)

 

ตัวอย่าง จงหา  ควอไทล์บน (Q3) ค่ามัธยฐาน และควอไทล์ล่าง (Q1) ของคะแนนเฉลี่ยวิชาภาษาไทยของนักเรียน 22 คน ดังนี้

45  50  65  23  55  48  78  89  96  85  74  42  45  75  78  41  56  66  77  88  95 78

เนื่องจาก n = 22 คน     เรียงข้อมูลจากน้อยไปมากได้ดังนี้

23   41   42  45  45   48  50  55  56  65  66  74  75 77  78  78   78  85   88  89   95  96

การหา Q3  คำนวณหาค่า  3 (n+1)/4 = 17.25  ปัดเป็น 17 

ดังนั้นค่าควอไทล์บนจะเป็นค่าของข้อมูลตัวที่ 17 ที่เรียงลำดับไว้แล้ว คือ 78

การหาค่ามัธยฐาน ( Q2) คำนวณหาค่า  2 (n+1)/4 = 11.5  ปัดเป็น 12 

ดังนั้นค่ามัธยฐาน จะเป็นค่าของข้อมูลตัวที่ 12 ที่เรียงลำดับไว้แล้ว คือ 74

การหา Q1  คำนวณหาค่า   (n+1)/4 = 5.75  ปัดเป็น 6 

ดังนั้นค่าควอไทล์ล่างจะเป็นค่าของข้อมูลตัวที่ 6 ที่เรียงลำดับไว้แล้ว คือ 48

3)      เดไซล์ (Deciles )  

เดไซล์ เป็นการแบ่งข้อมูลอออกเป็น 10 ส่วนเท่าๆกัน มีจำนวน 9 ค่า คือ D,

D2…D9   โดยที่ k = 1 ,2, 3,  … 9 

  ตำแหน่งเดไซล์ หมายถึง ตำแหน่งที่บอกให้ทราบว่ามีข้อมูลอยู่ Xส่วนในสิบส่วน

ที่มีค่าของข้อมูลต่ำกว่าค่าของข้อมูล ณ ตำแหน่ง X

การคำนวณหาเดไซล์ สำหรับข้อมูลที่ไม่ได้จัดกลุ่ม

-          เรียงลำดับข้อมูล n ค่า จากน้อยไปหามาก

-          สำหรับการคำนวณหาค่า Dk ให้คำนวณ k(n+1)/10 ถ้าผลลัพธ์เป็นเลขไม่ลงตัวให้ปัดให้เป็นเลขจำนวนเต็มที่มีค่าใกล้เคียงมากที่สุด

  ส่วนการหา Dk สำหรับข้อมูลที่แจกแจงความถี่  มีสูตรในการคำนวณ ดังนี้

                          Dk =   L +   I   [ n x k    -   Sfi  ]   /  fk             

                                                         10

เมื่อ L      =     ขีดจำกัดล่างของอันตรภาคชั้นที่มี Dk อยู่

       I       =      ความกว้างของอันตรภาคชั้น

       k       =     ตำแหน่งเดไทล์ที่ต้องการหา

      n        =     จำนวนข้อมูลทั้งหมด

                             Sfi      =      ความถี่สะสมของอันตรภาคชั้นที่ต่ำกว่า L

                                                    fk            =     ความถี่ของชั้น L

 

3. การวัดแนวโน้มเข้าสู่ส่วนกลาง ( Central Tendency )

    การวัดแนวโน้มเข้าสู่ส่วนกลาง เป็นการคำนวณค่ากลางของข้อมูลว่าอยู่ที่ใด การศึกษาใน

กรณีที่ต้องการค่าเพียงค่าเดียวเพื่อใช้อธิบายข้อมูลทั้งชุด จึงนิยมหาค่ากลางๆที่เป็นตัวแทนของข้อมูลทั้งชุด นั่นคือ ค่าเฉลี่ยเลขคณิต (Mean) มัธยฐาน (Median)และฐานนิยม(Mode) โดยมีวิธีการหาได้ ดังนี้

            3.1 ค่าเฉลี่ยเลขคณิตหรือมัชฌิมเลขคณิต (Mean)  คือค่าที่ได้จากผลรวมของคะแนนหรือค่าที่ได้ทั้งหมดหารด้วยจำนวนนักเรียนหรือจำนวนข้อมูล การคำนวณหาค่าแบ่งเป็น

            . การหาค่าเฉลี่ยเลขคณิตสำหรับข้อมูลที่ไม่ได้จัดกลุ่ม

                        ค่าเฉลี่ยเลขคณิตประชากร m   =    SCi    / N  =  ( C1 + C2 + … + Cn ) / N

                        ค่าเฉลี่ยตัวอย่าง  = C  =   SCi    / n  =   ( C1 + C2 + … + Cn ) / n

           

              .  การหาค่าเฉลี่ยเลขคณิตสำหรับข้อมูลที่จัดกลุ่ม

                        m     =    SCifi    / N 

                         C   =   SCifi    / n    

                 โดยที่   n  =  ขนาดตัวอย่าง ,  fi = ความถี่ของอันตรภาคชั้นที่ i

            ข้อดีของค่าเฉลี่ย

1.        การเปรียบเทียบข้อมูลเชิงปริมาณหลายๆชุด นิยมใช้ค่าเฉลี่ยในการเปรียบเทียบ

2.        สะดวกในการคำนวณถึงแม้จะเก็บข้อมูลได้ไม่ครบ

            ข้อเสียของค่าเฉลี่ย

1.      ใช้กับข้อมูลเชิงปริมาณเท่านั้น

2.      ค่าเฉลี่ยจะไม่ใช่ค่ากลางที่ดี ถ้ามีค่าผิดปกติไปมาก (ค่าที่สูงเกินไปมากๆ หรือค่าที่ต่ำเกินไปมากๆ)

3.2 ค่ามัธยฐาน  ( Median ) คือค่าในตำแหน่งที่แบ่งข้อมูลออกเป็นสองส่วนเท่าๆกัน คือ

มากกว่ามัธยฐาน50% น้อยกว่ามัธยฐาน 50%  หรือคือค่าในตำแหน่งกึ่งกลางของการแจกแจง ดังนั้นค่ามัธยฐานก็คือ ค่าของข้อมูล ณ ตำแหน่งที่ (n+1)/2 เมื่อเรียงลำดับข้อมูลแล้ว

            ในกรณีที่จำนวนข้อมูลเป็นเลขคี่ มัธยฐานคือค่าของข้อมูลที่อยู่กึ่งกลาง แต่ถ้าจำนวนข้อมูลเป็นเลขคู่ มัธยฐานจะเท่ากับค่าเฉลี่ยของ 2 จำนวนที่อยู่ตรงกลาง เช่น

              10  13  15  16  18  19   20   ค่ามัธยฐานคือ 16

              11  12   12  13  15  15  18  19    ค่ามัธยฐานคือ (13+15) / 2  =  14

            ในกรณีที่ข้อมูลจัดกลุ่มแล้ว

                        Median  =      L  +  ( n/2 – CF )    .   I

                                                            fm

                                                L  =  ขีดจำกัดล่างของชั้นที่มี Median  อยู่

                           n   =  จำนวนข้อมูลทั้งหมด

                          CF = ความถี่สะสมของชั้นที่ต่ำกว่าชั้นที่มี Median  อยู่ 1 ชั้น

                         fm   = ความถี่ของชั้นที่มี Median  อยู่

                        I   = ช่วงของอันตรภาคชั้น

ข้อดีของค่ามัธยฐาน

                         ค่ามัธยฐานจะไม่ถูกกระทบกระเทือนเมื่อมีข้อมูลที่มีค่าสูงหรือต่ำผิดปกติ

            ข้อเสียของค่ามัธยฐาน

ไม่ได้นำค่าของข้อมูลทุกตัวมาคิดคำนวณ

 

3.3 ฐานนิยม ( Mode )  คือค่าที่เกิดขึ้นบ่อยที่สุดในจำนวนชุดของข้อมูลทั้งหมด

สำหรับข้อมูลที่ไม่ได้จัดกลุ่ม ค่าฐานนิยมก็คือค่าที่มีความถี่ของค่านั้นซ้ำกันมากที่สุด

            สำหรับข้อมูลที่จัดกลุ่มแล้ว  ค่าฐานนิยม คำนวณได้จากสูตร

                        ฐานนิยม   =   Mode   =  Lo   +   (    fm  -  f1     )     . I

                                                                  ( fm – f1 ) +  ( fm – f2 )

 

                           Lo =  ขีดจำกัดล่างของชั้นที่มี Mode อยู่

                           fm   = ความถี่ของชั้นที่มี Mode อยู่

                           f1    = ความถี่ของชั้นที่ต่ำกว่าชั้นที่มี Mode อยู่ 1 ชั้น

                           f2    = ความถี่ของชั้นที่สูงกว่าชั้นที่มี Mode อยู่ 1 ชั้น

                           I   = ช่วงของอันตรภาคชั้น

             ข้อดีของค่าฐานนิยม

1.    จะไม่ถูกกระทบกระเทือนเมื่อมีข้อมูลที่มีค่าสูงหรือต่ำผิดปกติ

2.   เป็นค่ากลางที่ใช้วัดข้อมูลเชิงคุณภาพและเชิงปริมาณ

            ข้อเสียของค่าฐานนิยม

1.      ในกรณีที่ไม่มีค่าของข้อมูลที่ซ้ำกัน จะไม่มีค่าฐานนิยม

2.      กรณีที่ข้อมูลจัดกลุ่มแล้ว ฐานนิยมจะเปลี่ยนไปถ้าการจำแนกชั้นเปลี่ยนไป

3.      ข้อมูลบางชุดอาจมีฐานนิยมมากกว่า 1 ค่าโดยที่ฐานนิยมนั้นอาจแตกต่างกันมาก

ตัวอย่าง สำหรับข้อมูลที่ไม่ได้จัดกลุ่ม

            จงหาค่าเฉลี่ยเลขคณิต ค่ามัธยฐาน และค่าฐานนิยม ของน้ำหนักของนักเรียนชั้นประถมศึกษาปีที่ 1 จำนวน 10 คนหน่วยเป็นกิโลกรัม ดังนี้             20   22  23  23  25  26  27  28  29  30    

ค่าเฉลี่ยตัวอย่าง  =  ( C1 + C2 + … + Cn ) / n

                                 =   (20+22+23+23+25+26+27+28+29+30 ) / 10

                         =    25.3            กิโลกรัม

            ค่ามัธยฐาน            =    25+26 / 2

                                    =    25.5   

            ค่าฐานนิยม           =     23

              

ตัวอย่าง สำหรับข้อมูลที่จัดกลุ่มแล้ว

จงหาค่าเฉลี่ยเลขคณิต ค่ามัธยฐาน และค่าฐานนิยม ของความสูงของนักเรียนชายชั้นมัธยมศึกษาปีที่5 ซึ่งอยู่ในรูปของตารางแจกแจงความถี่

 

ขอบเขตจำกัดชั้น

ความสูง : ซม.

จำนวนนักเรียน

fi

ค่ากึ่งกลางชั้น

Ci

 

Cifi

134.5-144.5

144.5-154.5

154.5-164.5

164.5-174.5

174.5-184.5

5

18

42

27

8

139.5

149.5

159.5

169.5

179.5

657.5

2,691.0

6,699.0

4,576.0

1,436.0

รวม

100

 

16,100.0

 

 

หาค่าเฉลี่ย

                                                           C   =   SCifi    / n

                                                 = 16,100/100

             ความสูงเฉลี่ย                = 161  ซม.

 

หาค่ามัธยฐาน   

 

ขีดจำกัดชั้นที่แท้จริง

ความสูง : ซม.

ค่ากึ่งกลางชั้น

Ci

จำนวนนักเรียน

fi

ความถี่สะสม

Sfi

134.5-144.5

144.5-154.5

154.5-164.5

164.5-174.5

174.5-184.5

139.5

149.5

159.5

169.5

179.5

5

18

42

27

8

5

23

65

92

100

รวม

 

100

 

 

ชั้นที่มีความถี่สะสมมากกว่า 50 คือ ชั้นที่ 3  ดังนั้นมัธยฐานอยู่ชั้นที่ 3

                           Median  =      L  +  ( n/2 – CF )    .   I

                                                            fm

                                        =    154.5+(50-23) . 10

                                                             42

                                         =      154.5+6.43     =   160.93     ซม.

               หาค่าฐานนิยม

ฐานนิยม   =   Mode   =  Lo   +    (   fm  -  f1   )      . I

                                                                  ( fm – f1 ) +  ( fm – f2 )

Lo = 154.5 เนื่องจากชั้นที่ 3 มีความถี่สูงสุด คือ 42

                        fm  =     42             f1   =    18     f2    =   27

                         Mode   =      154.5 +   (  42 – 1 8)    .10

                                  (42-18)+(42-27)

            =  154.5+6.15            = 160.65      ซม.

ความสัมพันธ์ระหว่างค่ากลางทั้งสามชนิด

                        ค่ากลางทั้ง 3 ชนิดมีความสัมพันธ์กัน ดังนี้

                        .  การแจกแจงของข้อมูลมีลักษณะสมมาตร  ( Symmetry )

                        ในกรณีที่ข้อมูลมีลักษณะสมมาตร  คือข้อมูลที่เบี่ยงเบนจากค่ากลางไปในทางบวกและทางลบพอๆกัน จะมีค่าเฉลี่ย ค่ามัธยฐาน และค่าฐานนิยมเท่ากัน

                    

 

 

 

 


Mean

Median

Mode

ข.      การแจกแจงของข้อมูลมีลักษณะเบ้ขวา  ( Skew  to  the  Right )

ข้อมูลที่มีลักษณะเบ้ขวา เป็นข้อมูลที่ส่วนใหญ่มีค่าน้อย จะได้ความสัมพันธ์ดังนี้ 

ค่าเฉลี่ย > มัธยฐาน > ฐานนิยม

 

 

 

 

 


                                Mode         Mean

                                                Median

.  การแจกแจงของข้อมูลมีลักษณะเบ้ซ้าย ( Skew  to  the  Left )

ข้อมูลที่มีลักษณะเบ้ซ้าย เป็นข้อมูลที่ส่วนใหญ่มีค่ามาก จะได้ความสัมพันธ์ดังนี้ 

ฐานนิยม > มัธยฐาน > ค่าเฉลี่ย

 

 

 

 

 


                                              Mean        Mode

                                                  Median

          การเลือกค่าที่ใช้วัดค่ากลาง

                        จะพิจารณาจากการกระจายของข้อมูล ดังนี้

                        1. ข้อมูลมีลักษณะสมมาตร จะใช้ ค่าเฉลี่ย    ฐานนิยม   มัธยฐาน ค่าใดค่าหนึ่งเป็นตัววัดค่ากลาง เนื่องจากค่าทั้ง 3 เท่ากัน

                        2. ข้อมูลมีลักษณะไม่สมมาตร กรณีที่ข้อมูลเบ้ซ้ายหรือเบ้ขวา จะใช้ค่ามัธยฐานเป็นค่าวัดตำแหน่งกลาง

 

4. การวัดการกระจาย ( Measure  of  Variation )

            การพิจารณาหรือสรุปลักษณะของข้อมูลโดยใช้ค่ากลางหรือค่าเฉลี่ยเพียงอย่างเดียว อาจทำให้ไม่ทราบถึงลักษณะของข้อมูลได้ชัดเจน เนื่องจากข้อมูลที่มีค่ากลางเท่ากันแต่ลักษณะของข้อมูลต่างกัน นั่นคือมีการกระจายของข้อมูลไม่เหมือนกัน ดังนั้นในการเปรียบเทียบข้อมูลหลายๆชุด ควรจะพิจารณาค่าเฉลี่ยและการและการกระจายของข้อมูลควบคู่ไป การวัดการกระจายที่นิยมใช้ในการศึกษา ได้แก่ พิสัย  ส่วนเบี่ยงเบนควอไทล์  ส่วนเบี่ยงเบนมาตรฐาน  ความแปรปรวน สัมประสิทธิ์ความแปรผัน

4.1 พิสัย ( Range ) เป็นวิธีการวัดการกระจายที่ง่ายที่สุด  โดยที่

            พิสัย        =         ค่าสูงสุด – ค่าต่ำสุด

ตัวอย่าง จงหาค่าพิสัยของข้อมูล 3  5  8  12  17  19  22 

                        ค่าพิสัย    =         22-3 = 19

 

4.2 ส่วนเบี่ยงเบนควอไทล์  (Quatile Deviation , Q.D ) คือครึ่งหนึ่งของระยะห่างระหว่างควอไทล์ที่ 3 กับควอไทล์ที่ 1  เมื่อข้อมูลมีการกระจายน้อย  ส่วนเบี่ยงเบนควอไทล์ มีค่าน้อย   เมื่อข้อมูลมีการกระจายมาก   ส่วนเบี่ยงเบนควอไทล์ มีค่ามาก           คำนวณได้จากสูตร

                      Q.D     =           Q 3 – Q 1

                                                                                                                2

4.3 ค่าความแปรปรวน  (Variance,s2) เป็นค่าที่นิยมใช้วัดการกระจายมากที่สุด โดยพิจารณาจากผลรวมของค่าแตกต่างระหว่างค่าของข้อมูลแต่ละค่ากับค่าเฉลี่ยเลขคณิตยกกำลังสองแล้วหารด้วย N

ค่าความแปรปรวน    =   s2  =  S (   Ci     -  m ) 2       

N                                             

 

 

 

4.4 ค่าเบี่ยงเบนมาตรฐาน ( Standard  Deviation : SD )  เป็นค่าที่วัดการกระจายของข้อมูล

ที่ทำให้ทราบว่าคะแนนแต่ละจำนวนนั้นมีค่าแตกต่างจากค่าเฉลี่ยมากน้อยเพียงใด  ค่าเบี่ยงเบน

มาตรฐานจะน้อย ถ้าข้อมูลมีค่าใกล้เคียงกับค่าเฉลี่ย และจะมีค่ามากถ้าข้อมูลมีค่าแตกต่างไปจาก

ค่าเฉลี่ยมาก ค่าเบี่ยงเบนมาตรฐาน คือ รากที่สองของค่าความแปรปรวน

 


                        s   =  Ö S (   Ci     -  m ) 2     /  N

 

 

ตัวอย่าง   จงหาค่าความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานของความสูงของนักเรียน

 

ขีดจำกัดชั้นแท้จริง

ความสูง : ซม.

ค่ากึ่งกลางชั้น

Ci

จำนวนนักเรียน

fi

ความถี่สะสม

Sfi

Xi- µ

  (Xi- µ)2

 

fI(Xi- µ)

fI(Xi- µ)2

134.5-144.5

144.5-154.5

154.5-164.5

164.5-174.5

174.5-184.5

139.5

149.5

159.5

169.5

179.5

5

18

42

27

8

5

23

65

92

100

-21.5

-11.5

-1.5

8.5

18.5

462.25

132.25

2.25

729

64

-107.5

-207

-63

229.5

148

2,311.25

2,380.5

94.5

19,683

512

รวม

 

100

 

 

1,389.75

0

24,981.25

 

จากข้อมูลที่กล่าวมาแล้ว m                      =                161     เซนติเมตร

 

ความแปรปรวนของความสูงของนักเรียนชาย  =    S f (   Ci     -  m ) 2            

                                                                                      N

                                                                 =     24,981.25

                                                                        100

                                                                 =     249.8125      ซม2

 


ส่วนเบี่ยงเบนมาตรฐาน                                    =    Ö 249.8125

     =    15.80         ซม.

 

ในการวัดความแปรปรวน และส่วนเบี่ยงเบนมาตรฐาน ของกลุ่มตัวอย่าง สูตรในการคำนวณค่าความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานมีความแตกต่างจากกลุ่มประชากรเล็กน้อย เนื่องจากค่าเฉลี่ยที่ใช้คำนวณของกลุ่มตัวอย่าง เป็นค่าประมาณพารามิเตอร์ที่เป็นค่าเฉลี่ยของประชากร  ดังนั้นองศาของความเป็นอิสระ*จะลดลงเท่ากับจำนวนพารามิเตอร์ที่ต้องประมาณค่า ในที่นี้เท่ากับ 1  สูตรการคำนวณค่าความแปร

ปรวนและส่วนเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่าง  คือ

 

ค่าความแปรปรวน       S2                        =     S (   Ci     -  C ) 2       

                                                                         n-1                                             

 


             ค่าเบี่ยงเบนมาตรฐาน    S.D       =   Ö    S (   Ci     -  C ) 2     /  n-1

 

*องศาของความเป็นอิสระ คือ จำนวนค่าของตัวแปรที่สามารถผันแปรได้โดยไม่มีข้อจำกัด มีค่าเท่ากับจำนวนค่าของตัวแปรทั้งหมดลบด้วยจำนวนพารามิเตอร์ที่ต้องประมาณค่า ในการคำนวณหาค่าสถิติตัวนั้น

 

4.5 สัมประสิทธิ์ความแปรผัน  ( Coefficient  of  Variation : C.V. ) เป็นค่าที่ใช้วัดการกระจายของข้อมูลที่ไม่มีหน่วย ซึ่งต่างจากค่าสถิติตัวอื่นที่ใช้วัดการกระจาย ซึ่งมีหน่วยเป็นหน่วยเดียวกับหน่วยของข้อมูล ค่าสัมประสิทธิ์ความแปรผัน คือค่าเบี่ยงเบนมาตรฐานหารด้วยค่าเฉลี่ย

                        CV   ของประชากร         =            s

                                                                                            m

                      CV   ของตัวอย่าง           =         SD

                                                                        X

 

การวิเคราะห์ด้วยสถิติแบบบรรยายโดยใช้โปรแกรม  SPSS for Windows

วิธีการวิเคราะห์ด้วยสถิติแบบบรรยาย

การวิเคราะห์ข้อมูลเบื้องต้นด้วยสถิติแบบบรรยายโดยใช้โปรแกรม  SPSS for Windows ประกอบด้วย  ตารางแสดงความถี่ของข้อมูล  ค่ากลาง  ค่าการกระจายของข้อมูล  รวมทั้งกราฟ ที่จะนำเสนอข้อมูล  คำสั่งที่ใช้ในการหาค่าสถิติแบบบรรยาย มี 3  คำสั่ง  คือ  Frequencies   Descriptives  และ  Means

 

1. คำสั่ง Frequencies

1.1  การคำนวณสถิติเบื้องต้นโดยใช้คำสั่ง  Frequencies

            Analyze

                  Descriptive Statistics

                            Frequencies…         จะได้หน้าจอดังรูปที่  1

 


 รูปที่ 1 หน้าจอการกำหนด Frequencies dialog box

 

เมื่อเลือกตัวแปรที่ต้องการบรรยายลักษณะ และตารางแสดงความถี่ แล้ว

1.2  เลือก    Statistics….   จะได้หน้าจอดังรูปที่ 2

 

รูปที่ 2 หน้าจอการกำหนด Frequency : Statistics


                        เลือก  เปอร์เซ็นต์ไทล์ (Percentile  Values )  ค่ากลางของข้อมูล ( Central  Tendency ) สถิติที่วัดการกระจาย ( Dispersion )  และสถิติที่วัดการแจกแจง ( Distribution ) แล้วกลับไปหน้าจอเดิม  รูปที่  1  เลือก      OK        เปิดแฟ้ม   output  จะได้ผลลัพธ์  ดังนี้

                                     ตารางที่  1  ตัวอย่างของผลลัพธ์ของสถิติแบบบรรยาย

Statistics

 

N

 

Std.

 

 

 

 

 

Valid

Missing

Mean

Deviation

Skewness

Kurtosis

 

Statistic

Statistic

Statistic

Std.Error

Statistic

Statistic

Std.Error

Statistic

Std.Error

income of  respondent

90

0

19801.00

989.70

9389.09

.467

.254

.146

.503

 

            จาก  ผลลัพธ์  ตารางที่ 1  ได้ค่าเฉลี่ย     ( Mean )    ส่วนเบี่ยงเบนมาตรฐาน     ( SD )      ค่าความเบ้ ( sknewness )  และ  ค่าความโด่ง ( kurtosis )  โดยมีค่าความเบ้มากกว่า  0  แสดงว่าเส้นโค้งเบ้ขวา  และค่าความโด่งมากกว่า  0  แสดงว่าข้อมูลมีการแจกแจงค่อนข้างป้าน  นอกจากนี้ยังสามารถเลือก     Charts    ในรูปที่  1  จะได้หน้าจอในรูปที่  3


รูปที่  3  หน้าจอการกำหนด Frequencies   Chart

-  เลือก   ¤    Histogram ( s )  และ 4  With  normal  curve

-   เลือก   Continue    จะกลับมาที่รูปที่  1  เลือก     OK   จะได้   histogram  ซึ่งอยู่ใน  output  ดังนี้

 

จากผลลัพธ์ในตารางที่  1  สามารถนำเสนอข้อมูลในการวิจัย  ได้ดังนี้

 

รายได้ของผู้รับผิดชอบครอบครัว

ค่าเฉลี่ย                  ส่วนเบี่ยงเบนมาตรฐาน           ความเบ้             ความโด่ง          

                     1980.1                          9389.09                        .467                 .146                                                       

                                       2.  คำสั่ง  Descriptive

2.1  การหาค่าสถิติเบื้องต้นโดยใช้คำสั่ง   Descriptives

            Analyze

             Descriptives   Statistics                        ได้หน้าจอรูป 4

              Descriptives


รูปที่ 4 หน้าจอการกำหนด Descriptive

           

            เลือกตัวแปรที่ต้องการค่าสถิติแบบบรรยายใส่ใน  variable ( s) box  เลือก  save   standardized  values  as   variables  ในกรณีที่ต้องการค่ามาตรฐานของตัวแปร

                                    2.2  เลือก    Options      จะได้หน้าจอดังรูปที่  5

 


รูปที่  5 หน้าจอการกำหนด  Descriptive:Option

 

            เลือกค่าสถิติแบบบรรยายที่ต้องการ  แล้วเลือก    continue     จะกลับไปหน้าจอ  ดังรูปที่4  เลือก     OK   จะได้ผลลัพธ์ตามตารางที่  2

ตารางที่  2  ตัวอย่างของผลลัพธ์

Descriptive    Statistics

 

N

Minimum

Maximum

Mean

Std.Deviation

Variance

income  of

respondent

Valid  N

(listwise )

90

 

90

3500

48900

19801.00

9389.09

8.8E+07

 

                        จากตารางที่  2  จะได้ค่าต่ำสุด ( Minimum )  ค่าสูงสุด  ( Maximum ) ค่าเฉลี่ย  (Mean )  ค่าส่วนเบี่ยงเบนมาตรฐาน ( SD )  และค่าความแปรปรวน ( variance )

3. คำสั่ง  Means

-          ใช้เมื่อต้องการหาค่าเฉลี่ยและค่าเบี่ยงเบนมาตรฐานของตัวแปรเชิงปริมาณแยกตามตัวแปรคุณภาพ เช่น  หารายจ่ายแยกตามอาชีพ เป็นต้น

3.1 ใช้คำสั่ง

                                    Analyze

                                           Compare   Means

                                                            Means….         จะได้หน้าจอดังรูปที่  6

 


                   รูปที่ 6 หน้าจอการกำหนด  Means dialog box

                       

            เลือกตัวแปรเชิงปริมาณที่ต้องการหาค่าเฉลี่ยใส่ในช่อง  Dependent    List  :  และเลือกตัวแปรคุณภาพที่ต้องการแยกกลุ่มตัวแปรปริมาณใส่ในช่อง  Independent    List

 


3.2 เลือก    Options…    จะได้หน้าจอดังรูปที่  7

 

รูปที่ 7 หน้าจอการกำหนด  Means options

            เลือกสถิติในส่วนของ  statistics  เลือก   continue    จะกลับไปหน้าจอรูปที่  6  เลือก  OK  จะได้ผลลัพธ์แสดงในตารางที่ 3

 

ตารางที่  3:  Total   Expense * Occupation  of   Respondent

          Total   Expense

   government                         Mean

   officer                                 Std. Deviation

13415.00

7102.8517

   business                              Mean

   employee                            Std. Deviation           

18465.33

6118.8204

   worker                                Mean

                                              Std. Deviation

6762.6667

3648.8129

   commerce                           Mean

                                              Std. Deviation

16853.91

5698.3560

   Total                                   Mean

                                             Std. Deviation

14868.56

7155.4228

                       

  จากตารางที่ 3  แสดงค่าเฉลี่ยเบี่ยงเบนมาตรฐาน ของค่าใช้จ่าย (ตัวแปรปริมาณ )  จำแนกตาม อาชีพ  ( ตัวแปรคุณภาพ )  ซึ่งนำมาสร้างตารางในการนำเสนอข้อมูลในการวิจัยได้ดังนี้

 

อาชีพ

ค่าใช้จ่าย

ค่าเฉลี่ย

ส่วนเบี่ยงเบนมาตรฐาน

รับราชการ

ประกอบธุรกิจ

รับจ้าง

ค้าขาย

13,415.00

18,465.33

6762.66

16853.91

7102.85

6118.82

3648.81

5698.35

รวม

14868.56

7155.42

 

          สรุป ในบทนี้ได้กล่าวถึงสถิติบรรยายสรุปลักษณะของกลุ่มข้อมูล ได้แก่ การแจกแจงความถี่ การวัดตำแหน่งการเปรียบเทียบ การวัดแนวโน้มเข้าสู่ส่วนกลางและการกระจายข้อมูลประกอบกับการวิเคราะห์ข้อมูล เกี่ยวกับสถิติบรรยายโดยใช้โปรแกรมSPSS for Windows  ส่วนการวิเคราะห์โดยใช้สถิติอ้างอิงจะกล่าวในบทต่อไป

 

แบบฝึกหัด  

จงคำนวณด้วยมือก่อนแล้วเปรียบเทียบผลการคำนวณด้วยโปรแกรมคอมพิวเตอร์

1. จงหาค่าพิสัย  ค่าความแปรปรวน และค่าเบี่ยงเบนมาตรฐาน ของข้อมูลต่อไปนี้

                        2          1          7          6          5          3          8          5          2

                        4          5          6          3          4          4          6          9          4

                        3          4          5          5          7          3          5

2. จากข้อมูลต่อไปนี้

                        18        16        16        16        14        18        16        18        14        19

                        15        19        9         20        10        10        12        14        18        12

                        14        14        17        12        18        13        15        13        15        19

1) จงหาค่าควอไทล์ล่าง มัธยฐาน และควอไทล์บน  พร้อมทั้งอธิบายความหมาย

2) จงหาเปอร์เซนต์ไทล์ที่ 90

3. จากการสุ่มตัวอย่างยอดขายเพิ่มขึ้นรายปีของบริษัทแห่งหนึ่งในอดีตมา 8 ปี  ได้ข้อมูลดังนี้

            13.6 %             25.5 % 43.6 % - 19.8 %  -  13.8 %       12.0 % 36.3 %             14.3 %

1) ยอดขายที่เพิ่มขึ้น โดยเฉลี่ยต่อปีของบริษัทข้างต้น

2) ค่าเบี่ยงเบนมาตรฐานของยอดขายที่เพิ่มขึ้น

3) พิสัยควอไทล์

4. จากการสุ่มตัวอย่างสถาบันการศึกษาเพื่อเก็บข้อมูลของจำนวนนิสิตต่ออาจารย์ของปีปัจจุบัน ได้คำตอบ

ดังนี้

            7.2       6.9       6.6       7.3       7.4       6.7       6.8       6.9       7.2       6.4

            1)  จงหาค่าเฉลี่ยตัวอย่าง                        2)  จงหาค่ามัธยฐานตัวอย่าง

5. ถ้าสมาคมนักกีฬาแห่งประเทศไทยได้เก็บรวบรวมข้อมูลเกี่ยวกับเงินที่มีผู้บริจาคดังนี้

เงินบริจาค ( บาท )

จำนวนคน

0 – 400

400 – 800

800 – 1,200

1,200 – 1,600

1,600 – 2,000

2

6

12

6

4

            1)  จงเขียนฮิสโตแกรม                            2)  จงหาความถี่สัมพันธ์

            3)  จงหาความถี่สะสม                            4)  จงหาค่าเฉลี่ย ค่าเบี่ยงเบนมาตรฐาน ค่ามัธยฐาน

5)  จงหาค่าพิสัยควอไทล์

6. จากตารางแจกแจงความถี่ของค่าแรงรายวันของนักการภารโรง  65 คน จงหา

 

ค่าแรง/วัน

จำนวนคนงาน

70-79

80-89

90-99

100-109

110-119

120-129

130-139

8

10

16

14

10

5

2

 

1)      ค่ากลางของชั้นที่3  (90-99)

2)      ขีดจำกัดล่างของชั้นที่5 และขีดจำกัดบนของชั้นที่ 6

3)      ขอบเขตจำกัดของชั้นที่5

4)      ความกว้างของชั้นที่4

5)      ความถี่สัมพัทธ์ของชั้นที่3

6)      เปอร์เซ็นต์ของคนงานที่ได้ค่าแรงรายวันน้อยกว่า 80บาท

7)      เปอร์เซ็นต์ของคนงานที่ได้ค่าแรงรายวันในช่วง 60-99.99

 

7.  จากข้อมูลคะแนนสอบวิชาภาษาไทยของนักเรียนห้องหนึ่งมีดังนี้

77  53  59  85  64  67 59  48  74  78  54  51  53  56  62  61  67

69  75  76  84  87  89  94  95  96  92 93  48  80  55  74  73  70

1)      จงสร้างตารางแจกแจงความถี่ ความถี่สัมพันธ์ และความถี่สะสม

2)      จงหาค่าควอไทล์ล่าง มัธยฐาน และควอไทล์บน พร้อมอธิบายความหมาย

3)      จงหาเปอร์เซนต์ไทล์ที่ 90 พร้อมอธิบายความหมาย

4)      จงหาค่าเฉลี่ย ความแปรปรวน ส่วนเบี่ยงเบนมาตรฐาน  ค่าฐานนิยม

8. ถ้านายศักดาต้องตัดสินใจเลือกซื้อหุ้นบริษัทใดบริษัทหนึ่ง จาก 3 บริษัทที่มีอัตราปันผล ดังนี้

บริษัท ก  เงินปันผลเฉลี่ยเท่ากับ 15.6% ต่อปีและค่าเบี่ยงเบนมาตรฐานเป็น 3.7%

บริษัท ข  เงินปันผลเฉลี่ยเท่ากับ 13.7% ต่อปีและค่าเบี่ยงเบนมาตรฐานเป็น 2.5%

บริษัท ค  เงินปันผลเฉลี่ยเท่ากับ 18.9% ต่อปีและค่าเบี่ยงเบนมาตรฐานเป็น 5.8%

ถ้าท่านเป็นนายศักดาท่านจะตัดสินใจลงทุนซื้อหุ้นบริษัทใด

9.จากข้อมูลรายได้ต่อเดือนของครอบครัวนักเรียน ในจังหวัดเชียงใหม่ มีดังนี้

 

รายได้ต่อเดือนของครอบครัว(บาท/เดือน)

              ความถี่สัมพันธ์

10,000-15,000

15,001-20,000

20,001-25,000

25,001-30,000

30,001-35,000

35,001-40,000

40,001-45,000

.20

.18

.14

.12

.14

.14

.08

จงหา

1)      รายได้เฉลี่ยต่อเดือนต่อครอบครัวนักเรียน ในจังหวัดเชียงใหม่

2)       ค่าเบี่ยงเบนมาตรฐานต่อเดือนต่อครอบครัวนักเรียน ในจังหวัดเชียงใหม่

3)       ค่ามัธยฐานของรายได้ต่อเดือนต่อครอบครัวนักเรียน ในจังหวัดเชียงใหม่