บทที่ 2

การวิเคราะห์การถดถอยเชิงเดี่ยว

(Simple Regression Analysis)

 

2.1    ความหมายของการถดถอย (The Meaning of Regression)

 

การถดถอย (Regression) หมายถึง การศึกษาเกี่ยวกับความสัมพันธ์ระหว่างตัวแปรตัวหนึ่งที่เรียกว่าตัวแปรถูกอธิบาย (Explained Variable) หรือตัวแปรตาม (Dependent Variable) และอีกตัวแปรหนึ่งหรือมากกว่าหนึ่งตัวแปรที่เรียกว่าตัวแปรอิสระ (Independent Variable) หรือตัวแปรอธิบาย (Explanatory Variable) เช่นนักเศรษฐศาสตร์สนใจที่จะศึกษาความสัมพันธ์ระหว่างปริมาณความต้องการเสนอซื้อสินค้ากับราคาของสินค้านั้นและระดับรายได้ของผู้บริโภค หรือสนใจศึกษาว่าปริมาณการขายสินค้าจะมีความสัมพันธ์กับรายจ่ายในการโฆษณาสินค้าอย่างไร เป็นต้น

เป้าหมายของการถดถอย คือ

1.       เพื่อประมาณค่าเฉลี่ยของตัวแปรตามเมื่อกำหนดค่าของตัวแปรอิสระมาให้

2.       เพื่อทดสอบสมมติฐานเกี่ยวกับธรรมชาติของตัวแปร โดยมีสมมติฐานภายใต้ทฤษฎีทางเศรษฐศาสตร์

3.       เพื่อพยากรณ์ หรือทำนายค่าเฉลี่ยของตัวแปรตาม เมื่อกำหนดค่าของตัวแปรอิสระมาให้

                สำหรับการถดถอยเชิงเดี่ยว หมายถึง การศึกษาความสัมพันธ์ระหว่างตัวแปรอิสระเพียงหนึ่งตัวกับตัวแปรตามหนึ่งตัว

 

2.2    แนวคิดของฟังก์ชันการถดถอยของประชากร  (The Concept of Population Regression Function: PRF)

 

โดยปกติแล้วค่าสังเกตของตัวแปรตาม  จะมีลักษณะผันแปรค่าไปตามธรรมชาติ แต่สิ่งที่สนใจและต้องการทราบคือ การที่  มีค่าที่เป็นอยู่หรือผันแปรไปได้นั้นมีสาเหตุมาจากอะไร โดยมีสมมติฐานเบื้องต้นว่า ถ้าหากทราบสาเหตุหรือตัวแปรอธิบาย  ที่อธิบายการเคลื่อนไหวของ  แล้วจะทำให้สามารถทราบค่าของ  ในอดีต ปัจจุบัน และในอนาคตได้ ดังนั้นรูปแบบของความสัมพันธ์ของ  ที่ถูกกำหนดด้วย  ในทางคณิตศาสตร์คือ  โดยค่าของ  เรียกว่า ค่าคาดหมายอย่างมีเงื่อนไข (Conditional Expected Values) (ซึ่งเงื่อนไขดังกล่าวก็คือ) หรือค่าเฉลี่ยของตัวแปรตาม  ที่ขึ้นอยู่กับค่าของตัวแปรอิสระ  กำหนดให้สัญลักษณ์ของค่าคาดหมายของ  อย่างมีเงื่อนไขที่ขึ้นอยู่กับ  คือ  อ่านว่า ค่าคาดหมายของ  เมื่อกำหนดค่าของตัวแปร   มาให้ พิจารณาข้อมูลตัวอย่างในตาราง 2.2 ซึ่งแสดงถึงปริมาณความต้องการซื้อสินค้า ณ ราคาต่างๆ

 

ตาราง 2.2 ความต้องการซื้อสินค้า ณ ราคาต่างๆ

ราคา

ปริมาณความต้องการเสนอซื้อ

จำนวนของผู้บริโภค

ความต้องการโดยเฉลี่ย

10

45, 46, 47, 48, 49, 50, 51

7

48

20

44, 45, 46, 47, 48

5

46

30

40, 42, 44, 46, 48

5

44

40

35, 38, 42, 44, 46, 47

6

42

50

36, 39, 40, 42, 43

5

40

60

32, 35, 37, 38, 39, 42, 43

7

38

70

32, 34, 36, 38, 40

5

36

80

31, 32, 33, 34, 35, 36, 37

7

34

90

28, 30, 32, 34, 36

5

32

100

29, 30, 31

3

30

 

รวม

35

 

 

จากข้อมูลในตาราง 2.2 จะเห็นได้ว่า ณ ราคา 10 บาท มีผู้ซื้อทั้งหมด 7 คน โดยปริมาณที่ซื้ออยู่ในช่วง 45 – 51 ชิ้น ดังนั้นโดยเฉลี่ยแล้วปริมาณที่ผู้บริโภคทั้ง 7 คนซื้อคือ 48 ชิ้น เช่นเดียวกัน ณ ราคา 70 บาท มีผู้ซื้อทั้งหมด 5 คน ปริมาณที่ซื้ออยู่ในช่วง 32 – 40 ชิ้น หรือโดยเฉลี่ย ณ ราคา 70 บาทจะซื้อคนละ 36 ชิ้น เมื่อนำความสัมพันธ์ที่ได้มาลงจุดในแผนภาพการกระจาย (Scatter Diagram) โดยให้แกนตั้งคือปริมาณที่ซื้อ แกนนอนคือ ราคาของสินค้า จะได้ดังรูปที่ 2.3

 

รูป 2.3 แผนภาพการกระจายจากข้อมูลตารางที่ 2.2

 

จากรูป 2.3 จะเห็นได้ว่า ณ ค่าราคาสินค้า  ที่กำหนดมาให้ เช่น = 10 จะมีค่า  ที่สอดคล้องอยู่ 7 ค่า หรือถ้า = 40 จะมีค่า  ที่สอดคล้องอยู่ 6 ค่า นอกจากนี้จากแผนภาพการกระจายยังแสดงให้เห็นถึงความสัมพันธ์เชิงเส้นตรงในทิศทางตรงกันข้ามกันระหว่างราคาสินค้าและปริมาณสินค้าที่ซื้อโดยเฉลี่ย โดยค่าเฉลี่ยดังกล่าวนี้เรียกว่า ค่าคาดหมายของประชากร (Expected Population) หรือค่าเฉลี่ยของประชากร (Population Mean) หรือค่าเฉลี่ยประชากรของ  (Population Average Value of ) ดังนั้นเมื่อลากเส้นตรงเส้นหนึ่งให้ผ่านค่าเฉลี่ยของข้อมูลปริมาณการซื้อที่สอดคล้องกับราคาสินค้า เส้นตรงนี้เรียกว่า เส้นการถดถอยของประชากร (Population Regression Line) สรุปค่าเฉลี่ยหรือค่าคาดหมายอย่างมีเงื่อนไขของ  จึงเป็นฟังก์ชันของตัวแปร  เขียนเป็นสัญลักษณ์คือ

                                                 (2.2.1)

เมื่อ  คือ ฟังก์ชันของตัวแปร  สมการ 2.2.1 จึงเรียกว่า ฟังก์ชันค่าคาดหมายอย่างมีเงื่อนไข (Conditional Expectation Function: CEF) หรือฟังก์ชันการถดถอยของประชากร (Population Regression Function: PRF) หรือการถดถอยประชากร (Population Regression: PR)

                สำหรับรูปแบบความสัมพันธ์หรือฟังก์ชันนั้น เนื่องจากในสถานการณ์จริงเป็นการยากที่จะกำหนดหรือทดสอบหารูปแบบของฟังก์ชันได้ ดังนั้นโดยทั่วไปนักเศรษฐศาสตร์จึงมักกำหนดให้มีรูปแบบความสัมพันธ์แบบเส้นตรง (Linear) คือ สมมติให้ฟังก์ชันการถดถอยของประชากร  เป็นฟังก์ชันเส้นตรงของ

                                                   (2.2.2)

ดังนั้นจึงเรียกสมการ 2.2.2 ว่า ฟังก์ชันการถดถอยของประชากรเชิงเส้น (Linear Population Regression Function) โดยที่  และ  คือพารามิเตอร์ที่ไม่ทราบค่าซึ่งคงที่ เรียกว่า สัมประสิทธิ์การถดถอย (Regression Coefficient) โดยที่  แสดงถึง ค่าที่ตัดแกน (Intercept Term) และ  แสดงถึง ค่าความชัน (Slope) ของเส้นตรง

 

2.3 ความหมายของเชิงเส้นตรง (The Meaning of the Term Linear)

       

ความหมายของคำว่าเชิงเส้นมีอยู่ 2 แนวทางคือ

     

     2.3.1 เชิงเส้นในตัวแปร (Linearity in the Variables)

พิจารณา จากสมการ 2.2.2

และ                                                                           (2.3.1)

                สมการ 2.2.2 เรียกว่าเป็นสมการที่มีลักษณะเชิงเส้นในตัวแปร เนื่องจากตัวแปร  มีกำลังเท่ากับ 1 ในขณะที่สมการ 2.3.1 ไม่มีลักษณะเชิงเส้นในตัวแปรเนื่องจากตัวแปร  มีกำลังเท่ากับ 2 ดังนั้นสรุปได้ว่า สมการที่มีลักษณะเชิงเส้นในตัวแปรกำลังของตัวแปรตามจะต้องมีค่าเท่ากับ 1

 

     2.3.2 เชิงเส้นในพารามิเตอร์ (Linearity in the Parameters)

ฟังก์ชันที่ถูกเรียกว่าเป็นเชิงเส้นในพารามิเตอร์  ได้ก็ต่อเมื่อ  ปรากฏเพียงตัวเดียวโดดๆ เท่านั้น ไม่ถูกคูณหรือหารด้วยพารามิเตอร์อื่นๆ เช่น  หรือ  และต้องมีกำลังเพียงแค่หนึ่งเท่านั้น พิจารณาสมการ 2.3.1

                                  

และ                                                                                     (2.3.2)

                เมื่อพิจารณาพบว่า สมการ 2.3.1 มีลักษณะเชิงเส้นในพารามิเตอร์ทั้ง  และ  ในขณะที่สมการ 2.3.2 มีลักษณะเชิงเส้นใน  แต่ไม่มีลักษณะเชิงเส้นใน  ดังนั้นสมการที่ 2.3.2 จึงเป็นแบบจำลองถดถอยที่ไม่เป็นเชิงเส้น (Nonlinear Regression Model)

               

2.4  การกำหนดสโทแคสติกของ PRF (Stochastic Specification of PRF)

               

                ดังหัวข้อที่ผ่านมา PRF จะให้ค่าเฉลี่ยของตัวแปรตามที่สอดคล้องกับแต่ละค่าของตัวแปรอิสระ แต่การระบุความสัมพันธ์  ถึงแม้ตัวแปร  จะมีความสัมพันธ์กับ  สูงเพียงใด ก็ไม่ได้หมายความว่าตัวแปร  จะสามารถอธิบายการเคลื่อนไหวของตัวแปร  ได้หมด ปัจจัยอื่น เช่นตัวแปรอิสระ  บางตัวที่ถูกตัดทิ้งไปหรือตัวแปรอธิบายอื่นก็ยังคงมีอิทธิพลต่อการเคลื่อนไหวของตัวแปร  อยู่ จึงมีผลทำให้ค่า  ที่เกิดขึ้นจริง และ  ที่ได้จากการถดถอยมีความแตกต่างกัน หรือค่า  ที่ได้จากการประมาณคลาดเคลื่อนไปจากค่า  ที่เกิดขึ้นจริง ดังนั้นในความเป็นจริงเมื่อทำการสุ่มตัวอย่างค่าที่เกิดขึ้นจริงมาเปรียบเทียบกับค่าที่ได้จากการประมาณถดถอยจะพบว่า ค่าที่เกิดขึ้นจริงไม่จำเป็นต้องเท่ากับค่าเฉลี่ยที่ได้จาก PRF โดยอาจน้อยกว่าหรือมากกว่าก็ได้ ดังนั้นเพื่อให้ค่าที่ได้จาก PRF เท่ากับค่าที่เกิดขึ้นจริงจึงต้องบวกหรือลบด้วยค่าใดค่าหนึ่ง  ซึ่งทำให้เกิดความคลาดเคลื่อนดังกล่าว ดังสมการ

                หรือ                                                                                            (2.4.1)

                โดยที่  คือตัวแปรสุ่มที่ไม่สามารถสังเกตได้ ซึ่งอาจเป็นทั้งค่าบวกและลบ ตัวแปร เรียกว่า ตัวรบกวนสโทแคสติก (Stochastic Disturbance) หรือตัวคลาดเคลื่อนสโทแคสติก (Stochastic Error Term) ดังนั้นจากสมการ 2.4.1 จึงอธิบายได้ว่าพฤติกรรมของ  ที่เกิดขึ้นจริงนั้นมีสาเหตุมาจากองค์ประกอบ 2 ส่วนคือ

                1.     คือค่าคาดหมายของตัวแปร เมื่อกำหนดตัวแปร  มาให้ ส่วนประกอบนี้จึงเรียกว่า ส่วนที่เป็นระบบ (Systematic Component) หรือส่วนประกอบเชิงกำหนด (Deterministic Component)

                2.     คือ พจน์รบกวนสโทแคสติก โดยเป็นตัวแทน (Proxy) ของตัวแปรที่ถูกละทิ้งหรือตัวแปรที่ไม่สนใจ โดยตัวแปรดังกล่าวอาจมีผลต่อตัวแปร  แต่ไม่ได้ถูกนำมารวมเข้าไว้ในแบบจำลองถดถอย

2.5  ความสำคัญของพจน์ตัวแปรรบกวนสโทแคสติก (The Significance of the Stochastic Disturbance Term)

 

                ในทางเศรษฐศาสตร์และเศรษฐมิติ สาเหตุที่จำเป็นต้องมีพจน์ตัวแปรสุ่ม  มีสาเหตุหลายประการดังนี้

                1.     ความคลุมเครือของทฤษฎี (Vagueness of Theory)

                โดยตัวทฤษฎีอาจบ่งบอกถึงตัวแปร  ที่เป็นตัวกำหนดการเคลื่อนไหวของตัวแปร  ได้ไม่สมบูรณ์ เช่น นักเศรษฐศาสตร์ทราบว่ารายได้ต่อสัปดาห์จะมีอิทธิพลต่อการบริโภคต่อสัปดาห์ แต่ในความเป็นจริงอาจมีตัวแปรอื่นที่ไม่ทราบที่มีอิทธิพลต่อตัวแปร  อีก ดังนั้น  จึงถูกนำไปใช้เพื่อทดแทนตัวแปรที่ถูกละทิ้งหรือตัวแปรไม่ได้ถูกนำไว้ในแบบจำลอง

                2.     ข้อมูลที่ไม่สามารถหาได้ (Unavailability of Data) และการระบุตัวแปรอิสระไม่ครบถ้วน

                โดยปกติตัวแปรอธิบายที่มีผลต่อตัวแปร  อาจมีมากมาย ยกตัวอย่างเมื่อพิจารณาถึงแบบจำลองถดถอยแบบพหุคูณ ซึ่งประกอบด้วยตัวแปรอธิบายหลายตัว บางตัวแปรมีอิทธิพลต่อตัวแปรตามมาก บางตัวแปรมีอิทธิพลต่อตัวแปรตามน้อย หรือบางตัวแปรไม่สามารถวัดออกมาเป็นตัวเลขได้ ซึ่งในทางปฏิบัตินักวิจัยจะพยายามที่จะระบุตัวแปรอิสระหรือปัจจัยภายนอกที่อธิบายการเคลื่อนไหวของ  ให้ได้มากที่สุด แต่เนื่องจากในความเป็นจริงนักวิจัยไม่สามารถคำนึงถึงตัวแปรได้ครบทุกตัว ดังนั้นตัวแปรบางตัวที่มีอิทธิพลต่อตัวแปรตามน้อยหรือตัวแปรบางตัวแม้จะมีอิทธิพลมากแต่ไม่สามารถวัดค่าออกมาได้ จึงต้องถูกตัดออกไปจากแบบจำลองส่งผลให้อิทธิพลของตัวแปรเหล่านั้นปรากฏที่พจน์

                3.     ตัวแปรหลักเปรียบเทียบกับตัวแปรภายนอก (Core Variable versus Peripheral Variable)

                ตัวอย่าง รายจ่ายในการบริโภค นอกจากขึ้นอยู่กับตัวแปรหลักคือราคาของสินค้าชนิดนั้นและรายได้แล้ว รายจ่ายในการบริโภคยังอาจขึ้นอยู่กับ เพศ จำนวนสมาชิกในครอบครัว การศึกษา ศาสนา พื้นที่ทางภูมิศาสตร์ด้วย และอาจเป็นไปได้ที่อิทธิพลของตัวแปรแวดล้อมเหล่านี้อาจมีผลต่อการพิจารณารายจ่ายในการบริโภค ดังนั้นจึงได้รวมอิทธิพลของตัวแปรแวดล้อมเหล่านี้เข้าด้วยกันและกำหนดให้เป็นตัวแปรสุ่ม

                4.     ลักษณะเชิงสุ่มในของพฤติกรรมของมนุษย์ (Intrinsic Randomness in Human Behavior)

                ในการศึกษาทางสังคมศาสตร์ การศึกษาวิจัยจะอาศัยข้อมูลจากการสังเกต การสำรวจหรือบันทึกผลการตอบสนองจากพฤติกรรมของมนุษย์ ซึ่งพฤติกรรมของมนุษย์เป็นสิ่งที่คาดหมายได้ยากและมีความไม่แน่นอนสูง รวมถึงไม่สามารถอธิบายได้หรือยากแก่การอธิบาย ดังนั้นตัวรบกวนอาจจะเป็นตัวสะท้อนถึงความคลาดเคลื่อนที่จะเกิดขึ้น

                5.     ตัวแปรที่เป็นตัวแทนที่ไม่ดี (Poor Proxy Variable)

                ถึงแม้ว่าแบบจำลองถดถอยแบบฉบับจะสมมติว่าตัวแปร  และ  จะถูกวัดอย่างถูกต้อง แต่ในความเป็นจริงในทางปฏิบัติข้อมูลที่ได้อาจคลาดเคลื่อนจากความเป็นจริงได้ และเมื่อข้อมูลเดิม  ที่ได้มีความผิดพลาดตั้งแต่เริ่มต้นแล้ว ทั้งโครงสร้างและการพยากรณ์ในอนาคตก็จะคลาดเคลื่อนไปจากความจริงด้วย อีกประเด็นหนึ่งคือความผิดพลาดของยอดรวมข้อมูล ตัวอย่างเช่นในการหาค่า GDP การหายอดรวมดังกล่าวทำได้โดยการนำเอาข้อมูลจากส่วนประกอบย่อยๆ มารวมกันโดยตรง แต่เนื่องจากธรรมชาติของข้อมูลแต่ละองค์ประกอบมีเงื่อนไขและแบบแผนเฉพาะตัว รวมถึงมีวิธีการจัดเก็บและระยะเวลาที่แตกต่างกันทำให้เมื่อนำข้อมูลจากแหล่งต่างๆ มารวมกันจึงก่อให้เกิดความคลาดเคลื่อน ในกรณีนี้พจน์รบกวนจึงแสดงถึงความคลาดเคลื่อนในการวัดและการรวมข้อมูล

                6.     หลักของความประหยัดมากเกินไป (Principle of Parsimony)

                ตามแนวคิดของ Occam’s rasor กล่าวว่า เราควรจะทำให้แบบจำลองถดถอยของเราง่ายที่สุดเท่าที่จะเป็นไปได้ ดังนั้นถ้าสามารถอธิบายพฤติกรรมของตัวแปร  ได้อย่างมีประสิทธิภาพด้วยตัวแปรเพียง 2 หรือ 3 ตัวแปรประกอบกับถ้าทฤษฎีไม่ได้แนะว่าควรจะมีตัวแปรอื่นๆ อีกที่ควรจะถูกรวมเข้ามาในแบบจำลอง ทำไมจึงจะต้องนำตัวแปรที่มากมายเข้ามาในแบบจำลองด้วย ดังนั้นจึงให้ เป็นตัวแทนของตัวแปรอื่นๆ ทั้งหมดที่ไม่ได้รวม

                7.     รูปแบบฟังก์ชันที่ผิดพลาด (Wrong Functional Form) หรือการระบุโครงสร้างความสัมพันธ์ทางคณิตศาตร์ที่ผิดพลาด

                ถึงแม้นักวิจัยจะมีตัวแปรที่ถูกต้องทางทฤษฎีในการอธิบายปรากฏการณ์ที่เกิดขึ้น และสามารถหาข้อมูลเหล่านั้นได้ แต่บ่อยครั้งที่นักวิจัยไม่สามารถทราบรูปแบบฟังก์ชันที่แสดงความสัมพันธ์ระหว่างตัวถดถอย และตัวถูกถดถอยที่ถูกต้องได้ ในกรณีของแบบจำลอง 2 ตัวแปร รูปแบบฟังก์ชันสามารถหาได้จากการลงจุดในแผนภาพการกระจายเพื่อหาความสัมพันธ์ของตัวแปรทั้งสอง แต่ในกรณีของแบบจำลองพหุคูณซึ่งมีหลายตัวแปรจะเป็นการยากที่จะกำหนดรูปแบบฟังก์ชันที่เหมาะสม เพราะการวาดกราฟจะไม่สามารถเห็นการลงจุดของข้อมูลในหลายมิติได้

 

2.6    แบบจำลองการถดถอยตัวอย่าง (The Sample Regression Function: SRF)

 

                ในการการถดถอยข้อมูลจากประชากรนั้น ในทางปฏิบัติเป็นไปได้ยากที่จะสามารถหาประชากรได้ทั้งหมด เนื่องจากต้องเสียเวลาและค่าใช้จ่ายสูง ดังนั้นนักวิจัยจึงทำการสุ่มตัวอย่าง แต่การสุ่มตัวอย่างก็ก่อให้เกิดปัญหาบางประการ เช่นสมมตินักวิจัยทำการสุ่มตัวอย่างจากประชากรมา 2 ครั้งโดยกำหนดให้  คงที่เหมือนกันทั้ง 2 ตัวอย่าง ดังตารางที่ 2.4 และ 2.5 และเมื่อนำข้อมูลมาลงจุดจะได้ดังรูป 2.4

 

ตาราง 2.4 ตัวอย่างที่ได้จากการสุ่มจากประชากรครั้งที่ 1

 

ตาราง 2.5 ตัวอย่างที่ได้จากการสุ่มจากประชากรครั้งที่ 2

Y

X

 

Y

X

70

80

 

55

80

65

100

 

88

100

90

120

 

90

120

95

140

 

80

140

110

160

 

118

160

115

180

 

120

180

120

200

 

145

200

140

220

 

135

220

155

240

 

145

240

150

260

 

175

260

 

                 

 



 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

                รูป 2.4    เส้นสมการถดถอยเชิงเส้นที่ได้จากการสุ่มตัวอย่างจากประชากรทั้ง 2 ครั้ง

 

                สมมติว่าต้องการที่จะสร้างสมการเชิงเส้นตรงมาเส้นหนึ่งซึ่งเป็นตัวแทนพฤติกรรมของ  ที่ดีที่สุด กล่าวคือเป็นเส้นตรงที่พุ่งผ่านกลุ่มของข้อมูลตัวอย่างให้มากที่สุดในแต่ละชุดข้อมูล ผลที่ได้คือจะได้เส้นถดถอย 2 เส้น เรียกเส้นถดถอยที่ได้จากข้อมูลตัวอย่างนี้ว่า เส้นการถดถอยของตัวอย่าง (Sample Regression Line หรือ Sample Regression Function: SRF) โดยที่ SRF1 สอดคล้องกับตัวอย่างชุดที่ 1 และ SRF2 สอดคล้องกับตัวอย่างชุดที่ 2 โดยทั้งสองเส้นนี้มีความชันและจุดตัดบนแกนตั้งที่แตกต่างกัน คำถามคือจากเส้นการถดถอยทั้ง 2 เส้น เส้นใดสามารถเป็นตัวแทนของประชากรได้ดีที่สุด คำตอบคือไม่สามารถยืนยันได้ว่าเส้นใดเป็นตัวแทนของเส้นการถดถอยของประชากรได้จริง เนื่องจากในความเป็นจริงไม่มีทางที่จะทราบได้ว่าเส้นการถดถอยของประชากรที่ถูกต้องนั้นควรจะมีจุดตัดบนแกนตั้งหรือความชันเท่ากับเท่าใด

เช่นเดียวกับแบบจำลองถดถอยของประชากร (PRF) แบบจำลองถดถอยของตัวอย่าง (SRF) สามารถเขียนได้ดังนี้

                                                           (2.6.1)

และสามารถเขียนในรูปสโทแคสติกได้ดังนี้ (Stochastic Form) ได้ดังนี้

                                                    (2.6.2)

เมื่อ  คือ พจน์ส่วนที่เหลือจากตัวอย่าง (Residual Term)

 

2.7 พจน์คลาดเคลื่อน (Error Terms)

       

จากสมการถดถอยเชิงเส้นอย่างง่ายที่มีตัวแปรอิสระหรือตัวแปรอธิบายเพียงตัวเดียว

                                                  (2.7.1)

                โดยเป้าหมายของการถดถอย 2.7.1 คือการประมาณค่า  และ  ซึ่งเป็นพารามิเตอร์ที่แสดงความสัมพันธ์ระหว่างตัวแปร  และ  ดังนั้นในการประมาณจึงจำเป็นต้องใช้ข้อมูล,   และ  แต่เนื่องจากข้อมูล  นั้นไม่สามารถวัดค่าได้เหมือนกับตัวแปรอื่นๆ ดังนั้นจึงจำเป็นต้องมีการตั้งสมมติฐานเกี่ยวกับรูปแบบการกระจายความน่าจะเป็นของ  โดยข้อสมมติฐานของแบบจำลองถดถอยเชิงเส้นมีดังนี้

                1.     เป็นตัวแปรสโทแคสติก (Stochastic)

                เนื่องจาก  สามารถเคลื่อนไหวได้อย่างเสรีและไม่สามารถคาดการณ์ได้และการเคลื่อนไหวที่อิสระมากของ  จะมีผลทำให้ค่าของ  ผันผวนอย่างเสรีตามมากไปด้วย ดังนั้นเมื่อกำหนดค่า  ซ้ำๆ กัน ค่าของ  ที่ได้จะไม่ซ้ำค่าเดิม การกำหนดให้  เป็นตัวแปรเชิงสุ่ม ซึ่งจะมีผลทำให้  ถูกควบคุมด้วยทฤษฎีความน่าจะเป็น ที่สำคัญทำให้สามารถคาดหมายค่าเฉลี่ยของ  และความแปรปรวนของ ได้ด้วย และเมื่อเราถือว่าตัวแปร  เป็นตัวแปรเชิงสุ่ม ผลที่ตามมาคือ  เป็นตัวแปรเชิงสุ่มตามไปด้วย เพราะ เป็นตัวแปรเชิงเส้นตรงของ  หรือ  นอกจากนี้เนื่องจาก   เป็นฟังก์ชันเชิงเส้นตรงของ  ผลที่ตามมาคือ  เป็นตัวแปรเชิงสุ่มตามไปด้วย

                2.     ค่าเฉลี่ยของ  มีค่าเท่ากับ 0 (Zero mean)

                จากรูปที่ 2.5 ในการสุ่มตัวอย่างแต่ละครั้งขึ้นมาค่าของ   และ  จะให้ค่า  ที่สอดคล้องกับแต่ละ  หลายค่าซึ่งแตกต่างไปจากค่า  ที่ได้จากการประมาณ ส่งผลให้มีค่า  หรือ  ต่างๆ มากมายตามไปด้วย กล่าวคือ ถ้า  มากกว่า  ค่า  จะมีค่าเป็นบวกและถ้า  น้อยกว่า  ค่า  จะมีค่าเป็นลบ แต่เมื่อนำค่า  ที่เกิดขึ้นทั้งหมดมารวมกันสำหรับแต่ละ  แล้วเฉลี่ย ผลที่ได้จะต้องมีค่าเท่ากับ 0

 

 

 

 

 

 

 

 

 

 


                       

                รูป 2.5 ความแตกต่างระหว่างค่า  ที่เกิดขึ้นจริงและ  ที่ได้จากการประมาณ

               

                หรือ                                                                                                                   (2.7.2)

               

                3.     ความแปรปรวนของ  มีค่าคงที่ (Homoskedasticity)

                หมายความว่า ตัวรบกวนแต่ละตัวจะมีความแปรปรวนเป็นค่าคงที่และเท่ากัน ณ แต่ละค่าของ  ที่กำหนดให้ โดยเท่ากับค่าคงที่  ซึ่งเป็นพารามิเตอร์ที่ไม่ทราบค่า

                                                      (2.7.3)

 

 

 

 

 

 

 

 

 

รูป 2.6    ความแปรปรวนของพจน์รวบกวนที่สอดคล้องกับแต่ละ  คงที่

                4.     ตัวคลาดเคลื่อนที่เกิดจากค่าสังเกตแต่ละตัว ( และ ) จะต้องเป็นอิสระต่อกัน (Nonautoregressive)

                หมายความว่า ความแปรปรวนร่วม (Covariance) คู่ใดๆ ระหว่าง  และ  จะต้องมีค่าเท่ากับ 0 (โดยที่ ) นั่นคือ ค่าต่างๆ ของ  ในช่วงเวลาหนึ่งจะไม่ขึ้นอยู่กับค่าของ  ในช่วงเวลาอื่น หรือตัวแปรสุ่ม  ต่างวาระกันจะเป็นอิสระต่อกัน หรือความผันแปรใดที่เกิดขึ้นใน  จะต้องไม่มีผลกระทบต่อความแปรผันที่เกิดขึ้นของ  ผลที่ตามมาคือ  และ  ต่างเป็นอิสระต่อกัน  ตัวอย่าง ถ้า  คือปริมาณผลผลิต การที่วันนี้มีปริมาณผลผลิตมากกว่าค่าเฉลี่ยจะไม่ส่งผลให้ปริมาณผลผลิตในวันพรุ่งนี้มีปริมาณมากกว่าหรือน้อยกว่าค่าเฉลี่ยตามไปด้วย

                       (2.7.4)

 

5.        มีการแจกแจงแบบปกติ (Normal Distribution)

        ข้อสมมตินี้มีความจำเป็นอย่างมากในการวินิจฉัยทางสถิติเกี่ยวกับค่าประมาณของพารามิเตอร์ กล่าวคือค่าต่างๆ ของ  สำหรับแต่ละค่า  ที่เกิดขึ้นจะต้องมีลักษณะการแจกแจงแบบปกติรูปทรงระฆังคว่ำ โดยมีส่วนโค้งทั้งสองข้างมีลักษณะสมมาตรกัน

                        จากข้อสมมติทั้ง 5 ประการรวมกันเรียกว่า แบบจำลองสมการถดถอยเชิงเส้นอย่างง่าย สรุปข้อสมมติของ ได้ว่า  ต้องมีลักษณะการแจกแจงแบบปกติสมมาตรที่มีลักษณะเหมือนกันและเป็นอิสระต่อกัน (Independently and Identically with Normal Distribution: ) โดยที่มีค่าเฉลี่ยเท่ากับ 0 ความแปรปรวนเท่ากับ  สรุปในเชิงคณิตสถิติได้ดังนี้

                                                   (2.7.5)

6.       ค่าของตัวแปร  ทุกค่าจะต้องเป็นค่าคงที่  (Fixed) หรือ ตัวแปร ไม่มีลักษณะสโทแคสติก (Nonstochastic)

        การกำหนดให้ค่าของ  เป็นค่าที่แน่นอนไม่มีการแจกแจงใดๆ นั้น หมายความว่าจะไม่มีสหสัมพันธ์ระหว่างตัวแปร  กับตัวรบกวน  กล่าวคือในการเลือกตัวอย่างของ   และ  จำนวนหลายๆ ชุด แต่ละชุดจะใช้ค่า  ที่กำหนดไว้เหมือนกัน ดังนั้นเมื่อไม่มีความสัมพันธ์กันระหว่าง  และ  ความแปรปรวนร่วมระหว่าง  และ  จึงมีค่าเท่ากับ 0

                                                       (2.7.6)

                        เหตุผลที่มีสมมติฐานนี้คือ เพื่อต้องการให้สมการถดถอยยังเป็น  ไม่ให้ผกผันเป็น  เพราะโดยปกติแล้วตัวแปรบางคู่อาจมีความสัมพันธ์ลักษณะเป็นสาเหตุและผลลัพธ์ซึ่งกันและกัน 

 

2.8  แบบจำลองถดถอยเชิงเส้นตรงแบบฉบับ (The Classical Linear Regression Model)

       

ในการถดถอยเชิงเดี่ยวซึ่งเป็นการหาความสัมพันธ์ระหว่างตัวแปรสองตัว โดยตัวแปรตามจะขึ้นอยู่กับตัวแปรอิสระที่เป็นตัวกำหนด สิ่งที่ต้องการคือการประมาณค่าพารามิเตอร์ของการถดถอยของประชากร สำหรับวิธีการประมาณพารามิเตอร์ที่นิยมนำมาใช้กันมากที่สุดคือ วิธีกำลังสองน้อยที่สุด (Method of Least Square: LS)

 

    2.8.1 วิธีกำลังสองน้อยที่สุดแบบธรรมดา (Ordinary Least Square: OLS)

                วิธีกำลังสองน้อยที่สุดแบบธรรมดา (OLS) ถูกนำเสนอโดย Friedrich Gauss นักคณิตศาสตร์ชาวเยอรมัน โดยมีแนวคิดคือ ถ้าเส้นสมการในความเป็นจริง (Real Line) คือ  สมการดังกล่าวจะสามารถใช้แทนสมการที่แสดงความสัมพันธ์  ได้ดีก็ต่อเมื่อผลรวมของความคลาดเคลื่อน  มีค่าต่ำที่สุด แต่เนื่องจาก  เป็นตัวแปรสุ่มที่วัดค่าไม่ได้ ดังนั้นจึงพิจารณาจากผลรวมกำลังสองของค่าประมาณของความคลาดเคลื่อน (Error) มีค่าต่ำที่สุดแทน

                พิจารณาจาก แบบจำลอง PRF 

                                                (2 .8.1)

                เนื่องจาก PRF ไม่สามารถสังเกตค่าได้โดยตรง สิ่งที่ทำได้คือประมาณสมการถดถอยจากข้อมูลตัวอย่าง (SRF) โดยจะได้

                                                 (2.8.2)          

                                                                                                                 (2.8.3)

                โดยที่  และ  คือค่าประมาณที่อาศัยข้อมูลจากการสังเกตหรือตัวอย่างและเป็นตัวประมาณค่าของ  และ  และ  คือค่าที่ประมาณได้ของ  จากสมการดังกล่าว สำหรับ  คือพจน์คลาดเคลื่อนหรือส่วนที่เหลือ  (Residual Form) จากสมการ 2.8.3 แสดงในรูปส่วนที่เหลือจะได้

          ,     (2.8.4)

                จากคำจำกัดความของ  และพิจารณาจากรูป 2.7

 

 

 

 


                 

 

 

       

 

 

                        รูป 2.7 ส่วนที่เหลือจากเส้นตรงที่เหมาะสม

 

จากรูป 2.7 มีข้อสังเกต 3 ประการ

        1.     การพิจารณาว่าเส้นสมการประมาณค่าใดเป็นเส้นสมการที่เหมาะสมที่สุด จะพิจารณาจากระยะห่างระหว่างค่าสังเกต (สนใจเฉพาะค่า) จากกลุ่มตัวอย่างกับเส้นสมการประมาณค่าที่สมมติว่าเหมาะสมกับข้อมูลมากที่สุด (Assumed Best Fitted Line) ไม่ใช่ระยะห่างระหว่างค่าสังเกตจากกลุ่มตัวอย่างกับเส้นสมการจริง (True Line) ที่เป็นเช่นนี้เพราะเส้นสมการจริงเป็นเส้นสมการในอุดมคติซึ่งไม่สามารถทราบตำแหน่งที่แท้จริงได้

        2.     ระยะห่างระหว่างค่าสังเกต  กับค่าประมาณจากสมการ  คือระยะทางที่วัดจากจุดพิกัดของค่าสังเกตมายังเส้นสมการประมาณค่าตามแนวตั้งฉากกับแกน  หรือ  เมื่อ  ถ้าจุดพิกัดอยู่เหนือเส้นสมการที่ประมาณได้จะถือว่า  มีค่าเป็นบวก และถ้าจุดพิกัดอยู่ใต้สมการที่ประมาณได้   มีค่าเป็นลบ

        3.     สำหรับเส้นสมการที่ผ่านไปในกลุ่มของค่าสังเกตและเป็นสมการที่ประมาณได้ที่ดีนั้น หมายถึงจะต้องเป็นสมการที่อาศัยข้อมูลจากทุกค่าสังเกตทุกจุดและต้องสนใจทั้งค่าบวกและค่าลบ

        พิจารณาจากรูป 2.7 จะเห็นว่า ส่วนที่เหลือวัดได้จากระยะทางตามแนวตั้ง โดยค่าของ  ที่แตกต่างกันจะให้เส้นตรงที่แตกต่างกันและจะให้เซตของส่วนที่เหลือที่แตกต่างกันไปด้วย ดังนั้นผลรวมกำลังสองของส่วนที่เหลือ (Residual Sum Square: RSS) จึงเป็นฟังก์ชันของ  และ

       

     2.8.2 การประมาณ  และ                                         

                ตามแนวคิดของวิธีกำลังสองน้อยที่สุดจะต้องเลือก SRF หรือ  และ  ที่ทำให้ผลรวมกำลังสองของส่วนที่เหลือ (RSS) มีค่าน้อยที่สุดเท่าที่จะเป็นไปได้

                                                   (2.8.5)

                                                      (2.8.6)

                พิจารณาเงื่อนไขจำเป็น โดยใช้อนุพันธ์บางส่วนกับฟังก์ชัน RSS เทียบกับ  และ  จะได้

                                  (2.8.7)

                         (2.8.8)

                โดยสูตรในการหาค่า  คือ

                                                          

                                                                                (2.8.9)

เมื่อ  โดยที่  และ  คือ ค่าเฉลี่ยของข้อมูล  และ  ตามลำดับ และ ,   

                หาค่าเฉลี่ย  โดยใส่ค่าคาดหมายทั้งสองข้างของสมการจะได้

                                                      

                                                                                                                                       (2.8.10)

                เนื่องจากโดยสมมติฐาน  ดังนั้น  จึงเป็นตัวแปรค่าที่ไม่เอนเอียง (Unbiasness) ของ

                สำหรับค่าความแปรปรวนของ  จะเท่ากับหาได้จาก

                                                                                                                                                         

                สำหรับสัมประสิทธิ์  หาได้จาก

                แทนค่า  จะได้

                                                                

                                                                      

                                                                      

                ใส่ค่าคาดคะเนใน  จะได้

         

                                                                                                                                (2.8.11)

                แสดงว่า  เป็นตัวประมาณที่ค่าไม่มีความเอนเอียงของ  สำหรับความแปรปรวนของ  จะเท่ากับ

                                            

                ในการคำนวณหาค่าความแปรปรวน  นั้น ไม่สามารถหาได้จากค่าของ  ได้เนื่องจากค่า  ขึ้นอยู่กับ  และ  ซึ่งไม่ทราบค่า แต่การประมาณสามารถทำได้จากการคำนวณส่วนที่เหลือ (Residuals) โดยความแปรปรวนจะมีค่าเท่ากับ

       

2.9 สมมติฐานภายใต้วิธีกำลังสองน้อยที่สุด (The Assumptions Underlying the Method of Least Square)

       

สมมติฐาน 1 แบบจำลองถดถอยเชิงเส้นตรง (Linear Regression Model)

                คือแบบจำลองถดถอยต้องเป็นเชิงเส้นในพารามิเตอร์ (Linear in Parameter) ดังสมการ

 

สมมติฐาน 2 ค่าของ  ถูกกำหนดเป็นค่าคงที่ในการสุ่มแบบซ้ำๆ ( Values are Fixed in Repeated Sampling)

                คือ ค่าที่ได้จากการตัวถดถอย  จะถูกพิจารณาว่าคงที่ในการสุ่มแบบซ้ำๆ ในทางเทคนิคสมมติว่า  มีลักษณะนอนสโทแคสติก (Nonstochastic)

 

สมมติฐาน 3 ค่าเฉลี่ยของตัวรบกวนจะมีค่าเท่ากับ 0 (Zero Mean Value of Disturbance ())

                เมื่อกำหนดค่าของ  ค่าเฉลี่ย หรือค่าคาดหมายของพจน์รบกวนแบบสุ่ม  จะมีค่าเท่ากับ 0 ในทางเทคนิคหมายความว่า ค่าเฉลี่ยอย่างมีเงื่อนไขของ  จะเท่ากับ 0 เขียนเป็น

                                                     (2.9.1)

 

สมมติฐาน 4 ความแปรปรวนของ  เท่ากัน (Homoscedasticity or Equal Variance of )

                เมื่อกำหนดค่าของ  ความแปรปรวนของ  จะเท่ากันในทุกๆ ค่าสังเกต นั่นคือความแปรปรวนอย่างมีเงื่อนไขของ  จะมีค่าเท่ากัน

                             (เนื่องจากสมมติฐาน 3)

                                                                                                                                                    (2.9.2)

               

สมมติฐาน 5 ไม่มีสหสัมพันธ์ระหว่างตัวรบกวน (No Autocorrelation between the Disturbances)

                เมื่อกำหนดค่าของ  ใดๆ มา 2 ค่า  และ  สหสัมพันธ์ระหว่าง  และ  จะเท่ากับ 0 เขียนเป็นสัญลักษณ์ได้ดังนี้

  

                                                                                                                     (2.9.3)

สมมติฐาน 6 ความแปรปรวนร่วมระหว่าง  และ เท่ากับ 0 (Zero Covariance Between  and) หรือ

                       

                                                     เนื่องจาก

                                              เนื่องจาก มีลักษณะไม่เฟ้นสุ่ม

                                                                           เนื่องจาก

                                                                                        จากสมมติฐาน                            (2.9.4)         

 

สมมติฐาน 7 จำนวนของตัวอย่าง n ต้องมากกว่าจำนวนของพารามิเตอร์ที่ถูกประมาณ (The Number of Observation n must be Greater than the Number of Parameters to be estimated)

                หรือกล่าวอีกนัยหนึ่งจำนวนของค่าสังเกต  จะต้องมากกว่าจำนวนของตัวแปรอธิบาย

 

สมมติฐาน 8 ค่าของ  ต้องสามารถเปลี่ยนแปลงได้ (Variability in  Values)

                ค่าของ  ในตัวอย่างกำหนดมาให้ต้องไม่เหมือนกัน หมายความว่าความแปรปรวนของ  ต้องเป็นตัวเลขบวก

 

สมมติฐาน 9 แบบจำลองถดถอยต้องมีการกำหนดที่ถูกต้อง (The Regression Model is Correctly Specified)

                หรือกล่าวอีกนัยหนึ่งจะไม่มีการกำหนดแบบจำลองที่คลาดเคลื่อนหรือผิดพลาด ในการวิเคราะห์เชิงประจักษ์

 

สมมติฐาน 10 ไม่เกิดปัญหาตัวแปรอิสระมีความสัมพันธ์กันอย่างสมบูรณ์ (No Multicollinearity)

หมายความว่า ไม่เกิดความสัมพันธ์เชิงเส้นอย่างสมบูรณ์ระหว่างตัวแปรอธิบาย

 

จากสมมติฐานทั้ง 10 ประการสามารถสรุปคุณสมบัติของ ได้ดังนี้

                                                          สำหรับทุก i

                สำหรับทุก i

                         สำหรับ i  j

                สมมติฐานเหล่านี้สรุปง่ายๆ คือ

                หมายความว่า  มีการแจกแจงอิสระที่เหมือนกันด้วยค่าเฉลี่ยเท่ากับศูนย์ และความแปรปรวนเท่ากับ  โดยที่  หมายถึง การกระจายที่เป็นอิสระต่อกัน และเหมือนกัน (Independently and Identically Distribution)

 

2.10 คุณสมบัติของตัวประมาณกำลังสองน้อยที่สุด: ทฤษฎีของ Gauss-Markov Theorem

               

                ตัวประมาณกำลังสองน้อยที่สุดจะเป็นตัวประมาณที่ดีเลิศจะต้องมีคุณสมบัติที่เรียกว่า Gauss-Markov Theorem ประกอบ การเข้าใจคุณสมบัติดังกล่าว จำเป็นจะต้องเข้าใจตัวประมาณที่มีคุณสมบัติไม่เอนเอียงเชิงเส้นที่ดีที่สุด (Best Linear Unbiased Estimator: BLUE) โดยตัวประมาณจะต้องประกอบด้วยคุณสมบัติดังนี้

1.       ต้องเป็นเชิงเส้นตรง (Linear) คือเป็นฟังก์ชันเชิงเส้นตรงของตัวแปรสุ่ม

2.       ต้องไม่เอนเอียง (Unbiased) คือ ค่าเฉลี่ยหรือค่าคาดหมาย  จะต้องเท่ากับค่า  ที่เป็นจริง

3.     ต้องมีความแปรปรวนน้อยที่สุดในกลุ่มของตัวประมาณที่ไม่เอนเอียงด้วยกันทั้งหมด ตัวประมาณที่ไม่เอนเอียงที่มีความแปรปรวนน้อยที่สุดจะถูกเรียกว่า ตัวประมาณที่มีประสิทธิภาพ (Efficient Estimator)

 

Gauss-Markov Theorem

 

                “ด้วยสมมติฐานของแบบจำลองถดถอยเชิงเส้นแบบฉบับและตัวประมาณกำลังสองน้อยที่สุด ถ้ามีตัวประมาณค่าตัวหนึ่งที่มีลักษณะเชิงเส้นตรงและไม่เอนเอียงและมีความแปรปรวนน้อยที่สุดเมื่อเทียบกับบรรดาตัวประมาณค่าที่มีลักษณะเชิงเส้นตรงและไม่เอนเอียงทั้งหลาย ตัวประมาณนี้จะเรียกว่ามีคุณสมบัติ BLUE”

 

                สมมติข้อมูลตัวอย่าง โรงงานแห่งหนึ่งต้องการที่จะหาความสัมพันธ์ระหว่างขนาดกำลังการผลิตของโรงงานและจำนวนแรงงาน เพื่อนำมาใช้ในการประมาณจำนวนแรงงานที่เหมาะสม ในการศึกษาโรงงานได้ทดลองผลิตด้วยกำลังการผลิตและจำนวนแรงงานที่แตกต่างกันดังตารางที่ 2.6 โดยให้กำลังการผลิตของโรงงานคือตัวแปรอิสระ  และจำนวนแรงงานคือตัวแปรตาม  จากข้อมูลตาราง 2.6 จะได้ส่วนประกอบที่จำเป็นในการคำนวณ OLS ดังนี้

                                                     =   70,690

                                                                    =   19,800

                                                                                          =   70.0

                                                                                           =   312.28

                จากสมการ 2.8.12 จะได้ว่า

                                      

                ดังนั้นสมการถดถอยที่ประมาณได้คือ

                                             (2.10.1)

                จากสมการถดถอยที่ประมาณได้ ค่า  หมายความว่า ถ้าขนาดการผลิตของโรงงานเพิ่มขึ้น 1 หน่วย จะทำให้ต้องจ้างแรงงานเพิ่มมากขึ้น 3.57 คนหรือประมาณ 4 คน จากนั้นแทนค่าแต่ละ  ในสมการที่ประมาณได้ เพื่อหาค่า  ที่ได้จากการประมาณ จะได้ผลดังตาราง 2.7

 

ตาราง 2.6 ข้อมูลกำลังการผลิตและจำนวนแรงงาน

  ตัวอย่าง ()

1

80

399

10

86.72

867.2

100.0

7,520.4

2

30

121

-40

-191.28

7,651.2

1,600.0

36,588.0

3

50

221

-20

-91.28

1,825.6

400.0

8,332.0

4

90
376

20

63.72

1274.4

400.0

4060.2

5

70
361

0

48.72

0.0

0.0

2373.6

6

60
224

-10

-88.28

882.8

100.0

7793.4

7

120
546

50

233.72

11686.0

2500.0

54625.0

8

80
352

10

39.72

397.2

100.0

1577.7

9

100
353

30

40.72

1221.6

900.0

1658.1

10

50
157

-20

-155.28

3105.6

400.0

24111.9

11

40
160

-30

-152.28

4568.4

900.0

23189.2

12

70
252

0

-60.28

0.0

0.0

3633.7

13

90
389

20

76.72

1534.4

400.0

5886.0

14

20
113

-50

-199.28

9964.0

2500.0

39712.5

15

110
435

40

122.72

4908.8

1600.0

15060.2

16

100
420

30

107.72

3231.6

900.0

11603.6

17

30

212

-40

-100.28

4011.2

1600.0

10056.1

18

50

268

-20

-44.28

885.6

400.0

1960.7

19

90

377

20

64.72

1294.4

400.0

4188.7

20

110

421

40

108.72

4348.8

1600.0

11820.0

21

30

273

-40

-39.28

1571.2

1600.0

1542.9

22

90

468

20

155.72

3114.4

400.0

24248.7

23

40

244

-30

-68.28

2,048.4

900.0

4,662.2

24

80

342

10

29.72

297.2

100.0

883.3

25

70

323

0

10.72

0

0

114.9

รวม

1,750

7,807

0

0

70,690

19,800

307,203

ค่าเฉลี่ย

70.0

312.28

 

 

 

 

 

ที่มา จากการคำนวณ

 

ตาราง 2.7 ส่วนที่เหลือที่ได้จากการประมาณ

ตัวอย่าง ()

1

80

399

347.982

51.018

2602.834

2

30

121

169.472

-48.472

2349.527

3

50

221

240.876

-19.876

395.054

4

90

376

383.684

-7.684

59.044

5

70

361

312.280

48.720

2373.638

6

60

224

276.578

-52.578

2764.444

7

120

546

490.790

55.210

3048.133

8

80

352

347.982

4.018

16.144

9

100

353

419.386

-66.386

4407.109

10

50

157

240.876

-83.876

7035.177

11

40

160

205.174

-45.174

2040.685

12

70

252

312.280

-60.280

3633.678

13

90

389

383.684

5.316

28.259

14

20

113

133.770

-20.770

431.389

15

110

435

455.088

-20.088

403.531

16

100

420

419.386

0.614

0.377

17

30

212

169.472

42.528

1808.638

18

50

268

240.876

27.124

735.714

19

90

377

383.684

-6.684

44.676

20

110

421

455.088

-34.088

1161.997

21

30

273

169.472

103.528

10718.064

22

90

468

383.684

84.316

7109.181

23

40

244

205.174

38.826

1507.463

24

80

342

347.982

-5.982

35.785

25

70

323

312.280

10.720

114.918

รวม

1,750

7,807

7,807

0

54825.459

ค่าเฉลี่ย

70.0

312.28

 

 

 

ที่มา จากการคำนวณ

 

                                                                                                            

                จากตาราง 2.7 จะเห็นได้ว่าผลรวมเฉลี่ยของความคลาดเคลื่อน  ซึ่งสอดคล้องกับสมมติฐานของการถดถอยที่  ส่วน    นั้นเรียกว่า ผลบวกกำลังสองของความคลาดเคลื่อน RSS ซึ่งนำไปใช้ในการประมาณหาค่าความคลาดเคลื่อนและส่วนเบี่ยงเบนมาตรฐาน

                ดังนั้นส่วนเบี่ยงเบนมาตรฐาน

                                                                   

 

 

 

2.11 กระบวนการอ้างอิง (Inference Procedure)

 

                เนื่องจากลักษณะการกระจายของ  และ   คือ

                                             

                                                                                                        

                ดังนั้นจึงสามารถกำหนดลักษณะทดสอบของ และ  ได้ดังนี้

 

   2.11.1 การทดสอบสมมติฐานเกี่ยวกับค่า  แบบสองข้าง

                การทดสอบแบบ 2 ข้างนี้เป็นการทดสอบว่า ตัวแปร  และ  มีความสัมพันธ์กันในลักษณะเชิงเส้นตรงหรือไม่ จากสมการ

                ถ้า  แสดงว่า  และ  มีไม่มีความสัมพันธ์กันในลักษณะเชิงเส้นตรง ดังนั้นสมมติฐานเกี่ยวกับการทดสอบคือ

                                                       (2.11.1)

                สำหรับสถิติทดสอบคือ

                             (2.11.2)

                ในการตัดสินใจนั้นจะปฎิเสธสมมติฐานว่าง  และยอมรับสมมติฐานทางเลือก  ก็ต่อเมื่อค่า  หรือ  หรือจะปฎิเสธ  ถ้า  และสรุปได้ว่า  และ  มีความสัมพันธ์กันในลักษณะเชิงเส้นตรง

                แต่ถ้าค่า  นั่นคือจะยอมรับสมมติฐานว่าง  และปฎิเสธสมมติฐานทางเลือก  และสรุปได้ว่า  และ  ไม่ได้มีความสัมพันธ์กันในลักษณะเชิงเส้นตรง

                สำหรับสถิติทดสอบ  นั้นจะใช้ในกรณีที่ตัวอย่างมีขนาดเล็ก  แต่ถ้ากรณีที่ตัวอย่างมีขนาดใหญ่  สถิติที่ใช้ทดสอบคือ  โดยที่  และจะ      ปฎิเสธสมมติฐานว่าง  และยอมรับสมมติฐานทางเลือก  ก็ต่อเมื่อค่า  หรือ  

                จากข้อมูลตัวอย่างในตารางที่ 2.6 คือ  เท่ากับ 3.5702 เนื่องจากมีจำนวนตัวอย่าง 25 ดังนั้นสถิติที่ใช้ทดสอบคือ สถิติ

                                                       

                เมื่อเปิดตาราง  ณ ระดับความเชื่อมั่น 97.25 % และ  23 จะได้ค่าวิกฤติเท่ากับ 2.069 ซึ่งน้อยกว่าค่าที่ได้จากการคำนวณ ดังนั้นจึงปฎิเสธสมมติฐาน  และยอมรับสมมติฐาน  สรุปได้ว่ากำลังการผลิตของโรงงานมีความสัมพันธ์กับจำนวนแรงงาน

 

   2.11.2 การทดสอบสมมติฐานเกี่ยวกับค่า  แบบข้างเดียว

                เป็นการทดสอบว่าตัวแปร  และ  มีความสัมพันธ์กันในทิศทางเดียวกัน หรือทิศทางตรงข้ามกัน หรือเป็นการทดสอบว่า  มากกว่าศูนย์หรือน้อยกว่าศูนย์ โดยสมมติฐานว่างและสมมติฐานทางเลือกในกรณีตัวแปร  และ  มีความสัมพันธ์กันในทิศทางเดียวกันคือ

                                                       (2.11.3)

                สำหรับสถิติที่ใช้ในการทดสอบกรณีตัวอย่างมีขนาดเล็ก () คือ

                                                   (2.11.4)

                ถ้า  จะปฎิเสธสมมติฐานว่างและยอมรับสมมติฐานทางเลือกหรือยอมรับว่าตัวแปร  และ  มีความสัมพันธ์ในทิศทางเดียวกัน

                ส่วนสมมติฐานว่างและสมมติฐานทางเลือกในกรณีตัวแปร  และ  มีความสัมพันธ์กันในทิศทางตรงข้ามกันคือ

                                                                                                                                     (2.11.5)

                สำหรับสถิติที่ใช้ในการทดสอบคือ

                                                   (2.11.6)

                ถ้า  จะปฎิเสธสมมติฐานว่างและยอมรับสมมติฐานทางเลือกหรือยอมรับว่าตัวแปร  และ  มีความสัมพันธ์ในทิศทางตรงข้ามกัน

                ส่วนกรณีที่ตัวอย่างมีขนาดใหญ่สถิติทดสอบคือ ()

                                                 (2.11.7)

                โดยที่ปฎิเสธสมมติฐานว่างและยอมรับสมมติฐานทางเลือกก็ต่อเมื่อ  จากข้อมูลตัวอย่างในตารางที่ 2.6 คือ  เท่ากับ 3.5702 ถ้าต้องการทดสอบว่าถ้าเพิ่มกำลังการผลิตของโรงงานแล้วจะต้องใช้จำนวนแรงงานเพิ่มขึ้นหรือไม่ สถิติที่ใช้ทดสอบคือ สถิติ  แบบข้างเดียว

                                                       

                                                              

                เมื่อเปิดตาราง  ณ ระดับความเชื่อมั่น 95% และ  23 จะได้ค่าวิกฤติเท่ากับ 1.714 ซึ่งน้อยกว่าค่าที่ได้จากการคำนวณ ดังนั้นจึงปฎิเสธสมมติฐาน  และยอมรับสมมติฐาน  สรุปได้ว่ากำลังการผลิตของโรงงานมีความสัมพันธ์กับจำนวนแรงงานในทิศทางเดียวกัน

               

  2.11.3 การประมาณค่า  แบบช่วง

                เนื่องจาก  คือค่าประมาณแบบจุดของ  ดังนั้นการประมาณค่าแบบช่วงกรณีที่ตัวอย่างมีขนาดเล็ก () ทำได้ดังนี้

                                            (2.11.8)

                ดังนั้นค่าประมาณแบบช่วงของ  ที่ระดับความเชื่อมั่น 95% คือ

                ส่วนกรณีที่ตัวอย่างมีขนาดใหญ่ () ช่วงความเชื่อมั่นคือ

                                             (2.11.9)

                จากข้อมูลตัวอย่างในตารางที่ 2.6 สามารถประมาณช่วงของ  ที่ระดับความเชื่อมั่น 95% ได้เท่ากับ

                นั่นคือ ถ้ากำลังการผลิตของโรงงานเพิ่มขึ้น 1 หน่วย จะทำให้ต้องใช้แรงงานเพิ่มขึ้น 2.8527 ถึง 4.2877 คน หรือประมาณ 3 คน ถึง 4 คน

 

     2.11.4 การทดสอบสมมติฐานเกี่ยวกับ  

                เป็นการทดสอบว่า สัมประสิทธิ์จุดตัดบนแกนตั้งเท่ากับ 0 หรือไม่ โดยการตั้งสมมติฐานเป็นดังนี้

                                                     (2.11.10)

                สำหรับสถิติทดสอบในกรณีที่ตัวอย่างน้อยกว่า 30 คือ สถิติ  ดังนี้

                          (2.11.11)

                โดยจะปฎิเสธสมมติฐานว่าง  ถ้า

ส่วนในกรณีที่ตัวอย่างมีมากกว่า 30 สถิติทดสอบคือ  ดังนี้

                                         (2.11.12)

                โดยจะปฎิเสธสมมติฐานว่าง  และยอมรับสมมติฐานทางเลือก  ก็ต่อเมื่อ  จากข้อมูลตัวอย่างในตารางที่ 2.6 คือ  เท่ากับ 62.37 เนื่องจากมีจำนวนตัวอย่าง 25 ดังนั้นสถิติที่ใช้ทดสอบคือ สถิติ

                                                                

                เมื่อเปิดตาราง  ณ ระดับความเชื่อมั่น 95% และ  23 จะได้ค่าวิกฤติเท่ากับ 2.069 ซึ่งน้อยกว่าค่าที่ได้จากการคำนวณ ดังนั้นจึงปฎิเสธสมมติฐาน  และยอมรับสมมติฐาน  สรุปได้ว่าสมการที่ได้ไม่ได้มีจุดกำเนิดที่จุด (0,0)

               

 

   2.11.5 การประมาณค่า  แบบช่วง

การประมาณแบบช่วงของ  กรณีที่ตัวอย่างมีขนาดเล็ก ()ที่ระดับความเชื่อมั่น  คือ

                                       (2.11.13)

                ส่วนการประมาณแบบช่วงของ   กรณีที่ตัวอย่างมีขนาดใหญ่ () ที่ระดับความเชื่อมั่น  คือ

                                        (2.11.14)

                จากข้อมูลตัวอย่างในตารางที่ 2.6 สามารถประมาณช่วงของ  ที่ระดับความเชื่อมั่น 95% ได้เท่ากับ

           

2.12 การวิเคราะห์ความแปรปรวนในแบบจำลองถดถอย 2 ตัวแปร (Analysis of Variance)

 

                ในแบบจำลองถดถอยเชิงเดี่ยว การทดสอบเกี่ยวกับสัมประสิทธิ์  นอกเหนือจากการใช้สถิติ  แล้วยังสามารถที่จะใช้หลักการของการวิเคราะห์ความแปรปรวนมาทดสอบเกี่ยวกับ  ได้ จากแนวคิดที่ว่าการที่ค่าของ  นั้นไม่คงที่มีสาเหตุมาจาก 2 สาเหตุคือ

                1.     เนื่องจากตัวแปรอธิบาย  กล่าวคือ เมื่อ  เปลี่ยนแปลงไป จะมีผลทำให้ค่า  เปลี่ยนแปลงไปด้วย

                2.     เนื่องจากปัจจัยอื่นๆ นอกเหนือจาก  

                ดังนั้นความผันผวนหรือความแปรปรวนของ  จึงมีสาเหตุจาก 2 ส่วนเช่นกันคือ

1.       ความแปรปรวนของ  ที่เกิดจากการที่  เปลี่ยนแปลงไป

2.       ความแปรปรวนของ  ที่เกิดจากปัจจัยอื่นๆ ที่สัมพันธ์กับ

 

 


               

 

 

 

 

 

 

 

 

                        รูป 2.13 ความผันผวนของ  อันเนื่องมาจาก 2 ส่วน

 

                จากรูป 2.13 พิจารณาค่าสังเกต  ที่สอดคล้องกับ  โดยสิ่งที่การวิเคราะห์ความแปรปรวนให้ความสนใจคือ ความแตกต่างหรือระยะทางระหว่าง  ถึง  หรือ  จากรูปจะเห็นได้ว่าระยะทาง  นั้นสามารถแบ่งออกได้เป็น 2 ส่วนคือ ระยะทางจากค่าสังเกตถึงเส้นถดถอย และระยะทางจากเส้นถดถอยจนถึงค่าเฉลี่ย  ดังนั้น

                หรือ                                       

                นี่เป็นเพียงค่าสังเกตเดียว ดังนั้นเมื่อคำนึงถึงทุกๆ ค่าสังเกตจะต้องนำทุกค่ามารวมกัน แต่เนื่องจากมีโอกาสที่จะเป็นได้ทั้งบวกและลบ ดังนั้นก่อนนำมารวมกันจึงต้องยกกำลังสอง ผลที่ได้คือ

                เนื่องจาก  เป็นค่าประมาณของ  ที่ขึ้นอยู่กับ  ดังนั้น

                ดังนั้นจากการวิเคราะห์ความแปรปรวนแบบทางเดียวเพื่อทดสอบความสัมพันธ์ระหว่าง  กับ  จึงสร้างตารางการวิเคราะห์ความแปรปรวน (ANOVA : Analysis of variance) ได้ดังนี้

 

ตาราง 2.8 ANOVA สำหรับทดสอบความสัมพันธ์

แหล่งของความแปรปปรวน

ผลรวมกำลังสอง

องศาเสรี

ค่าเฉลี่ยกำลังสอง

ตัวแปรอธิบาย ()

1

ส่วนที่เหลือ ()

ผลรวม

 

 

 

                จากอัตราส่วนของ  กับค่าความคลาดเคลื่อนมาตรฐานที่เป็นจริงของ  ซึ่งเป็นตัวแปรที่มีการแจกแจงแบบปกติมาตรฐาน จากคำจำกัดความของการแจกแจงแบบที่ว่า ตัวแปรที่มีการแจกแจงแบบปกติใดเมื่อถูกยกกำลังสองและถูกหารด้วยความแปรปรวนของมันเองจะมีลักษณะการแจกแจงแบบไคสแควร์  ดังนั้น

                    

เช่นเดียวกับการแจกแจงของ  ที่มีลักษณะการแจกแจงแบบปกติ เมื่อถูกนำมายกกำลังสองและหารด้วยความแปรปรวนของมันเอง ผลลัพธ์ที่ได้จะมีการแจกแจงแบบไคสแควร์

                จากแนวความคิดที่ว่า ถ้า  เป็น 0 ค่า  จะเท่ากับ  ดังนั้นถ้าตัวแปร  และ ตัวแปร  ไม่มีความสัมพันธ์กัน อัตราส่วนของ  จะเท่ากับ 0 โดยอัตราส่วนนี้จะมีลักษณะการแจกแจงแบบ

                                          (2.12.1) 

                ในการทดสอบสมมติฐาน  จากสมการที่ 2.12.1 จะได้ว่า

                                   (2.12.2)

                หรือ                                                                                           (2.12.3)                         เมื่อ  หมายถึงการแจกแจงแบบ  ที่มีระดับองศาเสรีเท่ากับ  และ  และในการทดสอบสมมติฐานนั้น จะปฎิเสธ  ก็ต่อเมื่อ  ที่คำนวณได้มากกว่าค่าวิกฤติ  ที่ได้จากการเปิดตาราง

 

2.13 การพยากรณ์ (Prediction)

               

          2.13.1 การพยากรณ์ค่าเฉลี่ยของ  แบบจุดเมื่อกำหนดค่า

                เป็นการพยากรณ์ค่าเฉลี่ยของ  เฉพาะค่าเดี่ยวอย่างมีเงื่อนไขที่ขึ้นอยู่กับค่า  ในกรณีนี้ค่าของ  ที่ได้จะอยู่บนเส้นถดถอย โดยการประมาณค่าเฉลี่ยของ  สามารถทำได้โดยแทนค่า  เข้าไปในสมการที่ประมาณได้คือ

                                          (2.13.1)

                เมื่อ  ยกตัวอย่างจากข้อมูลตารางที่ 2.6 ถ้าต้องการประมาณจำนวนแรงงาน ณ กำลังการผลิตเท่ากับ 115 สามารถแทนค่า = 115 ลงในสมการ

                                                              หรือประมาณ  คน

 

  2.13.2 การพยากรณ์ค่าเฉลี่ยของ  แบบช่วงเมื่อกำหนดค่า

                แม้ว่าการพยากรณ์แบบจุดจะเป็นการประมาณที่ให้ผลลัพธ์ที่ชัดเจนและเข้าใจง่าย แต่เพื่อลดความผิดพลาดในการพยากรณ์จึงนิยมใช้การพยากรณ์แบบช่วง

                การประมาณค่าเฉลี่ยแบบช่วงเมื่อกำหนดค่า  มาให้ในกรณีที่ตัวอย่างมีขนาดเล็ก  คือ

                                     (2.13.3)

                และสำหรับกรณีที่มีตัวอย่างขนาดใหญ่ คือ

                                        (2.13.4)

                ยกตัวอย่างจากข้อมูลตารางที่ 2.6 ถ้าต้องการประมาณค่าแบบช่วงของจำนวนแรงงานเฉลี่ย ณ กำลังการผลิตเท่ากับ 115 ทำได้โดยการแทน 115 ในสมการ 2.10.1 จะได้  จากนั้นแทนในสมการที่ 2.13.3 จะได้

                ดังนั้นถ้ากำลังการผลิตของโรงงานคือ 115 ณ ระดับความเชื่อมั่น 95% ช่วงของจำนวนแรงงานเฉลี่ยจะอยู่ระหว่าง 434.878 ถึง 511.01 หรือประมาณ 435 ถึง 511 คน

 

   2.13.3 การพยากรณ์ของ  แบบช่วงเมื่อกำหนดค่า

                ในการพยากรณ์ของ แบบช่วงค่าความแปรปรวนจะมีมากกว่ากรณีการพยากรณ์ค่าเฉลี่ยของ  แบบช่วง โดยเมื่อกำหนดค่า  มาให้ในกรณีที่ตัวอย่างมีขนาดเล็ก  คือ

                                    (2.13.6)

                และสำหรับกรณีที่มีตัวอย่างขนาดใหญ่ คือ

                                     (2.13.7)

                ยกตัวอย่างจากข้อมูลตารางที่ 2.6 ถ้าต้องการประมาณช่วงจำนวนแรงงาน ณ กำลังการผลิตเท่ากับ 115 จะได้เท่ากับ

                ดังนั้นถ้ากำลังการผลิตของโรงงานคือ 115 ณ ระดับความเชื่อมั่น 95% ช่วงของจำนวนแรงงานจะอยู่ระหว่าง 365.009 ถึง 580.877 หรือประมาณ 365 ถึง 581 คน และเมื่อเปรียบเทียบกับช่วงของจำนวนแรงงานโดยเฉลี่ยประมาณ 435 ถึง 511 คน จะพบว่ามีช่วงที่กว้างกว่า

 

2.14 การประมาณควรจะเป็นสูงสุดของแบบจำลองถดถอย 2 ตัวแปร (Maximum Likelihood Estimation of Two-Variable Regression Model)

 

                ในการประมาณพารามิเตอร์นอกเหนือจากวิธีกำลังสองน้อยที่สุดแล้วยังมีอีกวิธีหนึ่งคือ วิธีควรจะเป็นสูงสุด(Maximum Likelihood)

 

   2.14.1 การประมาณ  และ  ด้วยวิธีควรจะเป็นสูงสุด

 

จากแนวคิดของแบบจำลองที่พจน์คลาดเคลื่อนมีการแจกแจงแบบปกติและมีค่าเฉลี่ยเท่ากับ  และความแปรปรวนเท่ากับ  ได้เท่ากับ

                และในกรณีที่ฟังก์ชันฟังก์ชันควรจะเป็นมีตัวอย่าง  ตัวอย่างคือ  เมื่อกำหนดค่าเฉลี่ย และความแปรปรวนมาให้ ก็จะสามารถหาความหนาแน่นได้เช่นกัน โดยเขียนเป็นฟังก์ชันความหนาแน่นได้ดังนี้

                แต่เนื่องจาก  แต่ละตัวเป็นอิสระต่อกัน ดังนั้นฟังก์ชันควรจะเป็นจึงสามารถถูกเขียนได้เป็นผลคูณของฟังก์ชันความหนาแน่น (Density Function) ของแต่ละตัว  ตัว ได้ดังสมการ

(2.14.1)

เมื่อ

                           (2.14.2)

                สมการดังกล่าวคือ ฟังก์ชันความหนาแน่นของตัวแปรที่มีการกระจายแบบปกติ ด้วยค่าเฉลี่ยและความแปรปรวนที่กำหนดให้

(2.14.3)

                เมื่อ  ทราบค่า หรือถูกกำหนดมา แต่  และ  ไม่ทราบค่า ฟังก์ชันนี้เรียกว่า ฟังก์ชันควรจะเป็น (Likelihood Function) เขียนเป็นสัญลักษณ์คือ

                หรือเขียนเป็น

           (2.14.4)

                ดังนั้นวิธีควรจะเป็นสูงสุดจึงประกอบด้วยการประมาณพารามิเตอร์ที่ไม่ทราบค่า  และ  ดังนั้นจึงต้องพยายามประมาณ  และ  ที่จะทำให้สมการ 2.14.4 ที่มีค่ามากที่สุด ในการหาดังกล่าวจะใช้วิธีแคลคูลัส โดยการหาอนุพันธ์จากสมการ 2.14.4 ที่ถูกแปลงให้อยู่ในรูปลอการิทึม (log) โดยที่ ln หมายถึงลอการิทึมธรรมชาติ

                                                             (2.14.5)

                หาอนุพันธ์บางส่วนโดยคำนึงถึง และ จะได้

                                                                                  (2.14.6)

                                                                              (2.14.7)

                                                                         (2.14.8)

                กำหนดให้สมการเหล่านี้เท่ากับ 0 และให้  และ เป็นตัวประมาณค่าของ MLโดยจะได้ว่า

                                                                                     (2.14.9)

                แทนตัวประมาณค่า ML (=OLS) ในสมการที่ 2.14.8 จะได้

                                                                                                                            (2.14.10)

                จากสมการ 2.14.10 จะได้ตัวประมาณค่าความแปรปรวน  ของ ML ซึ่งแตกต่างจากความแปรปรวนที่ได้จากการประมาณ OLS

                โดยตัวประมาณค่าที่ได้ไม่มีความเอนเอียง ดังนั้นตัวประมาณความแปรปรวน  ของ ML จึงมีความเอนเอียง โดยขนาดของความเอนเอียงสามารถหาได้ด้วยวิธีการต่อไปนี้

               เนื่องจาก                                                         

                                                                             

                                                                                                                        (2.14.11)

                โดยจะเห็นได้ว่า  มีแนวโน้มเอนเอียงลง (Downward Bias) ส่งผลให้เกิดการประมาณต่ำกว่าที่ควรจะเป็น (Underestimate) ในตัวอย่างขนาดเล็ก แต่จะสังเกตเห็นว่า เมื่อ  ซึ่งหมายถึงขนาดของตัวอย่างเพิ่มมากขึ้นอย่างไม่จำกัด พจน์ที่สองในสมการ 2.14.11 ซึ่งเอนเอียง จะมีแนวโน้มเข้าสู่ 0 ดังนั้นเมื่อตัวอย่างมีขนาดมากๆ (Asymptotically)  จะไม่เอนเอียงตามไปด้วย นั่นคือ

       เมื่อ   

                จากลักษณะดังกล่าวสามารถที่จะพิสูจน์ต่อไปว่า ยังคงเป็นตัวประมาณค่าที่สอดคล้อง (Consistent) นั่นคือ เมื่อ n มีค่ามากขึ้นอย่างไม่จำกัด จะมีแนวโน้มลู่เข้าหาค่า ที่แท้จริง (True Value) จากข้อมูลตัวอย่างตาราง 2.6 ถ้าทำการประมาณด้วยวิธีควรจะเป็นสูงสุดจะได้ผลดังตาราง 2.9

                ตาราง 2.9 ผลการคำนวณด้วยวิธีควรจะเป็นสูงสุดโดยใช้โปรแกรม Eview 3.0

Estimation Method: Full Information Maximum Likelihood (Marquardt)

Sample: 1 25

Included observations: 25

Total system (balanced) observations 25

Convergence achieved after 8 iterations

 

Coefficient

Std. Error

t-Statistic

Prob. 

C(1)

62.36576

22.95572

2.716785

0.0123

C(2)

3.570211

0.326353

10.93973

0.0000

Log Likelihood

-131.6364

 

 

Determinant residual covariance

2193.018

 

 

Equation: Y=C(1)+C(2)*X

Observations: 25

R-squared

0.821533

    Mean dependent var

312.2800

Adjusted R-squared

0.813774

    S.D. dependent var

113.1376

S.E. of regression

48.82331

    Sum squared resid

54825.46

Durbin-Watson stat

1.431791

 

 

 


                ที่มา จากการคำนวณด้วยโปรแกรม Eview 3.0

 

  คลิกเพื่อเข้าสู่บทเรียนต่อไป >>>