Phương Pháp OLS Là Gì?

Thảo luận trong 'Cuộc Sống' bắt đầu bởi Táo Ngọt, 13 Tháng bảy 2021.

  1. Táo Ngọt

    Táo Ngọt Member

    Bài viết:
    Tìm chủ đề
    555
    Phương pháp OLS là gì?
    Trong thống kê, bình phương nhỏ nhất thông thường (OLS) là một loại phương pháp bình phương nhỏ nhất tuyến tính để ước tính các tham số chưa biết trong mô hình hồi quy tuyến tính. OLS chọn các tham số của một hàm tuyến tính của một tập hợp các biến giải thích theo nguyên tắc bình phương nhỏ nhất: Tối thiểu hóa tổng bình phương của sự khác biệt giữa biến phụ thuộc quan sát (giá trị của biến được quan sát) trong tập dữ liệu đã cho và những giá trị được dự đoán bởi hàm tuyến tính của biến độc lập.

    [​IMG]

    Về mặt hình học, đây được coi là tổng các khoảng cách bình phương, song song với trục của biến phụ thuộc, giữa mỗi điểm dữ liệu trong tập hợp và điểm tương ứng trên bề mặt hồi quy - chênh lệch càng nhỏ thì mô hình càng phù hợp với dữ liệu. Kết quả ước lượng có thể được biểu thị bằng một công thức đơn giản, đặc biệt là trong trường hợp hồi quy tuyến tính đơn giản, trong đó có một công cụ hồi quy duy nhất ở phía bên phải của phương trình hồi quy.

    Bộ ước lượng OLS nhất quán khi các bộ hồi quy là ngoại sinh và - theo định lý Gauss – Markov - tối ưu trong loại các bộ ước lượng không chệch tuyến tính khi các lỗi là đồng biến và không tương quan theo chuỗi. Trong các điều kiện này, phương pháp OLS cung cấp ước lượng trung bình-phương sai tối thiểu-không chệch khi các sai số có phương sai hữu hạn. Theo giả định bổ sung rằng các lỗi được phân phối bình thường, OLS là công cụ ước tính khả năng xảy ra tối đa.


    [​IMG]

    Hai kiểm định giả thuyết đặc biệt được sử dụng rộng rãi. Đầu tiên, người ta muốn biết liệu phương trình hồi quy ước tính có tốt hơn không so với dự đoán đơn giản rằng tất cả các giá trị của biến phản hồi bằng giá trị trung bình mẫu của nó (nếu không, nó được cho là không có sức mạnh giải thích). Giả thuyết rỗng không có giá trị giải thích của hồi quy ước lượng được kiểm tra bằng F-test. Nếu giá trị F được tính toán được tìm thấy đủ lớn để vượt quá giá trị tới hạn của nó đối với mức ý nghĩa đã chọn trước, thì giả thuyết vô hiệu bị bác bỏ và giả thuyết thay thế, rằng hồi quy có sức mạnh giải thích, được chấp nhận. Nếu không, giả thuyết vô hiệu về sức mạnh giải thích được chấp nhận.

    Thứ hai, đối với mỗi biến giải thích được quan tâm, người ta muốn biết liệu hệ số ước tính của nó có khác 0 đáng kể hay không - nghĩa là liệu biến giải thích cụ thể này trên thực tế có sức mạnh giải thích trong việc dự đoán biến phản hồi hay không. Ở đây giả thuyết rỗng là hệ số thực bằng không. Giả thuyết này được kiểm tra bằng cách tính toán thống kê t của hệ số, là tỷ số giữa ước lượng hệ số với sai số chuẩn của nó. Nếu thống kê t lớn hơn một giá trị xác định trước, giả thuyết vô hiệu bị bác bỏ và biến được tìm thấy có sức mạnh giải thích, với hệ số của nó khác 0 đáng kể. Nếu không, giả thuyết rỗng về giá trị không của hệ số thực được chấp nhận.


    [​IMG]

    Ngoài ra, phép thử Chow được sử dụng để kiểm tra xem hai mẫu con có cùng giá trị hệ số thực cơ bản hay không. Tổng bình phương phần dư bình phương của các hồi quy trên mỗi tập con và trên tập dữ liệu kết hợp được so sánh bằng cách tính toán thống kê F; nếu giá trị này vượt quá giá trị tới hạn, giả thuyết rỗng không có sự khác biệt giữa hai tập hợp con sẽ bị bác bỏ; nếu không, nó được chấp nhận.

    Việc lựa chọn tự động các biến được thực hiện nếu người dùng chọn số lượng biến quá cao so với số lượng quan sát. Giới hạn lý thuyết là n-1, vì với các giá trị lớn hơn, ma trận X'X trở nên không thể nghịch đảo.

    Tuy nhiên, việc xóa một số biến có thể không phải là tối ưu: Trong một số trường hợp, chúng tôi có thể không thêm một biến vào mô hình vì nó gần như thẳng hàng với một số biến khác hoặc với một khối biến, nhưng có thể nó sẽ nhiều hơn có liên quan để xóa biến đã có trong mô hình và biến mới.

    Vì lý do đó, và cũng để xử lý các trường hợp có nhiều biến giải thích, các phương pháp khác đã được phát triển.

    Các hạn chế của hồi quy OLS đến từ hạn chế về khả năng nghịch đảo của ma trận X'X: Yêu cầu hạng của ma trận là p + 1 và một số vấn đề về số có thể phát sinh nếu ma trận không hoạt động tốt. XLSTAT sử dụng các thuật toán do Dempster (1969) cho phép giải quyết hai vấn đề này: Nếu thứ hạng ma trận bằng q trong đó q thấp hơn p + 1, một số biến sẽ bị loại bỏ khỏi mô hình, vì chúng không đổi hoặc vì chúng thuộc về một khối các biến thẳng hàng.
     
Từ Khóa:

Chia sẻ trang này

Đang tải...