R – bình phương (R-squared) là gì?

R-bình phương (R^{2}) là phần trăm mức độ dao động của biến đầu ra (response variable) có thể được giải thích bởi mô hình tuyến tính (linear model). R^{2} luôn nằm trong khoảng 0 tới 100%. R^{2} là một giá trị đo lường thống kê để đo mức độ gần giữa dữ liệu với đường hồi quy của mô hình tuyến tính. Nó còn được gọi là hệ số xác định (coefficient of determination) hay hệ số xác định bội (coefficient of multiple determination) trong mô hình hồi quy đa biến.

Một cách tổng quan, nếu giá trị R^{2} càng lớn thì mô hình càng phù hợp với dữ liệu. Tuy nhiên, có một số điều kiện quan trọng chúng ta cần kiểm tra trước khi đưa ra kết luận mức độ tốt của mô hình dựa trên giá trị R^{2}. Một trong những yếu tố cần kiểm tra là biểu đồ sai số (residual plot) để kiểm tra liệu có bất kì pattern nào hay không. Nếu biểu đồ này có pattern, thì mô hình của chúng ta đang có vấn đề và cần phải xem xét lại.

Các bạn có thể tham khảo bài gốc tại đây.

About Author

Chia sẻ bài viết

Leave a Comment

Your email address will not be published. Required fields are marked *