Hồi quy tuyến tính (Định nghĩa, Ví dụ) - Làm thế nào để diễn giải?

Hồi quy tuyến tính là gì?

Hồi quy tuyến tính về cơ bản là một kỹ thuật mô hình thống kê được sử dụng để chỉ ra mối quan hệ giữa một biến phụ thuộc và một hoặc nhiều biến độc lập. Đây là một trong những kiểu phân tích dự đoán phổ biến nhất. Loại phân phối này hình thành trong một dòng do đó được gọi là hồi quy tuyến tính. Trong bài viết này, chúng tôi sẽ lấy các ví dụ về Phân tích hồi quy tuyến tính trong Excel.

Để thực hiện phân tích hồi quy tuyến tính trước tiên, chúng ta cần thêm phần bổ trợ excel theo các bước sau.

Nhấp vào Tệp - Tùy chọn (Thao tác này sẽ mở Cửa sổ bật lên Tùy chọn Excel cho bạn).

Nhấp vào Phần bổ trợ - Chọn Phần bổ trợ Excel từ Quản lý thả xuống trong excel, sau đó Nhấp vào Tiếp tục.

Thao tác này sẽ mở Cửa sổ bật lên bổ trợ. Chọn Analysis ToolPak rồi nhấp vào Ok.

Phần bổ trợ Phân tích Dữ liệu sẽ xuất hiện trong Tab Chèn.

Hãy cho chúng tôi hiểu bằng các Ví dụ dưới đây về phân tích hồi quy tuyến tính trong excel.

Ví dụ về phân tích hồi quy tuyến tính

Ví dụ 1

Giả sử chúng ta có doanh số hàng tháng và chi tiêu cho tiếp thị cho năm ngoái và bây giờ chúng ta cần dự đoán doanh số bán hàng trong tương lai trên cơ sở doanh số bán hàng và tiếp thị đã chi tiêu của năm ngoái.

tháng Quảng cáo Bán hàng
tháng một 40937 502729
Tháng hai 42376 507553
Mar 43355 516885
Tháng tư 44126 528347
có thể 45060 537298
Tháng sáu 49546 544066
Thg 7 56105 553664
Tháng 8 59322 563201
Tháng chín 59877 568657
Tháng 10 60481 569384
Tháng 11 62356 573764
Tháng mười hai 63246 582746

Nhấp vào Phân tích dữ liệu trong Tab Dữ liệu và thao tác này sẽ mở Cửa sổ bật lên Phân tích Dữ liệu cho bạn.

Bây giờ chọn Hồi quy từ danh sách và nhấp vào Ok.

Cửa sổ bật lên hồi quy sẽ mở ra.

Chọn Phạm vi bán hàng $ C $ 1: $ C $ 13 trong hộp trục Y vì đây là biến phụ thuộc và $ B $ 1: $ B $ 14 trong trục X vì chi phí quảng cáo là biến độc lập.

Đánh dấu chọn trên hộp Nhãn nếu bạn đã chọn tiêu đề trong dữ liệu khác, nó sẽ báo lỗi cho bạn.

Chọn Phạm vi đầu ra nếu bạn muốn nhận giá trị trên phạm vi cụ thể trên trang tính khác, hãy chọn Bảng tính mới Ply: và thao tác này sẽ thêm một trang tính mới và cung cấp cho bạn kết quả.

Sau đó đánh dấu vào ô Phần dư và nhấp vào Ok.

Thao tác này sẽ thêm các trang tính và cung cấp cho bạn kết quả sau.

Hãy để chúng tôi hiểu đầu ra.

Kết quả tóm tắt

Multiple R: Điều này thể hiện hệ số tương quan. Giá trị 1 cho thấy mối quan hệ tích cực và giá trị 0 cho thấy không có mối quan hệ nào.

R Square: R Square đại diện cho hệ số xác định. Điều này cho bạn biết phần trăm điểm rơi trên đường hồi quy. 0,49 có nghĩa là 49% giá trị phù hợp với mô hình

Hình vuông R điều chỉnh : Đây là hình vuông R điều chỉnh, yêu cầu khi bạn có nhiều hơn một biến X.

Lỗi tiêu chuẩn: Điều này thể hiện ước tính về độ lệch tiêu chuẩn của sai số. Đây là độ chính xác mà hệ số hồi quy được đo.

Số lần quan sát: Đây là số lần quan sát mà bạn đã thực hiện trong một mẫu.

ANOVA - Df: Mức độ tự do

SS: Tổng hình vuông.

MS: chúng tôi có hai MS

  • Hồi quy MS là Hồi quy SS / Hồi quy Df.
  • MS dư là sai số bình phương trung bình (SS dư / Df dư).

F: F kiểm định cho giả thuyết không.

Significance F: P-Values ​​liên quan đến Significance

Hệ số: Hệ số cho bạn ước tính số bình phương nhỏ nhất.

T Thống kê: T Thống kê cho giả thuyết rỗng so với giả thuyết thay thế.

P-Value: Đây là giá trị p cho kiểm định giả thuyết.

Dưới 95% và Trên 95%: Đây là ranh giới dưới và ranh giới trên của khoảng tin cậy

Kết quả còn lại: Chúng tôi có 12 quan sát dựa trên dữ liệu. 2 nd cột đại diện bán hàng dự đoán và 3 thứ Dư cột. Phần còn lại về cơ bản là sự khác biệt về doanh số dự đoán so với thực tế.

Ví dụ số 2

Chọn cột tiếp thị và bán hàng được dự đoán

Chuyển đến nhóm biểu đồ trong tab chèn. Chọn biểu tượng biểu đồ phân tán

Thao tác này sẽ chèn biểu đồ phân tán trong excel. Xem hình ảnh bên dưới

Nhấp chuột phải vào bất kỳ điểm nào rồi chọn Thêm đường xu hướng trong excel. Điều này sẽ thêm một đường xu hướng vào biểu đồ của bạn.

  • Bạn có thể định dạng đường xu hướng bằng cách nhấp chuột phải vào bất kỳ đâu trên đường xu hướng và sau đó chọn định dạng đường xu hướng.
  • Bạn có thể thực hiện nhiều cải tiến hơn cho biểu đồ. tức là, định dạng đường xu hướng, màu sắc và thay đổi tiêu đề, v.v.
  • Bạn cũng có thể hiển thị công thức trên biểu đồ bằng cách chọn trong Hiển thị công thức trên biểu đồ và hiển thị giá trị bình phương R trên biểu đồ.

Một số ví dụ khác về phân tích hồi quy tuyến tính:

  1. Dự đoán về Ô bán được dựa trên Mưa xảy ra ở Khu vực.
  2. Dự đoán về lượng AC được bán dựa trên Nhiệt độ vào mùa hè.
  3. Trong mùa thi, doanh số bán Văn phòng phẩm, Sách hướng dẫn thi tăng.
  4. Dự đoán về doanh số bán hàng khi Quảng cáo đã thực hiện dựa trên chuỗi TRP cao nơi quảng cáo được thực hiện, Mức độ phổ biến của Đại sứ thương hiệu và Tỷ lệ chân tại nơi giữ nơi quảng cáo được xuất bản.
  5. Bán nhà dựa trên Vị trí, Diện tích và giá cả.

Ví dụ # 3

Giả sử chúng ta có chín học sinh với chỉ số IQ của họ và số điểm họ đạt được trong Bài kiểm tra.

Sinh viên Điểm kiểm tra CHỈ SỐ THÔNG MINH
Ram 100 145
Shyam 97 140
Kul 93 130
Kappu 91 125
Raju 89 115
Vishal 86 110
Vivek 82 100
Vinay 78 95
Kumar 75 90

Bước 1: Đầu tiên, tìm ra các biến phụ thuộc và biến độc lập. Ở đây Điểm kiểm tra là biến phụ thuộc và IQ là biến độc lập vì Điểm kiểm tra thay đổi khi IQ thay đổi.

Bước 2: Vào Tab Dữ liệu - Bấm vào Phân tích dữ liệu - Chọn hồi quy - bấm Ok.

Thao tác này sẽ Mở cửa sổ hồi quy cho bạn.

Bước 3. Nhập phạm vi Điểm kiểm tra trong Ô phạm vi Y đầu vào và IQ trong Ô phạm vi đầu vào X. (Kiểm tra Nhãn nếu bạn có tiêu đề trong phạm vi dữ liệu của mình. Chọn tùy chọn đầu ra, sau đó kiểm tra Phần dư mong muốn. Nhấp Ok.

Bạn sẽ nhận được kết quả tóm tắt được hiển thị trong Hình ảnh bên dưới.

Bước 4: Phân tích hồi quy theo kết quả tóm tắt

Kết quả tóm tắt

Multiple R: Ở đây, hệ số tương quan là 0,99, rất gần với 1, có nghĩa là mối quan hệ Tuyến tính rất tích cực.

R Square: Giá trị R Square là 0,983, có nghĩa là 98,3% giá trị phù hợp với mô hình.

Giá trị P: Ở đây, giá trị P là 1,86881E-07, rất nhỏ hơn 0,1, có nghĩa là IQ có giá trị dự đoán quan trọng.

Xem biểu đồ bên dưới.

Bạn có thể thấy rằng hầu hết tất cả các điểm đều nằm trong đường thẳng hoặc đường xu hướng gần đó.

Ví dụ # 4

Chúng tôi cần dự đoán doanh số bán hàng của AC dựa trên doanh số bán hàng và nhiệt độ trong một tháng khác nhau.

tháng Nhiệt độ Bán hàng
tháng một 25 38893
Tháng hai 28 42254
Mar 31 42845
Tháng tư 33 47917
có thể 37 51243
Tháng sáu 40 69588
Thg 7 38 56570
Tháng 8 37 50000

Thực hiện theo các bước dưới đây để nhận được kết quả hồi quy.

Bước 1: Đầu tiên, tìm ra các biến phụ thuộc và biến độc lập. Ở đây Doanh số là biến phụ thuộc và Nhiệt độ là biến độc lập vì Doanh số thay đổi khi Nhiệt độ thay đổi.

Bước 2: Vào Tab Dữ liệu - Bấm vào Phân tích dữ liệu - Chọn hồi quy - bấm Ok.

Thao tác này sẽ Mở cửa sổ hồi quy cho bạn.

Bước 3. Nhập Doanh số vào Ô Phạm vi Y đầu vào và Nhiệt độ trong Ô Phạm vi Đầu vào X. (Kiểm tra Nhãn nếu bạn có tiêu đề trong phạm vi dữ liệu của mình. Chọn tùy chọn đầu ra, sau đó kiểm tra Phần dư mong muốn. Nhấp Ok.

Điều này sẽ cung cấp cho bạn kết quả tóm tắt như bên dưới.

Bước 4: Phân tích kết quả.

Multiple R: Ở đây, hệ số tương quan là 0,877, gần bằng 1, có nghĩa là mối quan hệ Tuyến tính là dương.

R Square: R Square value là 0,770, có nghĩa là 77% giá trị phù hợp với mô hình

Giá trị P: Ở đây, giá trị P là 1,86881E-07, rất nhỏ hơn 0,1, có nghĩa là IQ có giá trị dự đoán quan trọng.

Ví dụ # 5

Bây giờ chúng ta hãy thực hiện Phân tích hồi quy cho nhiều biến độc lập:

Bạn cần dự đoán doanh số của một Điện thoại di động sẽ ra mắt vào năm sau. Bạn có giá và Dân số của các quốc gia đang ảnh hưởng đến doanh số bán điện thoại di động.

Phiên bản điện thoại Bán hàng Định lượng Dân số
CHÚNG TA 63860 858 823
Vương quốc Anh 61841 877 660
KZ 60876 873 631
CH 58188 726 842
HN 52728 864 573
AU 52388 680 809
NZ 51075 728 661
RU 49019 689 778

Thực hiện theo các bước dưới đây để nhận được kết quả hồi quy.

Bước 1. Đầu tiên, tìm ra các biến phụ thuộc và độc lập. Ở đây Doanh số là biến phụ thuộc và số lượng và dân số. Cả hai đều là các biến độc lập vì Doanh số thay đổi theo số lượng và dân số của đất nước.

Bước 2. Vào Tab Dữ liệu - Bấm vào Phân tích dữ liệu - Chọn hồi quy - bấm Ok.

Thao tác này sẽ Mở cửa sổ hồi quy cho bạn.

Bước 3. Nhập Doanh số vào Ô Phạm vi Đầu vào Y và chọn số lượng và dân số trong Ô Phạm vi Đầu vào X. (Kiểm tra Nhãn nếu bạn có tiêu đề trong phạm vi dữ liệu của mình. Chọn tùy chọn đầu ra, sau đó kiểm tra Phần dư mong muốn. Nhấp Ok.

Bây giờ Chạy hồi quy bằng cách sử dụng phân tích dữ liệu trong Tab Dữ liệu. Điều này sẽ cho bạn kết quả bên dưới.

Kết quả tóm tắt

Multiple R: Ở đây, hệ số tương quan là 0,93, rất gần với 1, có nghĩa là mối quan hệ Tuyến tính rất tích cực.

R Square: Giá trị R Square là 0,866, có nghĩa là 86,7% giá trị phù hợp với mô hình.

Ý nghĩa F: Ý nghĩa F nhỏ hơn 0,1, có nghĩa là phương trình hồi quy có giá trị tiên đoán đáng kể.

Giá trị P : Nếu bạn nhìn vào giá trị P cho Số lượng và Dân số, bạn có thể thấy rằng các giá trị nhỏ hơn 0,1, có nghĩa là số lượng và dân số có giá trị dự đoán đáng kể. Càng ít giá trị P có nghĩa là một biến có nhiều giá trị dự đoán quan trọng hơn.

Tuy nhiên, cả số lượng và dân số đều có giá trị dự đoán đáng kể, nhưng Nếu bạn nhìn vào giá trị P cho số lượng và dân số, bạn có thể thấy rằng số lượng có giá trị P thấp hơn trong excel so với Dân số. Điều này có nghĩa là số lượng có giá trị dự đoán quan trọng hơn so với Dân số.

Những điều cần ghi nhớ

  • Luôn kiểm tra các biến Phụ thuộc và Độc lập bất cứ khi nào bạn chọn bất kỳ dữ liệu nào.
  • Phân tích hồi quy tuyến tính xem xét mối quan hệ giữa Giá trị trung bình của các biến.
  • Điều này chỉ mô hình hóa mối quan hệ giữa các biến tuyến tính
  • Đôi khi nó không phù hợp nhất cho một vấn đề trong thế giới thực. Ví dụ: (Tuổi và tiền công). Hầu hết thời gian, Tăng lương khi Tuổi ngày càng tăng. Tuy nhiên, sau khi nghỉ hưu, Tuổi tăng nhưng lương lại giảm.

thú vị bài viết...