Hồi quy tuyến tính là gì?
Hồi quy tuyến tính về cơ bản là một kỹ thuật mô hình thống kê được sử dụng để chỉ ra mối quan hệ giữa một biến phụ thuộc và một hoặc nhiều biến độc lập. Đây là một trong những kiểu phân tích dự đoán phổ biến nhất. Loại phân phối này hình thành trong một dòng do đó được gọi là hồi quy tuyến tính. Trong bài viết này, chúng tôi sẽ lấy các ví dụ về Phân tích hồi quy tuyến tính trong Excel.
Để thực hiện phân tích hồi quy tuyến tính trước tiên, chúng ta cần thêm phần bổ trợ excel theo các bước sau.
Nhấp vào Tệp - Tùy chọn (Thao tác này sẽ mở Cửa sổ bật lên Tùy chọn Excel cho bạn).

Nhấp vào Phần bổ trợ - Chọn Phần bổ trợ Excel từ Quản lý thả xuống trong excel, sau đó Nhấp vào Tiếp tục.

Thao tác này sẽ mở Cửa sổ bật lên bổ trợ. Chọn Analysis ToolPak rồi nhấp vào Ok.

Phần bổ trợ Phân tích Dữ liệu sẽ xuất hiện trong Tab Chèn.

Hãy cho chúng tôi hiểu bằng các Ví dụ dưới đây về phân tích hồi quy tuyến tính trong excel.
Ví dụ về phân tích hồi quy tuyến tính
Ví dụ 1
Giả sử chúng ta có doanh số hàng tháng và chi tiêu cho tiếp thị cho năm ngoái và bây giờ chúng ta cần dự đoán doanh số bán hàng trong tương lai trên cơ sở doanh số bán hàng và tiếp thị đã chi tiêu của năm ngoái.
tháng | Quảng cáo | Bán hàng |
tháng một | 40937 | 502729 |
Tháng hai | 42376 | 507553 |
Mar | 43355 | 516885 |
Tháng tư | 44126 | 528347 |
có thể | 45060 | 537298 |
Tháng sáu | 49546 | 544066 |
Thg 7 | 56105 | 553664 |
Tháng 8 | 59322 | 563201 |
Tháng chín | 59877 | 568657 |
Tháng 10 | 60481 | 569384 |
Tháng 11 | 62356 | 573764 |
Tháng mười hai | 63246 | 582746 |
Nhấp vào Phân tích dữ liệu trong Tab Dữ liệu và thao tác này sẽ mở Cửa sổ bật lên Phân tích Dữ liệu cho bạn.

Bây giờ chọn Hồi quy từ danh sách và nhấp vào Ok.

Cửa sổ bật lên hồi quy sẽ mở ra.

Chọn Phạm vi bán hàng $ C $ 1: $ C $ 13 trong hộp trục Y vì đây là biến phụ thuộc và $ B $ 1: $ B $ 14 trong trục X vì chi phí quảng cáo là biến độc lập.

Đánh dấu chọn trên hộp Nhãn nếu bạn đã chọn tiêu đề trong dữ liệu khác, nó sẽ báo lỗi cho bạn.

Chọn Phạm vi đầu ra nếu bạn muốn nhận giá trị trên phạm vi cụ thể trên trang tính khác, hãy chọn Bảng tính mới Ply: và thao tác này sẽ thêm một trang tính mới và cung cấp cho bạn kết quả.

Sau đó đánh dấu vào ô Phần dư và nhấp vào Ok.

Thao tác này sẽ thêm các trang tính và cung cấp cho bạn kết quả sau.

Hãy để chúng tôi hiểu đầu ra.
Kết quả tóm tắt
Multiple R: Điều này thể hiện hệ số tương quan. Giá trị 1 cho thấy mối quan hệ tích cực và giá trị 0 cho thấy không có mối quan hệ nào.
R Square: R Square đại diện cho hệ số xác định. Điều này cho bạn biết phần trăm điểm rơi trên đường hồi quy. 0,49 có nghĩa là 49% giá trị phù hợp với mô hình
Hình vuông R điều chỉnh : Đây là hình vuông R điều chỉnh, yêu cầu khi bạn có nhiều hơn một biến X.
Lỗi tiêu chuẩn: Điều này thể hiện ước tính về độ lệch tiêu chuẩn của sai số. Đây là độ chính xác mà hệ số hồi quy được đo.
Số lần quan sát: Đây là số lần quan sát mà bạn đã thực hiện trong một mẫu.
ANOVA - Df: Mức độ tự do
SS: Tổng hình vuông.
MS: chúng tôi có hai MS
- Hồi quy MS là Hồi quy SS / Hồi quy Df.
- MS dư là sai số bình phương trung bình (SS dư / Df dư).
F: F kiểm định cho giả thuyết không.
Significance F: P-Values liên quan đến Significance
Hệ số: Hệ số cho bạn ước tính số bình phương nhỏ nhất.
T Thống kê: T Thống kê cho giả thuyết rỗng so với giả thuyết thay thế.
P-Value: Đây là giá trị p cho kiểm định giả thuyết.
Dưới 95% và Trên 95%: Đây là ranh giới dưới và ranh giới trên của khoảng tin cậy
Kết quả còn lại: Chúng tôi có 12 quan sát dựa trên dữ liệu. 2 nd cột đại diện bán hàng dự đoán và 3 thứ Dư cột. Phần còn lại về cơ bản là sự khác biệt về doanh số dự đoán so với thực tế.
Ví dụ số 2
Chọn cột tiếp thị và bán hàng được dự đoán

Chuyển đến nhóm biểu đồ trong tab chèn. Chọn biểu tượng biểu đồ phân tán

Thao tác này sẽ chèn biểu đồ phân tán trong excel. Xem hình ảnh bên dưới

Nhấp chuột phải vào bất kỳ điểm nào rồi chọn Thêm đường xu hướng trong excel. Điều này sẽ thêm một đường xu hướng vào biểu đồ của bạn.


- Bạn có thể định dạng đường xu hướng bằng cách nhấp chuột phải vào bất kỳ đâu trên đường xu hướng và sau đó chọn định dạng đường xu hướng.
- Bạn có thể thực hiện nhiều cải tiến hơn cho biểu đồ. tức là, định dạng đường xu hướng, màu sắc và thay đổi tiêu đề, v.v.
- Bạn cũng có thể hiển thị công thức trên biểu đồ bằng cách chọn trong Hiển thị công thức trên biểu đồ và hiển thị giá trị bình phương R trên biểu đồ.
Một số ví dụ khác về phân tích hồi quy tuyến tính:
- Dự đoán về Ô bán được dựa trên Mưa xảy ra ở Khu vực.
- Dự đoán về lượng AC được bán dựa trên Nhiệt độ vào mùa hè.
- Trong mùa thi, doanh số bán Văn phòng phẩm, Sách hướng dẫn thi tăng.
- Dự đoán về doanh số bán hàng khi Quảng cáo đã thực hiện dựa trên chuỗi TRP cao nơi quảng cáo được thực hiện, Mức độ phổ biến của Đại sứ thương hiệu và Tỷ lệ chân tại nơi giữ nơi quảng cáo được xuất bản.
- Bán nhà dựa trên Vị trí, Diện tích và giá cả.
Ví dụ # 3
Giả sử chúng ta có chín học sinh với chỉ số IQ của họ và số điểm họ đạt được trong Bài kiểm tra.
Sinh viên | Điểm kiểm tra | CHỈ SỐ THÔNG MINH |
Ram | 100 | 145 |
Shyam | 97 | 140 |
Kul | 93 | 130 |
Kappu | 91 | 125 |
Raju | 89 | 115 |
Vishal | 86 | 110 |
Vivek | 82 | 100 |
Vinay | 78 | 95 |
Kumar | 75 | 90 |
Bước 1: Đầu tiên, tìm ra các biến phụ thuộc và biến độc lập. Ở đây Điểm kiểm tra là biến phụ thuộc và IQ là biến độc lập vì Điểm kiểm tra thay đổi khi IQ thay đổi.
Bước 2: Vào Tab Dữ liệu - Bấm vào Phân tích dữ liệu - Chọn hồi quy - bấm Ok.

Thao tác này sẽ Mở cửa sổ hồi quy cho bạn.

Bước 3. Nhập phạm vi Điểm kiểm tra trong Ô phạm vi Y đầu vào và IQ trong Ô phạm vi đầu vào X. (Kiểm tra Nhãn nếu bạn có tiêu đề trong phạm vi dữ liệu của mình. Chọn tùy chọn đầu ra, sau đó kiểm tra Phần dư mong muốn. Nhấp Ok.

Bạn sẽ nhận được kết quả tóm tắt được hiển thị trong Hình ảnh bên dưới.

Bước 4: Phân tích hồi quy theo kết quả tóm tắt
Kết quả tóm tắt
Multiple R: Ở đây, hệ số tương quan là 0,99, rất gần với 1, có nghĩa là mối quan hệ Tuyến tính rất tích cực.
R Square: Giá trị R Square là 0,983, có nghĩa là 98,3% giá trị phù hợp với mô hình.
Giá trị P: Ở đây, giá trị P là 1,86881E-07, rất nhỏ hơn 0,1, có nghĩa là IQ có giá trị dự đoán quan trọng.
Xem biểu đồ bên dưới.

Bạn có thể thấy rằng hầu hết tất cả các điểm đều nằm trong đường thẳng hoặc đường xu hướng gần đó.
Ví dụ # 4
Chúng tôi cần dự đoán doanh số bán hàng của AC dựa trên doanh số bán hàng và nhiệt độ trong một tháng khác nhau.
tháng | Nhiệt độ | Bán hàng |
tháng một | 25 | 38893 |
Tháng hai | 28 | 42254 |
Mar | 31 | 42845 |
Tháng tư | 33 | 47917 |
có thể | 37 | 51243 |
Tháng sáu | 40 | 69588 |
Thg 7 | 38 | 56570 |
Tháng 8 | 37 | 50000 |
Thực hiện theo các bước dưới đây để nhận được kết quả hồi quy.
Bước 1: Đầu tiên, tìm ra các biến phụ thuộc và biến độc lập. Ở đây Doanh số là biến phụ thuộc và Nhiệt độ là biến độc lập vì Doanh số thay đổi khi Nhiệt độ thay đổi.
Bước 2: Vào Tab Dữ liệu - Bấm vào Phân tích dữ liệu - Chọn hồi quy - bấm Ok.

Thao tác này sẽ Mở cửa sổ hồi quy cho bạn.

Bước 3. Nhập Doanh số vào Ô Phạm vi Y đầu vào và Nhiệt độ trong Ô Phạm vi Đầu vào X. (Kiểm tra Nhãn nếu bạn có tiêu đề trong phạm vi dữ liệu của mình. Chọn tùy chọn đầu ra, sau đó kiểm tra Phần dư mong muốn. Nhấp Ok.

Điều này sẽ cung cấp cho bạn kết quả tóm tắt như bên dưới.

Bước 4: Phân tích kết quả.
Multiple R: Ở đây, hệ số tương quan là 0,877, gần bằng 1, có nghĩa là mối quan hệ Tuyến tính là dương.
R Square: R Square value là 0,770, có nghĩa là 77% giá trị phù hợp với mô hình
Giá trị P: Ở đây, giá trị P là 1,86881E-07, rất nhỏ hơn 0,1, có nghĩa là IQ có giá trị dự đoán quan trọng.
Ví dụ # 5
Bây giờ chúng ta hãy thực hiện Phân tích hồi quy cho nhiều biến độc lập:
Bạn cần dự đoán doanh số của một Điện thoại di động sẽ ra mắt vào năm sau. Bạn có giá và Dân số của các quốc gia đang ảnh hưởng đến doanh số bán điện thoại di động.
Phiên bản điện thoại | Bán hàng | Định lượng | Dân số |
CHÚNG TA | 63860 | 858 | 823 |
Vương quốc Anh | 61841 | 877 | 660 |
KZ | 60876 | 873 | 631 |
CH | 58188 | 726 | 842 |
HN | 52728 | 864 | 573 |
AU | 52388 | 680 | 809 |
NZ | 51075 | 728 | 661 |
RU | 49019 | 689 | 778 |
Thực hiện theo các bước dưới đây để nhận được kết quả hồi quy.
Bước 1. Đầu tiên, tìm ra các biến phụ thuộc và độc lập. Ở đây Doanh số là biến phụ thuộc và số lượng và dân số. Cả hai đều là các biến độc lập vì Doanh số thay đổi theo số lượng và dân số của đất nước.
Bước 2. Vào Tab Dữ liệu - Bấm vào Phân tích dữ liệu - Chọn hồi quy - bấm Ok.

Thao tác này sẽ Mở cửa sổ hồi quy cho bạn.

Bước 3. Nhập Doanh số vào Ô Phạm vi Đầu vào Y và chọn số lượng và dân số trong Ô Phạm vi Đầu vào X. (Kiểm tra Nhãn nếu bạn có tiêu đề trong phạm vi dữ liệu của mình. Chọn tùy chọn đầu ra, sau đó kiểm tra Phần dư mong muốn. Nhấp Ok.

Bây giờ Chạy hồi quy bằng cách sử dụng phân tích dữ liệu trong Tab Dữ liệu. Điều này sẽ cho bạn kết quả bên dưới.
Kết quả tóm tắt
Multiple R: Ở đây, hệ số tương quan là 0,93, rất gần với 1, có nghĩa là mối quan hệ Tuyến tính rất tích cực.
R Square: Giá trị R Square là 0,866, có nghĩa là 86,7% giá trị phù hợp với mô hình.
Ý nghĩa F: Ý nghĩa F nhỏ hơn 0,1, có nghĩa là phương trình hồi quy có giá trị tiên đoán đáng kể.
Giá trị P : Nếu bạn nhìn vào giá trị P cho Số lượng và Dân số, bạn có thể thấy rằng các giá trị nhỏ hơn 0,1, có nghĩa là số lượng và dân số có giá trị dự đoán đáng kể. Càng ít giá trị P có nghĩa là một biến có nhiều giá trị dự đoán quan trọng hơn.
Tuy nhiên, cả số lượng và dân số đều có giá trị dự đoán đáng kể, nhưng Nếu bạn nhìn vào giá trị P cho số lượng và dân số, bạn có thể thấy rằng số lượng có giá trị P thấp hơn trong excel so với Dân số. Điều này có nghĩa là số lượng có giá trị dự đoán quan trọng hơn so với Dân số.
Những điều cần ghi nhớ
- Luôn kiểm tra các biến Phụ thuộc và Độc lập bất cứ khi nào bạn chọn bất kỳ dữ liệu nào.
- Phân tích hồi quy tuyến tính xem xét mối quan hệ giữa Giá trị trung bình của các biến.
- Điều này chỉ mô hình hóa mối quan hệ giữa các biến tuyến tính
- Đôi khi nó không phù hợp nhất cho một vấn đề trong thế giới thực. Ví dụ: (Tuổi và tiền công). Hầu hết thời gian, Tăng lương khi Tuổi ngày càng tăng. Tuy nhiên, sau khi nghỉ hưu, Tuổi tăng nhưng lương lại giảm.