Hồi quy (Ý nghĩa, Các loại) - Phân tích hồi quy là gì?

Mục lục

Hồi quy là gì?

Phân tích hồi quy là một phép đo dựa trên thống kê được sử dụng trong tài chính, đầu tư, v.v., nhằm mục đích thiết lập mối quan hệ giữa một biến phụ thuộc và một loạt các biến độc lập khác, và trọng tâm chính là xác định độ bền của mối quan hệ trên.

Giải thích

  • Để giải thích phân tích hồi quy theo thuật ngữ của giáo dân, chúng ta hãy giả sử một trưởng phòng kinh doanh của một công ty đang cố gắng dự báo doanh thu của tháng tiếp theo. Có rất nhiều yếu tố liên quan đến việc thúc đẩy doanh số bán sản phẩm, bắt đầu từ thời tiết đến chiến lược mới của đối thủ cạnh tranh, lễ hội và sự thay đổi trong lối sống của người tiêu dùng.
  • Đây là một phương pháp sắp xếp giữa một số yếu tố ảnh hưởng đến việc bán hàng, đó là những yếu tố có tác động chính. Nó có thể giúp trả lời nhiều câu hỏi như yếu tố nào là quan trọng nhất, yếu tố nào ít quan trọng hơn, mối quan hệ giữa các yếu tố này là gì và quan trọng nhất, độ chắc chắn của các yếu tố này là gì.
  • Các yếu tố này được gọi là các biến. Yếu tố chính mà chúng tôi đang cố gắng dự báo được gọi là biến phụ thuộc và các yếu tố khác có tác động đến biến phụ thuộc được gọi là biến độc lập.

Công thức

Phân tích hồi quy tuyến tính đơn giản trong excel có thể được biểu thị như công thức dưới đây và nó đo lường mối quan hệ giữa một biến phụ thuộc và một biến độc lập.

Y = a + bX + ϵ

Đây:

  • Y - Biến phụ thuộc
  • X - Biến độc lập (giải thích)
  • a - Đánh chặn
  • b - Độ dốc
  • ϵ - Dư (lỗi)

Làm thế nào để diễn giải phân tích hồi quy?

Điều này có thể được giải thích bằng cách giả định một tình huống đơn giản. Ở đây chúng tôi đang xem xét mối quan hệ giữa giá của bộ sưu tập đồ cổ để bán đấu giá và thời gian tồn tại của nó. Một món đồ cổ càng cũ thì giá của nó càng tăng. Giả sử rằng chúng tôi đã thiết lập dữ liệu cho 50 mặt hàng được đấu giá gần đây nhất, chúng tôi có thể dự đoán giá đấu giá trong tương lai dựa trên tuổi của mặt hàng đó là bao nhiêu. Sử dụng dữ liệu này, chúng ta có thể xây dựng một phương trình hồi quy.

Công thức hồi quy có thể thiết lập mối quan hệ giữa tuổi và giá như sau:

y = β0 + β1 x + lỗi
  • Ở đây, yếu tố phụ thuộc là Y. Y đại diện cho giá của mỗi mặt hàng được đấu giá, trong khi yếu tố độc lập là X, xác định độ tuổi.
  • Tham số β0 và β1 là những tham số chưa được biết và sẽ được ước lượng bằng phương trình.
  • β0 là một hằng số được sử dụng để xác định đường xu hướng tuyến tính chặn trục Y.
  • β1 là một hằng số thể hiện mức độ thay đổi giá trị của biến phụ thuộc như một hàm liên quan của sự thay đổi ngụ ý cho các biến độc lập.
  • Về cơ bản đây được gọi là hệ số góc của phương trình. Khi độ dốc là một lớp lót, nó có nghĩa là có mối quan hệ tương xứng giữa tuổi và giá cả, và khi độ dốc là nghịch đảo, nó có nghĩa là mối quan hệ tỷ lệ gián tiếp.
  • Các lỗi có thể được định nghĩa là tiếng ồn hoặc sự thay đổi trong các biến mục tiêu và là ngẫu nhiên trong tự nhiên.

Ví dụ trong đời thực về phân tích hồi quy

Giả sử chúng tôi cần thiết lập mối quan hệ giữa doanh số bán hàng đã xảy ra và số tiền chi cho quảng cáo liên quan đến sản phẩm.

Nhìn chung, chúng ta có thể nhận thấy mối quan hệ thuận chiều giữa số lượng bán hàng và số tiền chi cho quảng cáo. Dựa vào phương trình hồi quy tuyến tính đơn giản, chúng ta có:

Y = a + bX

Giả sử chúng ta nhận được giá trị là

Y = 500 + 30X

Giải thích kết quả:

Độ dốc dự đoán là 30 giúp chúng tôi đưa ra kết luận rằng doanh thu trung bình tăng $ 30 mỗi năm khi chi tiêu cho quảng cáo tăng lên.

Các loại phân tích hồi quy

# 1 - Tuyến tính

Điều này có thể được biểu thị như công thức dưới đây và nó đo lường mối quan hệ giữa một biến phụ thuộc và một biến độc lập.

# 2 - Đa thức

Trong phương pháp này, phân tích được sử dụng để đo lường mối quan hệ giữa các yếu tố phụ thuộc đơn lẻ và nhiều biến độc lập.

# 3 - Hậu cần

Ở đây yếu tố phụ thuộc hoặc biến có bản chất là nhị phân. Các biến độc lập có thể liên tục hoặc nhị phân. Trong hồi quy logistic đa thức, chúng ta có thể có nhiều hơn hai loại trong khi chọn biến độc lập của chúng ta.

# 4 - Lượng tử

Đây là một khái niệm cộng tính của hồi quy tuyến tính và chủ yếu được sử dụng khi có các giá trị ngoại lệ và độ lệch trong dữ liệu.

# 5 - Lưới đàn hồi

Điều này rất hữu ích khi một người đang xử lý các biến độc lập có tương quan rất cao.

# 6 - Hồi quy các thành phần chính (PCR)

Đây là một kỹ thuật có thể áp dụng khi có quá nhiều biến độc lập hoặc đa cộng tuyến tồn tại trong dữ liệu

# 7 - Hình vuông ít nhất một phần (PLS)

Đây là một phương pháp đối lập với thành phần chính mà chúng ta có các biến độc lập có tương quan cao. Nó cũng có thể áp dụng khi có nhiều biến độc lập.

# 8 - Véc tơ hỗ trợ

Điều này có thể cung cấp một giải pháp cho các mô hình tuyến tính và phi tuyến tính. Nó sử dụng các hàm nhân phi tuyến tính để tìm ra giải pháp tối ưu cho các mô hình phi tuyến tính.

# 9 - Bình thường

Nó có thể áp dụng cho việc dự đoán các giá trị được xếp hạng. Về cơ bản, nó phù hợp khi biến phụ thuộc có bản chất là thứ tự

# 10 - Poisson

Điều này có thể áp dụng khi biến phụ thuộc có dữ liệu đếm.

# 11 - Nhị thức phủ định

Nó cũng có thể áp dụng để quản lý dữ liệu đếm rằng hồi quy nhị thức âm không giả sử phân phối số đếm có phương sai bằng giá trị trung bình của nó, trong khi hồi quy Poisson giả định phương sai bằng giá trị trung bình của nó.

# 12 - Quasi Poisson

Nó thay thế cho hồi quy nhị thức âm. Nó cũng có thể áp dụng cho dữ liệu đếm phân tán. Phương sai của mô hình gần như Poisson là một hàm tuyến tính của giá trị trung bình, trong khi phương sai của mô hình nhị thức âm là một hàm bậc hai của giá trị trung bình.

# 13 - Cox

Nó được sử dụng nhiều hơn để phân tích dữ liệu thời gian đến sự kiện.

Sự khác biệt giữa hồi quy và tương quan

  • Hồi quy thiết lập mối quan hệ giữa một phương sai độc lập và một biến phụ thuộc trong đó cả hai biến đều khác nhau, trong khi tương quan xác định mối liên kết hoặc sự phụ thuộc của hai biến mà không có sự khác biệt giữa cả hai biến.
  • Mục tiêu chính của hồi quy là tạo ra một đường phù hợp nhất và ước lượng một biến được thực hiện trên cơ sở các biến khác, trong khi tương quan thể hiện mối quan hệ tuyến tính giữa hai biến.
  • Trong trường hợp này, chúng tôi ước tính độ lớn của một thay đổi nhất định trong biến được công nhận (X) trên biến ước tính (Y), trong khi, trong mối tương quan, hệ số được sử dụng để đo lường mức độ mà hai biến chuyển động cùng nhau.
  • Đây là một quá trình ước tính độ lớn của các biến độc lập ngẫu nhiên dựa trên độ lớn của một biến phụ thuộc tĩnh, trong khi sự tương quan giúp chúng ta quyết định một giá trị cụ thể để thể hiện sự phụ thuộc lẫn nhau giữa cả hai biến.

Phần kết luận

  • Phân tích hồi quy chủ yếu sử dụng dữ liệu để thiết lập mối quan hệ giữa hai hoặc nhiều biến. Ở đây người ta cho rằng các mối quan hệ tồn tại trong quá khứ cũng sẽ phản ánh trong hiện tại hoặc tương lai. Ít ai coi đây là khoảng thời gian trễ giữa quá khứ và hiện tại / tương lai.
  • Tuy nhiên, nó là một kỹ thuật dự báo và ước lượng được sử dụng rộng rãi. Mặc dù nó liên quan đến toán học mà nhiều người dùng có thể thấy khó khăn, nhưng kỹ thuật này tương đối dễ sử dụng, đặc biệt là khi có sẵn một mô hình.

thú vị bài viết...