Công thức tính tương quan
Tương quan là một thước đo thống kê giữa hai biến và được định nghĩa là sự thay đổi của lượng trong một biến tương ứng với thay đổi của một biến khác và nó được tính bằng phép tổng tích của tổng của biến thứ nhất trừ đi giá trị trung bình của biến thứ nhất thành tổng của biến thứ hai trừ đi giá trị trung bình của biến thứ hai chia cho tổng dưới căn bậc hai của biến thứ nhất trừ trung bình của biến thứ nhất thành tổng bình phương của biến thứ hai trừ đi trung bình của biến thứ hai.
Giá trị của mối tương quan được giới hạn giữa -1 và +1 và có thể được hiểu như sau:
- -1: Nếu nó là -1, thì các biến được gọi là tương quan âm hoàn toàn. Điều đó có nghĩa là nếu một biến chuyển động theo một hướng, thì biến khác chuyển động theo hướng ngược lại.
- 0: Điều đó có nghĩa là biến không có bất kỳ mối tương quan nào.
- +1: Nếu là +1, thì các biến được gọi là tương quan thuận hoàn toàn. Cả hai biến đều đang di chuyển theo hướng tích cực.
Nếu chúng ta có 2 biến x và y thì hệ số tương quan giữa 2 biến có thể được tìm thấy là:
Hệ số tương quan = ∑ (x (i) - mean (x)) * (y (i) -mean (y)) / √ (∑ (x (i) -mean (x)) 2 * ∑ (y (i) -mean (y)) 2 )
Ở đâu,
- x (i) = giá trị của x trong mẫu
- Mean (x) = giá trị trung bình của tất cả các giá trị của x
- y (i) = giá trị của y trong mẫu
- Mean (y) = giá trị trung bình của tất cả các giá trị của y
Ví dụ
Thật dễ dàng để tính toán mối tương quan trong Excel. Cú pháp của hàm được sử dụng như sau:
Hệ số tương quan = CORREL (mảng1, mảng2)
Ví dụ 1
Hãy lấy ví dụ tương tự mà chúng tôi đã lấy ở trên để tính toán tương quan bằng excel.
Giải pháp:
Dưới đây là các giá trị của x và y:

Cách tính như sau.

Công thức cơ sở excel = CORREL (mảng (x), mảng (y))

Hệ số = +0,95
Vì hệ số này gần bằng +1, do đó x và y có tương quan thuận rất cao.
Ví dụ số 2
Sự tương quan chủ yếu hữu ích cho việc phân tích giá cổ phiếu của các công ty và tạo danh mục đầu tư chứng khoán dựa trên đó.
Hãy cùng chúng tôi tìm hiểu mối tương quan của cổ phiếu Apple với chỉ số Nasdaq dựa trên kết quả hoạt động của cổ phiếu trong một năm qua. Apple là một công ty đa quốc gia có trụ sở tại Hoa Kỳ chuyên về các sản phẩm CNTT như iPod, iPad, Mac, v.v.
Giải pháp:
Dưới đây là lợi nhuận hàng tháng của cổ phiếu Apple và Nasdaq trong một năm qua:

Bây giờ hãy nhập các giá trị -
Hệ số tương quan = ∑ (x (i) - mean (x)). (Y (i) -mean (y)) / √ ∑ (x (i) -mean (x)) 2 ∑ (y (i) - nghĩa là (y)) 2

Tương quan giữa Apple và Nasdaq = 0,039 / (√0,0039)

Hệ số = 0,62
Vì Tương quan giữa Apple và Nasdaq là tích cực, do đó Apple có tương quan thuận với Nasdaq.
Ví dụ # 3
Bây giờ chúng ta hãy xem xét mối tương quan giữa chỉ số Walmart và Nasdaq dựa trên kết quả hoạt động của cổ phiếu trong một năm qua. Walmart là một công ty có trụ sở tại Hoa Kỳ đang có một chuỗi siêu thị bán lẻ.
Giải pháp:
Dưới đây là hiệu suất hàng tháng giữa Walmart và Nasdaq trong một năm qua-

Bây giờ hãy nhập các giá trị vào công thức:
Hệ số tương quan = ∑ (x (i) - mean (x)). (Y (i) -mean (y)) / √ ∑ (x (i) -mean (x)) 2 ∑ (y (i) - nghĩa là (y)) 2
Do đó, cách tính như sau,

Tương quan giữa Walmart và Nasdaq = 0,0032 / (√0,0346 * 0,0219)

Hệ số = 0,12
Chúng ta có thể thấy rằng Walmart và Nasdaq cũng có tương quan thuận nhưng không bằng nhiều so với tương quan của Apple với Nasdaq.
Liên quan và Sử dụng
Hệ số tương quan hữu ích trong việc thiết lập mối quan hệ tuyến tính giữa hai biến. Nó đo lường cách một biến sẽ di chuyển so với chuyển động của một biến khác. Việc sử dụng thực tế của hệ số này là để tìm ra mối quan hệ giữa biến động giá chứng khoán với biến động thị trường nói chung. Cơ sở của phân tích này, một nhà phân tích chứng khoán, sẽ bao gồm tỷ trọng của các cổ phiếu để tạo ra một danh mục đầu tư tối ưu với rủi ro tối thiểu. Ngoài ra, nó rất hữu ích trong khoa học dữ liệu để tìm ra mối quan hệ giữa 2 biến.
Ngoài ra, hệ số tương quan được sử dụng rất cao để nghiên cứu giá trị cấu trúc của dữ liệu trong phân tích nhân tố. Nó được sử dụng nhiều trong phân tích hồi quy để dự đoán giá trị của các biến phụ thuộc dựa trên mối quan hệ giữa các biến phụ thuộc và độc lập. Phương trình này khá hữu ích trong phân tích định lượng để có được bản chất của mối quan hệ giữa các biến khác nhau. Cơ sở của mối quan hệ này, nếu một biến không liên quan đến các biến khác, thì nó có thể bị loại khỏi danh sách.