1은 상관계수를 보여준다. 상관 분석. 온라인 계산기를 사용하여 상관 계수 계산

상관관계는 2개 이상의 독립적인 현상 사이의 연결 정도입니다.

상관관계는 긍정적일 수도 있고 부정적일 수도 있습니다.

양의 상관관계(직접)두 변수가 동일한 방향(양수 또는 음수)으로 동시에 변경될 때 발생합니다. 예를 들어, 검색 결과를 통해 사이트를 방문하는 사용자 수와 서버 부하 간의 관계: 사용자가 많을수록 부하도 커집니다.

상관관계는 음수(역)입니다., 한 수량의 변화가 다른 수량의 반대 변화로 이어지는 경우. 예를 들어, 기업의 세금 부담이 증가하면 이익은 감소합니다. 세금이 많을수록 개발 자금은 줄어듭니다.

통계 도구로서 상관관계의 효율성은 상관계수를 사용하여 두 변수 간의 관계를 표현하는 능력에 있습니다.

상관계수(CC)는 -1부터 1까지의 숫자 범위에 있습니다.

CC 값이 1이면 첫 번째 변수가 변경될 때마다 두 번째 변수에서도 동일한 변화가 동일한 방향으로 발생한다는 것을 이해해야 합니다.


CC 값이 -1이면 각 변경마다 반대 방향으로 두 번째 변수에 등가 변경이 발생합니다.


상관 관계가 -1 또는 1에 가까울수록 변수 간의 관계가 더 강해집니다. 값이 0(또는 0에 가까움)이면 두 변수 사이에 유의미한 관계가 없거나 매우 적습니다.

이 통계 정보 처리 방법은 QC 계산의 단순성, 결과 해석의 용이성 및 높은 수준의 수학 기술이 필요하지 않기 때문에 경제, 공학, 사회 및 기타 과학 분야에서 널리 사용됩니다.

상관관계는 변수 간의 관계만 반영할 뿐 인과관계를 나타내지는 않습니다. 두 변수 간의 양수 또는 음수 상관관계가 반드시 한 변수의 변화가 다른 변수의 변화를 초래한다는 것을 의미하지는 않습니다.

예를 들어, 영업 관리자의 급여 인상과 고객과의 작업 품질(서비스 품질 향상, 이의 제기에 대한 작업, 경쟁사와 비교하여 제품의 긍정적인 품질 파악) 사이에는 적절한 직원과 긍정적인 상관 관계가 있습니다. 동기 부여. 판매량이 증가하고 그에 따른 관리자의 급여가 증가한다고 해서 관리자가 고객과의 작업 품질이 향상되었음을 의미하는 것은 아닙니다. 실수로 대량주문이 들어와 배송이 되었거나, 마케팅 부서에서 광고 예산을 늘렸거나, 다른 일이 발생했을 가능성이 높습니다.

아마도 상관관계의 유무에 영향을 미치는 세 번째 변수가 있을 수 있습니다.

상관 계수는 계산되지 않습니다.

  • 두 변수 사이의 관계가 선형이 아닌 경우(예: 2차)
  • 데이터에는 각 사례에 대해 1개 이상의 관측치가 포함되어 있습니다.
  • 비정상적인 관찰이 있습니다(이상치, "이상치").
  • 데이터에는 별개의 관측치 하위 그룹이 포함되어 있습니다.

" 통계

심리학의 통계 및 데이터 처리
(계속)

상관관계 분석

공부할 때 상관관계동일한 표본에 있는 두 지표 사이에 어떤 관계가 있는지 확인하려고 합니다(예: 어린이의 키와 몸무게 또는 어린이의 평균 수준 사이). IQ및 학교 성적) 또는 두 개의 서로 다른 표본 간(예: 쌍둥이 쌍을 비교할 때), 이 관계가 존재하는 경우 한 지표의 증가가 증가(양의 상관 관계) 또는 감소(음의 상관 관계)를 동반하는지 여부 다른 하나.

즉, 상관 분석은 한 지표의 가능한 값을 예측하고 다른 지표의 값을 아는 것이 가능한지 여부를 설정하는 데 도움이 됩니다.

지금까지 우리는 마리화나의 효과를 연구한 경험 결과를 분석할 때 반응 시간과 같은 지표를 의도적으로 무시해 왔습니다. 한편, 반응의 효율성과 속도 사이에 연관성이 있는지 확인하는 것도 흥미로울 것입니다. 예를 들어, 이는 사람이 느릴수록 그의 행동이 더 정확하고 효율적이며 그 반대의 경우도 마찬가지라고 주장할 수 있습니다.

이를 위해 Bravais-Pearson 계수(r)를 계산하는 모수적 방법과 순서 데이터에 적용되는 Spearman 순위 상관 계수(rs)의 계산이라는 두 가지 방법을 사용할 수 있습니다. 비모수적입니다. 하지만 먼저 상관계수가 무엇인지부터 알아보겠습니다.

상관계수

상관계수는 +1에서 -1까지 변할 수 있는 값이다. 이 계수는 완전한 양의 상관관계인 경우 +1과 같고, 완전한 음의 상관관계인 경우에는 -1이다. 그래프에서 이는 값들의 교점을 지나는 직선에 해당한다. ​​각 데이터 쌍의 경우:

이러한 점이 직선으로 정렬되지 않고 "구름"을 형성하는 경우 절대값의 상관 계수는 1보다 작아지고 이 구름이 반올림됨에 따라 0에 가까워집니다.

상관 계수가 0이면 두 변수는 서로 완전히 독립적입니다.

인문학에서는 계수가 0.60보다 크면 상관관계가 강한 것으로 간주됩니다. 0.90을 초과하면 상관관계가 매우 강한 것으로 간주됩니다. 그러나 변수 간의 관계에 대한 결론을 도출하려면 표본 크기가 매우 중요합니다. 표본이 클수록 얻은 상관 계수 값의 신뢰성이 높아집니다. 다양한 자유도에 대한 Bravais-Pearson 및 Spearman 상관 계수의 임계값이 포함된 테이블이 있습니다(쌍 수에서 2를 뺀 것과 같습니다. 즉, N- 2). 상관 계수가 이러한 임계 값보다 큰 경우에만 신뢰할 수 있는 것으로 간주될 수 있습니다. 따라서 상관계수 0.70을 신뢰할 수 있으려면 최소 8쌍의 데이터를 분석에 포함해야 합니다. (시간 =n-2=6) r(부록의 표 4 참조)과 7쌍의 데이터(h = n-2= 5) rs를 계산할 때(부록의 표 5)

나는 이 두 계수의 본질이 다소 다르다는 점을 다시 한 번 강조하고 싶다. 음의 계수 r은 반응 시간이 짧을수록 성능이 더 높아지는 경향이 있음을 나타내는 반면, 계수 r s를 계산하려면 더 빠른 피험자가 항상 더 정확하게 반응하고 느린 피험자가 덜 정확하게 반응하는지 여부를 확인해야 합니다.

Bravais-Pearson 상관계수(r) - 이는 두 측정 결과의 평균 및 표준 편차를 비교하는 계산을 위한 매개변수 지표입니다. 이 경우 그들은 다음 공식을 사용합니다(저자마다 다르게 보일 수 있음).

여기서 Σ XY-각 쌍의 데이터 곱의 합계
n개의 쌍;
X - 주어진 변수의 평균 엑스;
와이 - 주어진 변수에 대한 평균 와이
S x -
분포의 표준편차 엑스;
Sy-
분포의 표준편차 ~에

Spearman의 순위 상관 계수( RS ) - 이는 두 측정 시리즈에서 해당 수량 순위 간의 관계를 식별하는 데 도움이 되는 비모수적 지표입니다.

이 계수는 계산하기 쉽지만 r을 사용하는 것보다 결과의 정확도가 떨어집니다. 이는 Spearman 계수를 계산할 때 데이터의 정량적 특성과 클래스 간 간격이 아닌 데이터의 순서가 사용된다는 사실 때문입니다.

사실은 Spearman 순위 상관 계수(rs)를 사용할 때 특정 샘플의 데이터 순위가 첫 번째 데이터와 쌍으로 관련된 이 샘플의 다른 여러 데이터와 동일한지 여부만 확인합니다(예: 예를 들어 심리학과 수학을 모두 수강할 때 동일한 "등급" 학생이 될지, 아니면 두 명의 다른 심리학 교사와 함께 수강할지 여부). 계수가 +1에 가까우면 두 계열이 실질적으로 동일하다는 의미이고, 이 계수가 -1에 가까우면 완전한 역관계에 대해 이야기할 수 있습니다.

계수 RS공식으로 계산

어디 - 특징의 켤레 값 순위(부호에 관계없이) 및 - 쌍 수 사이의 차이.

일반적으로 이 비모수적 테스트는 다음에 대해 그리 많지 않은 결론을 도출해야 하는 경우에 사용됩니다. 간격데이터 사이에 얼마나 많은지 순위,또한 분포 곡선이 너무 치우쳐 계수 r과 같은 모수적 기준을 사용할 수 없는 경우(이 경우 정량 데이터를 순서 데이터로 변환해야 할 수도 있음)

재개하다

그래서 지금까지 심리학에서 사용되는 다양한 모수적, 비모수적 통계 방법을 살펴보았습니다. 우리의 리뷰는 매우 피상적이었고 주요 임무는 통계가 보이는 것만큼 무섭지 않고 대부분 상식이 필요하다는 것을 독자에게 이해시키는 것이었습니다. 여기서 다룬 "경험" 데이터는 허구이며 어떤 결론의 기초가 될 수 없음을 상기시켜 드립니다. 그러나 그러한 실험은 실제로 수행할 가치가 있을 것입니다. 이 실험에서는 순전히 고전적인 기술이 선택되었으므로 동일한 통계 분석을 다양한 실험에 사용할 수 있습니다. 어쨌든, 우리는 얻은 결과에 대한 통계적 분석을 어디서부터 시작해야 할지 모르는 사람들에게 유용할 수 있는 몇 가지 주요 방향을 설명한 것 같습니다.

문학

  1. 고드프로이 J.심리학이란 무엇입니까? -엠., 1992.
  2. Chatillon G., 1977. Statistique en Sciences humaines, Trois-Rivieres, Ed. SMG.
  3. 길버트 N.. 1978. 통계, 몬트리올, Ed. HRW.
  4. 모로니 M.J., 1970. Comprendre la statistique, Verviers, Gerard et Cie.
  5. 시겔 S., 1956. 비모수 통계, 뉴욕, MacGraw-Hill Book Co.

테이블 앱

메모 1) 표본이 크거나 유의수준이 0.05 미만인 경우에는 통계교과서의 표를 참고하시기 바랍니다.

2) 기타 비모수적 기준에 대한 값 표는 특별 매뉴얼에서 찾을 수 있습니다(참고문헌 참조).

표 1. 기준 값 학생의 시험
시간 0,05
1 6,31
2 2,92
3 2,35
4 2,13
5 2,02
6 1,94
7 1,90
8 1,86
9 1,83
10 1,81
11 1,80
12 1,78
13 1,77
14 1,76
15 1,75
16 1,75
17 1,74
18 1,73
19 1,73
20 1,73
21 1,72
22 1,72
23 1,71
24 1,71
25 1,71
26 1,71
27 1,70
28 1,70
29 1,70
30 1,70
40 1,68
¥ 1,65
표 2. χ 2 기준의 값
시간 0,05
1 3,84
2 5,99
3 7,81
4 9,49
5 11,1
6 12,6
7 14,1
8 15,5
9 16,9
10 18,3
표 3. 중요한 Z 값
아르 자형
0,05 1,64
0,01 2,33
표 4. 신뢰할 수 있는(중요) r 값
h =(N-2) 피= 0,05 (5%)
3 0,88
4 0,81
5 0,75
6 0,71
7 0,67
8 0,63
9 0,60
10 0,58
11 0.55
12 0,53
13 0,51
14 0,50
15 0,48
16 0,47
17 0,46
18 0,44
19 0,43
20 0,42
표 5. r s의 신뢰할 수 있는(중요) 값
h =(N-2) 피 = 0,05
2 1,000
3 0,900
4 0,829
5 0,714
6 0,643
7 0,600
8 0,564
10 0,506
12 0,456
14 0,425
16 0,399
18 0,377
20 0,359
22 0,343
24 0,329
26 0,317
28 0,306

상관계수

지금까지 우리는 두 특성 사이에 통계적 관계가 존재한다는 사실만 명확히 했습니다. 다음으로, 우리는 이러한 의존성의 강점과 약점, 그리고 그 유형과 방향에 대해 어떤 결론을 내릴 수 있는지 알아내려고 노력할 것입니다. 변수 간의 관계를 정량화하는 기준을 상관 계수 또는 연결성 척도라고 합니다. 두 변수 사이에 직접적인 단방향 관계가 있는 경우 두 변수는 양의 상관 관계가 있습니다. 단방향 관계에서는 한 변수의 작은 값이 다른 변수의 작은 값에 대응되고, 큰 값이 큰 값에 대응됩니다. 두 변수 사이에 역의 다방향 관계가 있는 경우 두 변수는 서로 음의 상관 관계를 갖습니다. 다방향 관계에서는 한 변수의 작은 값이 다른 변수의 큰 값에 해당하고 그 반대도 마찬가지입니다. 상관 계수의 값은 항상 -1에서 +1 사이의 범위에 있습니다.

에 속하는 변수 간의 상관계수로는 서수규모가 적용됩니다 스피어만 계수및 다음에 속하는 변수의 경우 간격규모 - 피어슨 상관 계수(작업의 순간). 각 이분형 변수, 즉 명목 척도에 속하고 두 개의 범주를 갖는 변수는 다음과 같이 간주될 수 있다는 점을 고려해야 합니다. 서수.

먼저, studium.sav 파일을 통해 성별과 정신 변수 사이에 상관관계가 있는지 확인하겠습니다. 이 경우 이분형 변수는 섹스순서대로 간주될 수 있다. 다음 단계를 따르세요.

    명령 메뉴에서 기술 통계 교차 분석 분석...을 선택합니다.

    변수 이동 섹스문자열 목록 및 변수 프시케- 열 목록.

    버튼을 클릭하세요 통계... (통계). 교차 분석: 통계 대화 상자에서 상관관계 확인란을 선택합니다. 계속 버튼을 눌러 선택을 확인하세요.

    대화 중 교차 분석표테이블 표시 안 함 확인란을 선택하여 테이블 표시를 거부합니다. 확인을 클릭하세요.

Spearman 및 Pearson 상관 계수가 계산되고 그 중요성이 테스트됩니다.

대칭 측정

무증상 표준 오류(a)(점근적 표준 오류) 대략. T(b)(대략 T) 대략. 시그. (대략적인 의미)
간격 별 간격 피어슨의 R
(R 피어슨)
,441 ,081 5,006 .000(초)
서수별 서수(서수 - 서수) 스피어맨 상관관계 ,439 ,083 4,987 .000(초)
유효한 경우 N개 106

여기에는 간격척도변수가 없으므로 Spearman 상관계수를 살펴보겠습니다. 이는 0.439이며 최대로 유의미합니다(p<0,001).

상관 계수 값을 구두로 설명하기 위해 다음 표가 사용됩니다.

위의 표를 바탕으로 다음과 같은 결론을 내릴 수 있습니다. 성별과 정신 변수 사이에는 약한 상관관계가 있으며(의존의 강도에 대한 결론), 변수는 긍정적인 상관관계가 있습니다(의존의 방향에 대한 결론).

정신 변수에서 값이 작을수록 부정적인 정신 상태에 해당하고, 값이 클수록 긍정적인 정신 상태에 해당합니다. 성별 변수에서 값 "1"은 여성 성별에 해당하고 "2"는 남성 성별에 해당합니다.

결과적으로, 관계의 일방향성은 다음과 같이 해석될 수 있습니다. 여학생은 남학생보다 자신의 정신 상태를 더 부정적으로 평가하거나, 그러한 해석을 수행할 때 그러한 평가에 동의하는 경향이 더 높습니다. 이에 대한 자세한 내용은 섹션 15.3을 참조하세요.

이제 변경 변수와 학기 변수 간의 상관 관계를 확인해 보겠습니다. 위에서 설명한 방법을 적용해 보겠습니다. 우리는 다음과 같은 계수를 얻습니다.

대칭 측정

무증상 표준 오류(a)

간격 별 간격

서수별 서수

스피어맨 상관관계

유효한 사례 N개

에이. 귀무가설을 가정하지 않음.

이자형. 귀무가설을 가정하고 점근적 표준오차를 사용합니다.

와 함께. 정규 근사를 기반으로 합니다.

변경 변수와 학기 변수는 미터법이므로 피어슨 계수(곱의 모멘트)를 고려해 보겠습니다. 0.807이다. 변경변수와 학기변수 사이에는 강한 상관관계가 있습니다. 변수는 양의 상관관계가 있습니다. 결과적으로 고학년 학생들은 고학년에 공부하는데 이는 실제로 예상치 못한 결론이 아닙니다.

변수 sozial(사회적 지위 평가)과 psyche의 상관관계를 확인해 보겠습니다. 우리는 다음과 같은 계수를 얻습니다.

대칭 측정

무증상 표준 오류(a)

간격 별 간격

서수별 서수

스피어맨 상관관계

유효한 사례 N개

에이. 귀무가설을 가정하지 않음.

비. 귀무가설을 가정하고 점근적 표준오차를 사용합니다.

와 함께. 정규 근사를 기반으로 합니다.

이 경우 Spearman 상관 계수를 살펴보겠습니다. -0.703이다. 사회 변수와 정신 변수 사이에는 중간에서 강한 상관관계가 있습니다(컷오프 값 0.7). 변수들은 음의 상관관계를 가지고 있습니다. 즉, 첫 번째 변수의 값이 높을수록 두 번째 변수의 값은 낮아지고 그 반대의 경우도 마찬가지입니다. 사회 변수의 작은 값은 긍정적인 상태(1 = 매우 좋음, 2 = 좋음)를 특징으로 하고, 정신의 큰 값은 부정적인 상태(1 = 극도로 불안정, 2 = 불안정)를 특징으로 하므로 심리적 어려움 주로 사회적 문제로 인해 발생합니다.

여기서 x·y, x, y는 샘플의 평균값이고; σ(x), σ(y) - 표준 편차.
게다가, 피어슨 선형쌍 상관계수는 회귀 계수 b: 를 통해 결정될 수 있습니다. 여기서 σ(x)=S(x), σ(y)=S(y) - 표준 편차, b - 회귀 방정식 y=a+bx에서 x 앞의 계수입니다.

기타 수식 옵션:
또는

K xy - 상관 모멘트(공분산 계수)

선형 Pearson 상관 계수를 찾으려면 표본 평균 x와 y와 해당 표준 편차 σ x = S(x), σ y = S(y)를 찾아야 합니다.

선형 상관 계수는 관계가 있음을 나타내며 -1에서 +1 사이의 값을 갖습니다(Chaddock 척도 참조). 예를 들어, 두 변수 사이의 선형 상관관계의 근접성을 분석할 때 –1과 같은 쌍의 선형 상관 계수가 얻어졌습니다. 이는 변수 간에 정확한 역선형 관계가 있음을 의미합니다.

주어진 샘플 평균을 사용하거나 직접 상관 계수 값을 계산할 수 있습니다.

Xy#x #y #σ x #σ y " data-id="a;b;c;d;e" data-formul="(a-b*c)/(d*e)" data-r="r xy ">당신의 가치를 계산하세요

상관계수의 기하학적 의미: r xy는 두 회귀선(y(x) 및 x(y))의 기울기가 얼마나 다른지, 그리고 x와 y의 편차를 최소화한 결과가 얼마나 다른지 보여줍니다. 선 사이의 각도가 클수록 r xy가 커집니다.
상관계수의 부호는 회귀계수의 부호와 일치하며 회귀선의 기울기를 결정합니다. 즉 의존성의 일반적인 방향(증가 또는 감소). 상관계수의 절대값은 회귀선에 대한 점의 근접 정도에 따라 결정됩니다.

상관계수의 속성

  1. |r xy | ≤ 1;
  2. X와 Y가 독립이면 r xy =0이면 그 반대가 항상 참인 것은 아닙니다.
  3. |r xy |=1이면 Y=aX+b, |r xy (X,aX+b)|=1입니다. 여기서 a와 b는 상수, a ≠ 0입니다.
  4. |r xy (X,Y)|=|r xy (a 1 X+b 1, a 2 X+b 2)|, 여기서 a 1, a 2, b 1, b 2는 상수입니다.

그러므로 통신 방향 확인 Pearson 상관 계수를 사용하여 가설 검정을 선택하고 다음을 사용하여 신뢰성을 추가로 검증합니다. t-테스트(아래 예 참조).

일반적인 작업(비선형 회귀 참조)

일반적인 작업
작업 기계화 수준 x(%)에 대한 노동 생산성 y의 의존성은 14개 산업 기업의 데이터에 따라 연구되었습니다. 통계 데이터가 표에 표시됩니다.
필수의:
1) x에 대한 선형 회귀 매개변수 y의 추정치를 찾습니다. 산점도를 구성하고 산점도에 회귀선을 그립니다.
2) 유의수준 α=0.05에서 관찰결과와 선형회귀가 일치한다는 가설을 검증한다.
3) 신뢰도 γ=0.95에서 선형 회귀 매개변수에 대한 신뢰 구간을 찾습니다.

이 계산기에는 다음 사항도 사용됩니다.
다중 회귀 방정식

예. 부록 1에 제공된 데이터와 귀하의 옵션(표 2)에 따라 다음이 필요합니다.

  1. 선형 쌍 상관 계수를 계산하고 한 특성과 다른 특성의 선형 쌍 회귀에 대한 방정식을 구성합니다. 귀하의 옵션에 해당하는 특성 중 하나는 요인(x) 역할을 하고, 다른 특성은 결과(y) 역할을 합니다. 경제성 분석을 바탕으로 특성 간의 인과관계를 직접 수립해 보세요. 방정식 매개변수의 의미를 설명합니다.
  2. 이론적인 결정 계수와 잔차(회귀 방정식으로 설명되지 않는) 분산을 결정합니다. 결론을 내리십시오.
  3. Fisher의 F 테스트를 사용하여 5% 수준에서 전체적으로 회귀 방정식의 통계적 유의성을 평가합니다. 결론을 내리십시오.
  4. 요인 특성 x의 예측 값이 평균 수준 x의 105%인 결과 특성 y의 기대 값을 예측합니다. 0.95의 확률로 예측 오차와 신뢰 구간을 계산하여 예측의 정확성을 평가합니다.
해결책. 방정식은 y = ax + b입니다.
평균값



분산


표준편차



특성 Y와 요인 X 사이의 연결은 강력하고 직접적입니다(Chaddock 척도로 결정됨).
회귀 방정식

회귀계수: k = a = 4.01
결정계수
R 2 = 0.99 2 = 0.97, 즉 97%의 경우 x의 변화는 y의 변화로 이어집니다. 즉, 회귀식 선택의 정확도가 높다. 잔여 분산: 3%.
엑스와이x 2y 2xy와이(엑스)(y i -y ) 2(y-y(x)) 2(x-xp) 2
1 107 1 11449 107 103.19 333.06 14.5 30.25
2 109 4 11881 218 107.2 264.06 3.23 20.25
3 110 9 12100 330 111.21 232.56 1.47 12.25
4 113 16 12769 452 115.22 150.06 4.95 6.25
5 120 25 14400 600 119.23 27.56 0.59 2.25
6 122 36 14884 732 123.24 10.56 1.55 0.25
7 123 49 15129 861 127.26 5.06 18.11 0.25
8 128 64 16384 1024 131.27 7.56 10.67 2.25
9 136 81 18496 1224 135.28 115.56 0.52 6.25
10 140 100 19600 1400 139.29 217.56 0.51 12.25
11 145 121 21025 1595 143.3 390.06 2.9 20.25
12 150 144 22500 1800 147.31 612.56 7.25 30.25
78 1503 650 190617 10343 1503 2366.25 66.23 143

참고: y(x) 값은 결과 회귀 방정식에서 구됩니다.
y(1) = 4.01*1 + 99.18 = 103.19
y(2) = 4.01*2 + 99.18 = 107.2
... ... ...

상관계수의 중요성

우리는 다음과 같은 가설을 세웠습니다.
H 0: r xy = 0, 변수 사이에 선형 관계가 없습니다.
H 1: r xy ≠ 0, 변수 사이에 선형 관계가 있습니다.
정규 이변량의 일반 상관계수인 유의수준 α에서 귀무가설을 검증하기 위해 무작위 변수경쟁 가설 H 1 ≠ 0을 사용하면 기준의 관측 값(무작위 오류 값)을 계산해야 합니다.

스튜던트 테이블을 사용하여 t 테이블(n-m-1;α/2) = (10;0.025) = 2.228을 찾습니다.
Tob > t 탭이므로 상관 계수가 0이라는 가설을 기각합니다. 즉, 상관계수는 통계적으로 유의하다.
상관계수에 대한 구간추정(신뢰구간)


r - Δ r ≤ r ≤ r + Δ r
Δ r = ±t 테이블 m r = ±2.228 0.0529 = 0.118
0.986 - 0.118 ≤ r ≤ 0.986 + 0.118
상관계수에 대한 신뢰구간: 0.868 ≤ r ≤ 1

회귀계수 추정값 결정의 정확성 분석





S a =0.2152

종속변수에 대한 신뢰구간

Y의 가능한 값의 95%가 무제한으로 집중되는 구간의 경계를 계산해 보겠습니다. 큰 수관측치 및 X = 7
(122.4;132.11)
계수에 관한 가설 검정 선형 방정식회귀

1) t-통계




회귀계수의 통계적 유의성이 확인됨
회귀 방정식 계수에 대한 신뢰 구간
회귀 계수의 신뢰 구간을 결정해 보겠습니다. 신뢰도는 95%이며 다음과 같습니다.
(a - t a S a ; a + t a S a)
(3.6205;4.4005)
(b - tb Sb ; b + tb Sb)
(96.3117;102.0519)

상관계수는 두 변수 사이의 관계 정도를 말합니다. 계산을 통해 두 데이터 세트 사이에 관계가 있는지 여부에 대한 아이디어를 얻을 수 있습니다. 회귀와 달리 상관 관계는 수량 값을 예측하지 않습니다. 그러나 계수를 계산하는 것은 예비 통계 분석에서 중요한 단계입니다. 예를 들어, 외국인직접투자 수준과 GDP 성장률 사이의 상관계수가 높다는 사실을 발견했습니다. 이는 번영을 보장하기 위해서는 특히 외국 기업가들에게 유리한 환경을 조성하는 것이 필요하다는 생각을 갖게 합니다. 언뜻보기에 그렇게 명백한 결론은 아닙니다!

상관관계와 인과관계

아마도 우리 삶에 그렇게 확고하게 자리 잡은 통계 영역은 하나도 없을 것입니다. 상관계수는 사회 지식의 모든 영역에서 사용됩니다. 주요 위험은 사람들을 설득하고 어떤 결론을 믿게 만들기 위해 높은 가치가 종종 추측된다는 것입니다. 그러나 실제로 강한 상관관계는 수량 간의 인과 관계를 전혀 나타내지 않습니다.

상관 계수: Pearson 및 Spearman 공식

두 변수 사이의 관계를 특징짓는 몇 가지 기본 지표가 있습니다. 역사적으로 첫 번째는 Pearson 선형 상관 계수입니다. 학교에서 가르칩니다. Fr.의 작업을 기반으로 K. Pearson과 J. Yule이 개발했습니다. 갈튼. 이 계수를 사용하면 합리적으로 변하는 유리수 간의 관계를 확인할 수 있습니다. 항상 -1보다 크고 1보다 작습니다. 음수는 반비례 관계를 나타냅니다. 계수가 0이면 변수 간에 관계가 없습니다. 양수와 동일 - 연구 중인 수량 사이에 정비례 관계가 있습니다. Spearman의 순위 상관 계수를 사용하면 변수 값의 계층 구조를 구축하여 계산을 단순화할 수 있습니다.

변수 간의 관계

상관 관계는 두 가지 질문에 답하는 데 도움이 됩니다. 첫째, 변수 간의 관계가 긍정적인지 부정적인지 여부입니다. 둘째, 중독성이 얼마나 강한가입니다. 상관관계 분석은 이를 얻기 위해 사용할 수 있는 강력한 도구입니다. 중요한 정보. 가족의 소득과 지출이 비례적으로 줄어들고 늘어나는 것을 쉽게 알 수 있습니다. 이 관계는 긍정적인 것으로 간주됩니다. 반대로, 제품 가격이 오르면 해당 제품에 대한 수요는 감소합니다. 이 관계를 부정적이라고합니다. 상관계수 값의 범위는 -1과 1 사이입니다. 0은 연구 중인 값 사이에 관계가 없음을 의미합니다. 얻은 지표가 극단값에 가까울수록 관계(음수 또는 양수)가 더 강해집니다. 의존성이 없다는 것은 -0.1에서 0.1까지의 계수로 표시됩니다. 이러한 값은 선형 관계가 없음을 나타낼 뿐이라는 점을 이해해야 합니다.

응용 프로그램의 특징

두 지표의 사용에는 특정 가정이 포함됩니다. 첫째, 강한 연결이 존재한다고 해서 한 양이 다른 양을 결정한다는 사실이 결정되지는 않습니다. 각각을 정의하는 세 번째 수량이 있을 수도 있습니다. 둘째, 높은 Pearson 상관 계수는 연구 변수 간의 인과 관계를 나타내지 않습니다. 셋째, 독점적으로 표시됩니다. 선형 의존성. 상관 관계는 성별이나 좋아하는 색상과 같은 범주보다는 의미 있는 정량적 데이터(예: 기압, 기온)를 평가하는 데 사용될 수 있습니다.

다중 상관 계수

Pearson과 Spearman은 두 변수 사이의 관계를 조사했습니다. 하지만 세 개 이상이면 어떻게 해야 할까요? 다중 상관 계수가 구출되는 곳입니다. 예를 들어, 국민총생산(GDP)은 외국인직접투자(FDI)뿐만 아니라 정부의 통화·재정정책, 수출 수준의 영향을 받습니다. GDP의 성장률과 규모는 여러 요인의 상호작용의 결과입니다. 그러나 다중 상관관계 모델은 수많은 단순화와 가정을 기반으로 한다는 점을 이해해야 합니다. 첫째, 값 간의 다중 공선성이 제외됩니다. 둘째, 종속변수와 이에 영향을 미치는 변수 간의 관계는 선형으로 간주됩니다.

상관관계 및 회귀분석 활용 분야

수량 간의 관계를 찾는 이 방법은 통계에서 널리 사용됩니다. 세 가지 주요 경우에 가장 자주 사용됩니다.

  1. 두 변수 값 사이의 인과 관계를 테스트합니다. 결과적으로 연구자는 선형 관계를 발견하고 수량 간의 이러한 관계를 설명하는 공식을 도출하기를 희망합니다. 측정 단위는 다를 수 있습니다.
  2. 수량 간의 관계를 확인합니다. 이 경우 어느 변수가 종속변수인지는 누구도 결정할 수 없습니다. 다른 요인이 두 수량의 값을 결정한다는 것이 밝혀질 수도 있습니다.
  3. 방정식을 도출하려면. 이 경우에는 간단히 숫자를 대입하여 알 수 없는 변수의 값을 알아낼 수 있습니다.

인과관계를 찾는 남자

의식은 우리 주변에서 일어나는 사건을 반드시 설명해야 하는 방식으로 설계되었습니다. 사람은 항상 자신이 살고 있는 세상의 그림과 자신이 받는 정보 사이의 연관성을 찾습니다. 뇌는 종종 혼돈 속에서 질서를 만들어냅니다. 그는 인과관계가 전혀 없는 곳에서도 인과관계를 쉽게 볼 수 있습니다. 과학자들은 이러한 경향을 극복하는 방법을 특별히 배워야 합니다. 데이터 간의 관계를 객관적으로 평가하는 능력은 학업에 필수적입니다.

미디어 편견

상관관계의 존재가 어떻게 잘못 해석될 수 있는지 생각해 봅시다. 다른 영국 학생 그룹 나쁜 행동, 부모님이 담배를 피우는지 물었습니다. 그런 다음 테스트가 신문에 게재되었습니다. 그 결과, 부모의 흡연과 자녀의 비행 사이에는 강한 상관관계가 있는 것으로 나타났습니다. 이번 연구를 진행한 교수는 담배갑에도 이에 대한 경고 문구를 넣을 것을 제안하기도 했다. 그러나 이 결론에는 여러 가지 문제가 있다. 첫째, 상관관계는 어느 양이 독립적인지 보여주지 않습니다. 그러므로 부모의 해로운 습관은 자녀의 불순종으로 인해 발생한다고 가정하는 것이 가능합니다. 둘째, 두 가지 문제가 모두 세 번째 요인으로 인해 발생하지 않았다고 확신할 수 없습니다. 예를 들어, 저소득층 가정. 연구를 수행한 교수의 초기 연구 결과에서 감정적인 측면은 주목할 가치가 있습니다. 그는 흡연에 대한 열렬한 반대자였습니다. 그러므로 그가 자신의 연구 결과를 이런 식으로 해석한 것은 놀라운 일이 아니다.

결론

상관관계를 두 변수 사이의 인과관계로 잘못 해석하면 수치스러운 연구 오류가 발생할 수 있습니다. 문제는 그것이 인간 의식의 기초에 있다는 것입니다. 많은 마케팅 트릭이 이 기능을 기반으로 합니다. 원인과 결과, 상관관계의 차이를 이해하면 일상생활은 물론 직업생활 전반에 걸쳐 정보를 합리적으로 분석할 수 있습니다.



또 무엇을 읽어야 할까요?