[스터디] 9주차 The Econometrics of Classic Linear Models -1 // 통계용어?steemCreated with Sketch.

in kr-study •  4 years ago 

[ 9주차] Cocharne 강의 주제는 The Econometrics of Classic Linear Models 이다. 이것에 공부에 앞서 통계 공부가 많이 필요한 듯 싶다.

가장 대표적으로 time regression 을 분석하는 것인데 강의노트에 따르면

image.png

즉 어떻게 parameter 들을 측정하고, 측정된 파라메터들의 error 를 측정하며, 가격에 관련된 오차는 어떻게 측정하고 또 이 모델을 어떻게 test 를 해야 할지에 대해 설명한다.

사실 test 니 error 측정이니 이런 것들은 통계적인 방법을 사용하는 것으로 보이고 여러가지 통계 용어들이 등장한다. side way 로 그런 용어들을 한번 정리해보자.

1 ) homoskedastic

이 괴상한 영어단어는 무엇일까? 구글신에게 물어보았다.

image.png

뭔 말이냐... random varialbes that have the same finite variance. 즉 variance 의 homogeniety 성질을 가졌다고 한다. 우리말로 풀어 써보면 각 random varaible 들의 분산이 모두 같은 크기를 가진다는 것이다. [homo, skedastic=dispersion]

당연히 여기에 상충되는 용어로

2) Heteroskedastic

아마 어원을 보면 hetero-dispersion 으로 variance 가 더 이상 같은 크기를 가지지 않는다는 것을 말한다. variance 의 크기가 data size 가 커질수록 커지거나 안 맞는 것을 말하는 것 같다.

뭔가 이 두 현상을 잘 표현한 시각적 자료를 찾으려 했는데 잘 나오지 않았다.

image.png

이게 꽤나 괜찮아 보여 첨부한다.

이런 heteroscedasticity 는 왜 생길까? 즉 variance 의 차이가 생긴다는 것은 Generalized Method of moments 으로 본다면 Second moment 에 문제가 있다는 것을 말한다.

image.png

유투브 링크

으악 여기서 다시 GMM 이 등장한다 그리고 이 parameter 들을 estimate 하고 model 을 test 한다면서 OLS(Ordinary Least square methods) GLS(Generalized least square method) 등이 등장한다.

Gibbons Ross and Shanken (1989) (GRS) test statics

이게 뭔지 구체적인 설명은 별로 없고, GRS test package 는 엄청나게 나온다. 얘네가 뭘 하는지 정확히 알아야 써먹던가 할텐데.... 논문은 비교적 쉽게 찾았는데 ... ㅋㅋㅋ 논문링크

일단 Asset pricing model 이야기는 넘어가고 통계 이야기로 가보자.

3) chi^2 statistics

우리말로는 카이제곱 검정이라고 하는데, 얘가 의미하는게 뭘까?

위키피디아에 따르면

image.png

카이 제곱 값은 결국에 관측 값이 기대값에서 얼마나 멀리 떨어져 있느냐를 말해주는 거다. 주식시장에서 특별히 구간을 정해놓고 3가지 이상의 범주가 존재할 때 쓴다고 한다.

예를 들어 동전을 던졌을 때 앞뒤가 나올 확률은 1/2 이지만 10번 던졌다고 하고 시행 결과에서 1번만 앞면이 나왔다고 했을 때 chi^2 을 구해보자.

image.png

이러면 큰 chi^2 값을 가지게 되고 이 모델은 좋은 모델이 아니라고 의심하게 된다. 즉 동전의 무게중심이 잘못됬다거나 등의 additional 한 조건들을 고려하여 실험결과와 맞는 모델을 다시 만들 필요가 있게 된다.

흠 ㅋㅋ 근데 chi^2 검정 전에 t-검정, z-검정 등도 알아야 하네?

또 하나 등장하는 것이

4) F-distribution

이 있는데 이건 또 뭘까? 위키피디아를 봐도 먼 말인지 모르겠네

흠 이걸 알기 전에는 t 분포를 알아야 하는 군

4') student t-distribution

역사적으로 t 분포는 양조장에서 W.S. Grosset 이 발견했다고 하는데 ㅋㅋㅋ 신기하군 t 분포는 고등학교 때인가 살짝 맛을 보긴 했는데 흔히 말하는 표본평균을 가지고 Z 값을 구할 때 sigma 제곱을 이용하는데 sigma 제곱을 모를 때에는 모집단의 S 를 이용하여 구한다는 것이 핵심이다.

image.png

F 분포는 두개의 시스템에 대한 비율로 하나는 chi_1, 다른 하나는 chi_2 라 할 때 이 두 chi 제곱 분포의 비율과 관련되어서 정의된다. 즉 두 집단의 분산을 다루는데 카이제곱 분포처럼 비대칭을 띄고 있다는 점이 핵심이다. 이 값이 1이면 두 분산의 크기가 같은거고 1보다 크면 분산의 크기가 다른 것이다.

흠 이것을 가지고 Homo 인지 Hetero 인지 파악하나 보다.

GRS 나 ecometric 관련된 내용은 다음 포스팅에 정리해 보도록 하자. 일단 한번씩 등장한 통계 용어를 정리해 보았다.
고등학교 확률과 통계부터 다시 공부해야 하나...

Authors get paid when people like you upvote their post.
If you enjoyed what you read here, create your account today and start earning FREE STEEM!
Sort Order:  

흠... 비오님 공부는 제게는 외계어.. ㅋㅋ

ㅋㅋㅋ 저도 지금 통계량 경제는 외계어 같아서 고생중이에요 ㅋㅋㅋ