[Google Sheets] Moving Average 이동 평균이 이상하다

in kr-science •  6 years ago 

어제 쓰면서 발견했는데, 구글 시트 (발음 주의! 한국 사람 대부분은 shit으로 발음하고 있다네요 ^^)의 이동평균선이 이상하게 나오는 걸 발견했습니다. 결국 어제 글에서는 이동평균 안쓰고 polynomial 방식을 이용했었는데요, 오늘은 어떻게 이상한지 한 번 보도록 하겠습니다.

일단 자료는 어제 에 쓰인 자료를 그대로 가져왔고, 역시 Scatter Plot으로 나타내었습니다.

이후 "CUSTOMIZE" 그리고 그 밑의 "SERIES" 항목을 보시면 "TRENDLINE" 이라는 옵션이 보입니다.
"TRENDLINE" 옵션을 체크하면 아래와 같은 기본 옵션이 뜹니다.

역시 기본은 "Linear Regression" 되겠습니다.

그럼 여기서 잠깐 광고 보고 오시겠습니다.
[SciPy] 1. Linear Regression (Application to Scatter Plot)

네 이제 본문으로 돌아와서,
추세선의 색깔이나 굵기 등이 마음에 안들어서 좀 바꿨고요,
옵션에서 "Moving Average"를 골라봤습니다.

현재는 "Period" 항목이 2로 되어있는데,
장기 추세를 보기위해 옵션 중 가장 큰 숫자인 10을 골라봅니다.

딱 보자마자 이상하다고 느낀 것은,
왼쪽 끝부분에는 이동평균선이 없는데, 오른쪽 끝부분에는 있다는 거에요.
이게 왜 이상하냐면,
이동평균이란 어떤 한 점을 기준으로 과거 몇 개와 미래 몇 개의 점을 평균한 값이거든요. 그래서 이동평균선은 보통 양쪽 끝에서 똑같은 길이만큼 없어야해요.

수식으로 쓰면...
하려다가 왠지 별로 실용적이지 않을 것 같아서
구글 시트 혹은 엑셀에서 계산식을 적어보자면
A11 항을 기준으로 11 포인트 이동평균은 이렇게 쓸 수 있겠죠.
=AVERAGE(A6:A16)

그런데 이게 짝수개 점의 이동평균은 살짝 더 복잡합니다.
역시 A11 항을 기준으로 10 포인트 이동평균은
=(SUM(A6:A16)-A6/2-A16/2)/10

역시 11개의 값을 가지고 계산을 하며, 양 끝 값에서 반씩 빼줍니다.
이런 식으로 직접 계산한 값을 표시해볼게요.

이걸 보면, 구글 시트에서 이동 평균선은 오른쪽 옆으로 밀렸다는 걸 알 수 있죠.

결론은 구글 시트에서 Moving Average 이동 평균선은 이상하게 나온다는 겁니다.

그리고 시리즈가 2개일 때, 하나는 스캐터로, 하나는 라인으로 그리고 싶었으나 어떻게 하는 지 모르겠어서 그냥 둘 다 스캐터로 하게되었네요 ^^;;

나름 태그를 신경쓰는 편인데, 오늘 글은 어떤 kr 태그를 쓸 지 참 어렵네요 ^^;;;

Authors get paid when people like you upvote their post.
If you enjoyed what you read here, create your account today and start earning FREE STEEM!
Sort Order:  

zorba님이 dj-on-steem님을 멘션하셨습니당. 아래 링크를 누르시면 연결되용~ ^^
zorba님의 [2018/12/26] 가장 빠른 해외 소식! 해외 스티미언 소모임 회원들의 글을 소개해드립니다.

...enerva 뉴욕 dj-on-steem/td> DC 근교 hello-sunshine DC

태그보다 글 자체다 소중합니다 ^^
누군가는 알아주겠죠 ~~

Posted using Partiko iOS

댓글이 참 따뜻하네요 :)

전 이 기능 아직 안 써 봤었는데, MA하면 이런 오류가 있다니 충격이네요ㅋㅋ 이유가 궁금해지는🙄..

Posted using Partiko iOS