잡다

[금융투자분석사] 1-1 계량분석

Calif 2018. 11. 11. 18:37

$ 학생때 공부했던 거.. 그림 안나오는 게 있어서 파일도 첨부한다.

Ⅰ-1 계량분석.hwp


1. 계량분석

 

회귀분석

회귀분석 시 주요 가정

가정

의미

위배 시

검사

대안

정규성

오차는 정규분포를 따름

 

정규확률그림

변수변환

독립성

오차들 간 공분산은 0

자기상관
(효율성 상실)

DW검정
(0: 양의 상관, 2: 독립, 4: 음의상관)
von Neuman

GSL
AR(p)
Cochrance-Orcutt

등분산성

오차의 분산이 동일

이분산성

Goldfelf-Quandt
Breusch-Pagan
White
산점도

WLS
GLS
변수변환

다중회귀
추가가정

설명변수 간 상관관계가 낮음

다중공선성
(표준오차 증가)

상관계수행렬 검토

변수제거

 

기타 고려사항

가정

영향

필수변수

제외 시 불편성, 일치성 상실

불필요 변수 포함

효율성 상실

비선형성

불편성, 일치성 상실

가성적 회귀분석

불안정시계열 회귀분석 시 관계가 없음에도 의미 있어 보이는 결과 도출

 

회귀모형

구분

단순선형회귀분석

다중회귀분석

모회귀식

표본화회귀식





적합성 검정

분산분석

그림입니다.

원본 그림의 이름: 제목 없음.png

원본 그림의 크기: 가로 654pixel, 세로 353pixel

 

2. 적합도 검토(회귀직선의 유의성 검정)
- 결정계수: 회귀선이 잘 적합 되면 결정계수는 1에 가깝고, 그렇지 않으면 0
그림입니다.

원본 그림의 이름: 1.png

원본 그림의 크기: 가로 655pixel, 세로 181pixel
- 수정결정계수: 설명변수의 수가 다른 두 축소모형은 결정계수가 부적절, 이를 보완
그림입니다.

원본 그림의 이름: 2.png

원본 그림의 크기: 가로 655pixel, 세로 66pixel

t검정: 개별 설명변수의 회귀계수가 통계적으로 우의한지 검정

그림입니다.

원본 그림의 이름: 3.png

원본 그림의 크기: 가로 655pixel, 세로 247pixel
- F검정: 전체 회귀모형(회귀직선)이 통계적으로 유의한지 검정
그림입니다.

원본 그림의 이름: 4.png

원본 그림의 크기: 가로 655pixel, 세로 43pixel

3. 잔차분석
- 정규성 검토
- 등분산성 검토
- 독립성 검토

예측

시계열 자료분석과 예측
- 구성요소
추세변동: 장기적 증감 경향
순환변동: 경기순환 등 1년 이상 주기변동
계절적변동: 1년 이내 주기변동
불규칙변동: 세 가지를 제외한 나머지 변동
- 추세선에 의한 예측

모형= 추정식=


- 평활기법
불규칙변동 제거
이동평균법(홀수), 중심이동평균(짝수): 이동평균 계산에 포함되지 않는 자료 무시
지수평활법: 이동평균법 단점 보완
- 계절지수 활용
계절지수 생성
계절성 제거 후 추세선 추정
추세예측치 추정
추세예측치에 계절지수를 곱해서 최종예측치 산출

여러 가지 수익률

기간수익률(Holding Period Return: HPR)
- HPR=
- Annualized HPR=

내부수익률: 각 현금흐름의 시간가치를 반영한 수익률

금액가중수익률: 금액으로 가중하므로 현금흐름에 영향 받음, 투자자의 성과 평가

시간가중수익률: 현금흐름이 발생하지 않는 기간별 HPR의 기하평균, 펀드매니저

연평균수익률: 총투자수익률을 연단위로 산술평균한 단리수익률

실효수익률: 연간 이자지급횟수가 2회 이상인 경우의 이론적 연단위 복리 수익률

산술평균과 기하평균
- 산술평균: ->
- 기하평균: ->

단리, 복리, 연속복리
- 단리: 원금(1+nr)
- 복리: 원금(1+r)n
- 연속복리: 원금(1+r/n)n -> 원금er

도수분포

상대도수: 절대도수는 발생한 사건의 수, 상대도수는 사건이 차지하는 비율

히스토그램: 데이터의 범위를 구간으로 나누어, 구간 내에 데이터를 그래프로 표시
- 자료의 중심위치, 퍼진 정도, 분포의 형태, 이상값의 유무 등을 시각적으로 파악

도수분포: 비율에 100을 곱하여 백분율로 계산하여 표본의 크기를 표준화


중심경향척도

산술평균: 자료의 총합을 자료의 수로 나눈 것, 극단치에 민감함

가중평균: 각 자료의 중요도에 따라 가중치를 부여하여 합산한 것

앙값: 크기순으로 나열했을 때 중앙에 위치하는 값으로 극단치에 민감하지 않음

최빈값: 자료 중 가장 빈도가 높은 관찰치로 극단치에 민감하지 않음

산포척도

분산: 평균을 중심으로 자료의 흩어진 정도
- 모분산=
- 표본분산=

표준편차: 분산에 루트

변동계수: 연속적인 변인에 대한 통계방법
-

범위: 최대값과 최소값의 차이

사분위범위: 이상값이 있을 경우의 단점을 보완하기 위해
- 3사분위수 1사분위수 -> 상위25% - 하위25%

자료와 척도

명목척도: 범주나 종류에 따라 분류가능(= 가능)

서열척도: 서열관계(= ≠ ≤ ≥ 가능)

구간척도: 숫자 간 간격이 산술적 의미(= ≠ ≤ ≥ + - 가능)

비율척도: 숫자 간 비율도 산술적 의미(= ≠ ≤ ≥ + - × ÷ 가능)

기타척도
- 왜도: 자료의 분포모양이 좌(-), (+)로 치우친 정도를 나타내는 척도
- 첨도: 분포의 중심에서의 형태를 나타내는 척도
정규분포는 0
leptokurtic 첨도>0, 중심 뾰족, 꼬리 두터움
platykurtic 첨도<0. 중심 납작, 꼬리 얇음


확률분포

이산확률분포
- 베르누이분포: 상호배반인 두 가지 중 하나를 갖는 실험, 성공 or 실패
그림입니다.

원본 그림의 이름: 5.png

원본 그림의 크기: 가로 495pixel, 세로 84pixel
- 이항분포: 베르누이분포의 일반화된 분포
그림입니다.

원본 그림의 이름: 6.png

원본 그림의 크기: 가로 500pixel, 세로 67pixel
- 포아송분포: 시간, 공간에서 사건발생 횟수
그림입니다.

원본 그림의 이름: 7.png

원본 그림의 크기: 가로 665pixel, 세로 100pixel
- 기하분포: 여러번의 시행 중 최초의 성공을 얻는 데 필요 한 횟수
그림입니다.

원본 그림의 이름: 8.png

원본 그림의 크기: 가로 266pixel, 세로 49pixel
- 초기하분포: 표본의 비율이 5% 이상일 때
- 다항 초기하분포: 세 가지 이상의 결과로 나누어지는 경우의 분포
- 음이항분포: r번째의 성공이 일어날 때까지의 실패의 수를 X로 정의

연속확률분포
- 균등분포: 특정구간 내의 값들에 대한 확률
- 정규분포: 곡선은 종모양으로 평균에 대해 대칭, 평균=중앙값=최빈값
- 표준정규분포: 평균이 0이고, 분산이 1이 되는 정규분포
- 지수분표: 사건 발생까지 경과시간의 분포

Z-SCORES
- 를 표준화 변수라 하고, 특정 값을 표준화한 값을 Z-score라고 함
- -> Z-N(0, 1), 빼기 아님

확률과정과 자산가격모형

확률가정
- Markov process: 미래의 프로세스가 현재의 상태에 의해서 결정
- Wiener process: 연속적 시간경로에 대해 정의
- 기하학적 브라운운동: 자산의 가격 변화는 시간에 독립적, 점프 가능성 배제
- 이항과정: 자산가격의 전개과정
- 포아송과정: 연속 시간축 상에서 임의로 발생하는 이산사건 묘사

자산가격모형
- Random Walk: 자산 가격 자체가 임의보행을 따른다는 점
- 가격 변화율의 확률분포
이분산성: 시간 구간별로 다양한 분산
자기상관성

변동성의 추정과 예측
- 변동성의 기간 확장
평균과 분산은 시간에 정비례하여 커지나 변동성은 에 비례
평균회귀성, 가격변동 제한폭이 존재하거나 일별에서 연별로 이행하는 경우에 주의
- 동일가중이동평균 =
- 지수가중이동평균: 최근의 자료에 더 높은 가중치 =
- GARCH모형: 지수가중평균보다 정교하나, 추정에 어려움

표본 이론과 통계적 검정

표본이론
- 표본추출의 방법
단순확률추출법
층별표본추출법
군집표본추출법
체계적 표본추출법
- 비확률표본추출법
판단추출법
편의추출법

표본관련 분포

구분

관련통계량

특징

카이자승분포

표본분산

표본분산에 관련된 추론에 활용

t분포

표본평균

표본평균 표준화값인 Z에서 로 대체하면 t분포

F분포

표본분산비

두 표본의 분산이 동일한지 여부 검정에 활용

중심극한정리: 모집단의 분포와 관계없이 n이 커짐에 따라 의 분포는 ( )으로 수렴

추정

추정량의 바람직한 성질

불편성

추정량 기대값이 모수와 동일, 불편추정량(표본평균, 표본분산, 표본비율)

효율성

추정량 분산이 상대적으로 작음, 불편성+효율성=최소분산불편추정량

일치성

표본의 크기가 커짐에 따라 추정량의 값의 모수와 일치, 일치추정량

점추정: 모수에 대응하는 표본통계랑(표본평균, 분산)을 활용하며, 오차 정도에 대한 신뢰성 있는 정보를 제공 못함

구간추정: 주어진 확률과 표본의 크기에 따라 모수가 포함될 구간을 활용하며, 오차의 정도에 대한 정보를 제공

가설검정

가설의 설정
- 귀무가설: 검정의 대상이 되는 가설로 연구자가 기각하고자 하는 가설
- 대립가설: 귀무가설이 기각되었을 때 받아들여지는 가설, 연구자가 지지하는 가설

유의수준
- 검정력: 귀무가설이 사실이 아닐 때 이를 기각할 수 있는 정도
- 의 관계: 서로 상쇄관계에 있으나 표본의 크기가 증가하면 동시에 줄일 수 있음
- P: P값이 유의수준보다 작다면, 해당 유의수준에서 귀무가설 기각할 수 있음

오류의 유형

구분

귀무가설이 사실

대립가설이 사실

귀무가설 기각 못함

OK

2종 오류

귀무가설 기각

1종 오류( , 유의수준)

OK