Statistics
벡터자기회귀 모형, Vector AutoRegressive Model (VAR)
벡터자기회귀 모형(Vector AutoRegressive Model)이란? 벡터자기회귀모형(Vector AutoRegressive Model, VAR)은 일변량 자기회귀모형을 다변량 자기회귀모형으로 확정시킨 모형으로 예측 및 내생변수의 변화에 따른 효과 분석 등과 관련하여 자주 활용되고 있음 ARIMA 모형보다 좀 더 다변량의 효과를 모델링한 모형이라고 이해됨 - 다변량 분석 시 예측할 변수의 과거 데이터를 고려할 뿐 아니라 여러 변수 사이의 의존성 또한 고려해야함 - 일변량 분석인 ARIMA 모형은 변수들 사이 상호작용을 무시하는 반면 VAR는 이를 고려하여 모델링함 언제 사용하는가? 예측뿐만 아니라 특정 변수의 일시적 충격에 대한 효과를 모델링하기 위해 연립방정식 체계로 구성된 VAR 모형을 이용할 ..
[R] 간단한 메타분석 예제 코드 - 두 집단 (사후검사)
두 집단 (사후검사) 비교의 경우 데이터 로드 # 메타분석 install.packages("meta") install.packages("metafor") library(meta) library(metafor) # 두 집단(사후검사) # 자아존중감에 대한 멘토링 데이터 mentoring
메타분석, Meta-Analysis
메타분석이란? 메타분석이란 동일한 주제에 대한 다양한 연구결과를 체계적이고 계량적으로 분석하는 통합적인 분석방법(research synthesis)을 의미한다. 예시) 간접흡연과 폐암발생에 대한 다양한 연구결과를 통합하여 간접흡연이 폐암발생에 미치는 영향을 밝힘 청소년들에 대한 멘토링 프로그램이 과연 효과적인지, 효과적이라면 어느 정도 효과적인지를 통합적으로 분석 데이터 분석 유형 1차적 분석(primary data analysis) : 연구자가 직접 수집한 개별 데이터를 분석 2차적 분석(secondary data analysis) : 기존 수집된 데이터를 분석(예: 센서스) 메타분석(meta-analysis) : 기존 개별연구들의 계량적 결과를 통합적으로 분석 메타분석이 필요한 이유 바로 개별연구의 ..
정보 엔트로피, Information Entropy
정보 엔트로피(또는 섀넌 엔트로피,Shannon Entropy)는 정보 이론에서 자주 사용되는 개념이며, 열역학에서의 엔트로피와 크게 다르지 않은 개념이다. 각 사건의 정보량은 그 기댓값, 또는 평균이 섀넌 엔트로피인 확률변수를 형성한다. 엔트로피의 단위는 정의에 사용된 로그의 밑이 무엇인지에 따라 섀넌(shannon), 내트(nat) 또는 하틀리(hartley)를 사용한다. 정보량(information content)은 확률에 반비례한다. 엔트로피는 '어떤 상태에서의 불확실성', 또는 이와 동등한 의미로 '평균 정보량'을 의미한다. 정의 확률변수 $X:P\rightarrow E$가 분포 $f:E\rightarrow \mathbb{R}$을 따른다고 하자. 그렇다면 $X$의 정보 엔트로피 $H\left (..
정규분포, Normal Distribution
The Normal Distribution $f(x\mid \mu,\sigma^{2}) = \frac{1}{\sqrt{2\pi\sigma^{2}}}\mathrm{exp}\left \{ -\frac{1}{2}\left ( \frac{x-\mu }{\sigma } \right )^{2} \right \},$ $ for -\infty < x < \infty .$ 파라미터 $\mu$ : 평균 $\sigma^{2}$ : 분산 ( $\sigma$ : 표준편차) 위의 $pdf$ 를 가지는 random variable $X$ 를 우리는 정규 분포(Normal Distribution) 혹은 가우스 분포(Gaussian Distribution)이라고 부른다. $X \sim N(\mu,\sigma^{2})$ The Stan..
분위수 회귀 분석, Quantile regression
Quantile regression(분위수 회귀 분석)이란 통계학과 계량경제학 분야에서 많이 사용 되는 회귀 분석의 한 유형이다. 기존 회귀분석에서는 최소 제곱법을 이용하여 설명 변수에 따른 반응 변수의 조건부 평균을 추정하지만, 분위수 회귀 분석에서는 반응 변수의 조건부 분위수 값을 추정한다. 분위수 회귀 분석은 선형 회귀 분석의 조건이 충족되지 않는 경우 사용할 수 있는 선형 회귀 분석의 확장이다. Quantile regression 의 장점 예측 값이 정규분포임을 가정한 기존의 선형 회귀분석과 달리, 분위수 회귀 분석에서는 데이터 평균 외부의 변수 관계를 이해할 수 있으므로 비정규 분포를 따르고 예측 변수와 비선형 관계를 갖는 결과를 이해하는 데 유용하다. 그리고 선형 회귀의 가정을 벗어나서 예측 ..