Scrap - interval regression // prediction interval vs confidence interval
Prediction interval → 이거 같은데, http://www.r-tutor.com/elementary-statistics/simple-linear-regression/prediction-interval-linear-regression
Interval regression 에서,
- 일단 들어가는 값이, 어떠한 정확한 한 점의 값이 아니라, interval 이야. 50~60 이렇게. (income level 등을 조사하면 데이터가 이렇게 될 수 밖에 없겠지. )
- 그런데 이것은 어떤 ordered probit 처럼 몇가지 형태로 통일될 필요가 없어.
- 그리고 나서 이것을 prediction 할때에는, 정확한 하나의 값으로 도출 할 수도 있고 (YOUTUBE 참고), 그냥 기존의 결과처럼 어디에 속하는지 결정해서 보여줄 수도 있어(UCLA참고).
Prediction Interval for Linear Regression
Assume that the error term ϵ in the simple linear regression model is independent of x, and is normally distributed, with zero mean and constant variance. For a given value of x, the interval estimate of the dependent variable y is called the prediction interval.
Problem
In the data set faithful, develop a 95% prediction interval of the eruption duration for the waiting time of 80 minutes.
Confidence Interval for Linear Regression
Assume that the error term ϵ in the linear regression model is independent of x, and is normally distributed, with zero mean and constant variance. For a given value of x, the interval estimate for the mean of the dependent variable, ¯y , is called the confidence interval.
Problem
In the data set faithful, develop a 95% confidence interval of the mean eruption duration for the waiting time of 80 minutes.
|
prediction interval vs confidence interval
- The key point is that the confidence interval tells you about the likely location of the true population parameter. ... Prediction intervals must account for both the uncertainty in knowing the value of the population mean, plus data scatter. So a prediction interval is always wider than a confidence interval
- 각 요일의 예측에 대해 모든 예측 변수에 대한 값을 지정하고 신뢰 수준을 95%로 설정합니다. 결과는 [230, 270]의 95% 예측 구간입니다. 이 범위에 새 관측치의 값이 포함될 것을 95% 신뢰할 수 있습니다. 또한 예측의 95% 신뢰 구간은 [240, 260]입니다. 이 범위에 이 예측 변수 값과 동일한 모든 요일의 평균 반응이 포함될 것을 95% 신뢰할 수 있습니다.
- ⇒ 그러니깐 정리하자면, CONFIDENCE LEVEL 이란, 예측값들에 대한 평균을 기준을 그것의 신뢰구간을 구한 것이고, (평균은 결국 더 중심으로 잘 맞을 테니깐, 더 좁은 범위를 가질 테고, ), 예측 구간이란, 이런 평균이 아닌 각 개별에 대한, 즉 평균으로 수렴 한다고 하더라도, 그에 따른 RANDOM 부분까지 고려를 하니깐 범위가 더 크겠지.
Amazing Article ! I would like to thank you for the efforts you had made for writing this awesome article. This article inspired me to read more. keep it up.
답글삭제Correlation vs Covariance
Simple Linear Regression
data science interview questions