일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 서울대학교 일반전형
- R
- 청년주택드림청약통장
- 에틸렌
- R studio
- 논술
- 서술형 문항 제작 절차
- 교육 통계
- 서울대
- 문헌 읽기
- RStudio 설치
- 단축키 해제
- RStudio
- iShared S&P 500 JPY Hedged ETF
- ctrl+B
- R 스터디
- 엔저현상
- 생명과학
- 구술 면접
- R설치
- 기초함수
- S&P500
- 2024년
- Chrome 단축키
- 2022년
- 크롬 단축키
- 구술면접
- dplyr
- 컨트롤+B
- 교차분석 #교육학
- Today
- Total
이끼네
[7월 25일] R 스터디 본문

1. 단일표본 t 검정
단일표본 t검정은 하나로 구성된 모집단의 평균 값을 기준 값과 비교하고자 할 때 사용되는 분석법
- 정규성을 만족하는지 확인해야 함. → R에서 이걸 확인해 주진 않음!
- Data가 범주 별 30개 이상이면 중심극한 정리에 의해 정규성을 만족
- 하지만 거의 t-test를 사용할 때 정규성은 만족하는 편
- p-value 값이 일반적으로 0.05 보다 크면, 두 집단에 차이가 없다고 해석하면 됨.

2. 종속표본 t-test ( = 대응표본 t-test)
종속표본 t검정이란 두 집단을 비교하고 싶지만, 두 집단이 서로 독립적이지 않을 경우 실시하는 통계 검정 방법.
독립표본 t검정은 두 집단의 평균을 비교하지만, 종속 표본 t 검정은 두 집단의 차이를 비교하는데 차이가 있음.
- 검정 자체는 단일표본 t 검정 방법과 동일하다.
- 두 집단의 값을 뺀 후에, 그걸 단일표본 t 검정을 하는 것이라고 생각하면 됨. 이때, 기준은 0이 됨.
- 수학적 공식 : https://angeloyeo.github.io/2021/10/29/paired_t_test.html

3. 독립표본 t-test
독립표본 t-검정은 두 집단 간에 평균 차이가 있는지 검증하는 분석이다.
- 등분산 검정을 해야 함. 이때, 등분산 검정이란, 분산이 같은 모집단에서 나왔는 지를 확인해야 함.
t-test를 할 때 등분산 검정을 하는 이유는 두 개 이상의 그룹의 평균을 비교하는 경우, 가정하는 등분산성(등분산 가정)이 만족되어야 올바른 결과를 얻을 수 있기 때문입니다. 등분산성이란, 비교하려는 모든 그룹들의 분산이 서로 동일하다는 가정을 의미합니다.
등분산성 가정은 t-test의 가정 중 하나로서, t-test는 두 그룹 간의 평균 차이를 검정하기 위한 통계적 방법입니다. 하지만 그룹들의 분산이 크게 다를 경우, t-test의 결과가 신뢰할 수 없게 될 수 있습니다. 이로 인해 잘못된 결론을 내릴 수 있으며, 유의미한 차이가 있는데도 차이가 없다고 판단할 수 있습니다.
따라서 등분산 검정은 t-test를 실시하기 전에 각 그룹의 분산이 동일한지 확인하는 절차입니다. 등분산 가정이 만족되면 등분산 t-test를 사용하고, 만족되지 않으면 등분산이 아닌(two-sample unequal variance) t-test를 사용합니다.
등분산성을 검정하는 대표적인 방법으로는 Levene의 등분산 검정과 Bartlett의 등분산 검정이 있습니다. 이러한 등분산 검정은 일반적으로 통계 소프트웨어에서 제공되며, 검정 결과에 따라 적절한 t-test 방법을 선택하여 데이터를 분석합니다.
- var.test(x1~x2)
- t.test()에서 var.equal의 디폴트 값은 F(Welch's t-test) → var.equal=T
- 등분산을 검정하는 기법에는 여러가지 논의가 있음. Welch의 검정이 대체적으로 엄격한 편임.
- tapply(x1, x2, sd, na.rm=True) → 그룹 별 표준편차를 보기

4. 일원 분산 분석 one-way ANOVA
하나의 독립변수에 따라 종속변수가 달라질 때,
- family-wise error란 무엇이냐면, t-test를 여러 번 돌리면 에러가 누적이 되는데, TukeyHSD는 그것을 보정해주는 역할
- scheffe 사후 검정을 사용하기도 함.

5. 이원분산 분석 two-way ANOVA
aov(y~x1*x2) 또는 aov(y~x1+x2) →상호작용이 있다고 가정하는 것이 좋음
- p adj : ANOVA를 통해 얻은 결과에서 중요한 요소는 "p-value"입니다. 이 값은 각 독립 변수(x1, x2) 또는 상호작용(x1*x2)의 효과가 통계적으로 유의미한지를 나타내는 지표입니다. 보통, p-value가 낮을수록(일반적으로 0.05 이하), 해당 독립 변수 또는 상호작용이 종속 변수와 유의미한 관련이 있다고 간주됩니다.
- 이원분산분석 그래프 그리는 것까지 하는 것이 좋을 것 같아!



6. 반복측정 분산분석(Repeated Measures ANOVA)
시간의 흐름에 따라(시점에 따라) 여러 번 해당 결과를 반복하여 측정한 자료.
반복측정 자료는 변수 상호 간에 독립적일 수 있지만, 변수 내에서는 독립적이지 않고, 상관성이 있는 특성을 가짐
Q. 종속표본 t-검정과 대응표본 t-검정에 대한 수학적 공식은?
https://angeloyeo.github.io/2021/10/29/paired_t_test.html
대응 표본 t 검정(paired t-test) - 공돌이의 수학정리노트 (Angelo's Math Notes)
angeloyeo.github.io
Q. 통계 방법을 찾고 싶다면?
https://blog.naver.com/PostList.naver?blogId=y4769&parentCategoryNo=189
보건과학통계 SPSS 이야기 : 네이버 블로그
건국대학교병원 방사선사 신한대학교 데이터마이닝 강사 한서대학교 대학원 보건통계학 강사 한국방사선교육평가원 상임이사 대한영상의학기술학회 교육이사 대한방사선사협회 보수교육 강
blog.naver.com
'연구방법_통계 > R' 카테고리의 다른 글
[8/1] R 스터디 (0) | 2023.08.01 |
---|---|
[R 스터디] ggplot2 관련 아이디어 링크 (0) | 2023.07.31 |
[7/18] R 스터디 (0) | 2023.07.18 |
[7월 11일] R 스터디 (0) | 2023.07.11 |
2. [7월 4일] R 스터디 (0) | 2023.07.04 |