이끼네

[8/1] R 스터디 본문

연구방법_통계/R

[8/1] R 스터디

이끼네 2023. 8. 1. 20:45

0. 데이터 불러오기

data <- read.csv("cleaned.csv", stringsAsFactors = TRUE)
head(data)

 

1. 상관계수

  • cor(data$K.pre, data$M.pre)
  • cor(data %>% select(ends_with(".pre")))

만약, 표본 수(결측 문제 발생)에 대한 고민이 있을때? 

  • cor.test(data$K.pre, data$M.pre)
libarary(GGally)
ggpairs - pairs처럼 병렬로 여러개 만들어 주는 

2. 단순회귀 분석 / 중다회귀분석

# 변수 넣을 때, 항상 순서 조심할 것!!

심화 ) 표준화 회귀 계수

# 변수 별로 가진 속성이 다르기 때문에 이것을 통일하는 것이 필요함. 

# scale()를 넣어서 표준화를 해버려 -> 평균을 0을로 하고, 표준편차로 나누는 것

intall.pakages("패키지명") : 반드시 따옴표(")를 넣어 줄 것!

 

3. 회귀모형 진단 

  • 다중회귀분산을 할 때, 지켜야 할 여러가지 가정 -> 변수들 사이에 독립성이 가정되어야 하기 때문
  • 잔차의 등분산성 -> 잔차 분산 그래프

 

4. 범주형 독립 변인

  • 미리 factor로 지정하거나 lm 함수 내에서 as.factor() 활용

5. 상호작용 효과 분석

  • 센터화(centralized) 시키고 나서 곱하기 변수 추가 할 것.

 

K-means 분석

https://ybeaning.tistory.com/26

 

[R 데이터분석] k - 평균(k-means) 군집 분석

k-평균(k-means algorithm) 군집 분석이란? 주어진 데이터를 k 개의 클러스터(군집)로 묶는 알고리즘 "k"는 각 데이터 점들의 서로에 대한 유사성을 기초로 한 고정된 수(k)의 군집을 찾는 다는 것을 의

ybeaning.tistory.com

 

반응형

'연구방법_통계 > R' 카테고리의 다른 글

[R 스터디] ggplot2 관련 아이디어 링크  (0) 2023.07.31
[7월 25일] R 스터디  (0) 2023.07.25
[7/18] R 스터디  (0) 2023.07.18
[7월 11일] R 스터디  (0) 2023.07.11
2. [7월 4일] R 스터디  (0) 2023.07.04