## 연구자에게 있어서 통계분석은 절대적!으로 필요하다.
최근에는 대부분의 프로그램 (R, Python 등) 은 사용자가 원하는 통계 분석을 쉽게 할 수 있도록 도와준다.
통계에 대한 깊이있는 지식이 없더라도 우리가 원하는 통계 결과를 도출할 수 있다.
분석하고자 하는 샘플에 따라 통계 방법이 달라지고 달라진 통계 방법에 따라 논문의 흐름과 방향이 달라진다.
이러한 이유 때문에 미루고 미뤄왔던 통계 공부를 시작해보려고 한다.
## 두 그룹간 비교
그룹 간 평균 비교는 마이크로바이옴 분석 시 (알파 다양성, 베타 다양성 등) 주로 사용된다.
(특정 약물 또는 식품 섭취 전/후 비교 등)
그룹 간의 비교를 하기 위해서는 크게 세 가지 조건을 부합해야 한다.
1. 결과값이 연속 변수인지
> Continuous variable: 변수의 각 값 사이에 많은 또 다른 값들이 존재함 (키, 몸무게 등)
2. 각각의 결과값이 정규분포를 이루는지 (p > 0.05)
> Normal distribution: 수집된 자료의 분포를 근사하는데 사용됨
3. 정규분포가 등분산을 하는지 (p > 0.05)
> Equel-variance: 두 개의 모집단에서 추출된 각 샘플 간의 분산이 같음
이 세 조건 부합 여부에 따라 통계 분석 방법이 달라진다.
아래 간단하게 확인할 수 있는 모식도를 준비했다.
## 세 그룹 간 비교
두 그룹간 비교와 마찬가지로 연속 변수, 정규분포, 등분산 여부에 따라 통계 분석법이 달라진다.
통계 방법은 아래 그림으로 정리해보았다.
다음 편은 R을 활용하여 그룹별로 통계분석을 정하기 위한 사전 작업과 각 통계 방법에 따른 R script를 공유할 예정이다.