본문 바로가기
통계분석

[통계] 마이크로바이옴 분석시 그룹간 통계분석

by 박논뷰 2022. 9. 4.

## 연구자에게 있어서 통계분석은 절대적!으로 필요하다. 

최근에는 대부분의 프로그램 (R, Python 등) 은 사용자가 원하는 통계 분석을 쉽게 할 수 있도록 도와준다. 

통계에 대한 깊이있는 지식이 없더라도 우리가 원하는 통계 결과를 도출할 수 있다.  

분석하고자 하는 샘플에 따라 통계 방법이 달라지고 달라진 통계 방법에 따라 논문의 흐름과 방향이 달라진다. 

이러한 이유 때문에 미루고 미뤄왔던 통계 공부를 시작해보려고 한다. 

 

 

## 두 그룹간 비교

그룹 간 평균 비교는 마이크로바이옴 분석 시 (알파 다양성, 베타 다양성 등) 주로 사용된다. 

(특정 약물 또는 식품 섭취 전/후 비교 등)

그룹 간의 비교를 하기 위해서는 크게 세 가지 조건을 부합해야 한다. 

 

1. 결과값이 연속 변수인지

    > Continuous variable: 변수의 각 값 사이에 많은 또 다른 값들이 존재함 (키, 몸무게 등)

2. 각각의 결과값이 정규분포를 이루는지 (p > 0.05)

    > Normal distribution: 수집된 자료의 분포를 근사하는데 사용됨

3. 정규분포가 등분산을 하는지 (p > 0.05)

    > Equel-variance: 두 개의 모집단에서 추출된 각 샘플 간의 분산이 같음

 

이 세 조건 부합 여부에 따라 통계 분석 방법이 달라진다. 

아래 간단하게 확인할 수 있는 모식도를 준비했다. 

 

 

## 세 그룹 간 비교

두 그룹간 비교와 마찬가지로 연속 변수, 정규분포, 등분산 여부에 따라 통계 분석법이 달라진다. 

통계 방법은 아래 그림으로 정리해보았다. 

다음 편은 R을 활용하여 그룹별로 통계분석을 정하기 위한 사전 작업과 각 통계 방법에 따른 R script를 공유할 예정이다.