Mothur 사용하기. 16s 앰플리콘 데이터를 분석하는 방법중 많이 사용하는 프로그램 중 하나인 Mothur를 사용려면 어떻게 해야 할까. Mothur 설치 Mothur의 가장 큰 장점이라면 '쉬운 설치'이다. 아래 웹사이트에 들어가서 자신의 컴퓨터의 운영체제에 맞는 파일을 다운로드 받아서 압축을 푼다. 설치가 끝났다!!!https://github.com/mothur/mothur/releases윈도우를 사용하는 경우라면 : Mothur.win_64.zip맥을 사용하는 경우라며: Mothur.linux_64.zip리눅스를 사용하는 경우라면: Mothur.linux_64.zip을 다운로드 하면 된다. 데이터베이스 다운로드Mothur에서는 두개의 reference database를 사용한다. 아래 링크에서 ..
Mothur SOP 를 따라하려면 Stability파일을 만들어야 하는데, 이게 생각보다 쉽지 않다. 아래는 이 파일을 쉽게 만들 수 있는 방법을 소개한다. 시퀀싱 파일이 각 샘플별로 이미 demultiplex 되어 있고, 파일 이름이 samplename_R1_001.fastq, samplename_R2_001.fastq 와 같은 식으로 되어 있다고 하자. 시퀀스 파일이 있는 폴더 안에서 아래와 같은 방법으로 stability파일을 만든다. ls *R1_001.fastq | cut -f1 -d "_" > groupnames.txt ls *R1_001.fastq > forward.txt ls *R2_001.fastq > reverse.txt paste groupnames.txt forward.txt > t..
Miseq 시퀀싱을 맏기면 시퀀싱 센터에서 파일을 준다. 어디에 맏기는지에 따라 다르지만 샘플을 나누는 demultiplex 과정을 거치지 않고 주는 경우 read1, read2, index 파일 총 3개 또는 4개(두개의 인덱스)의 파일을 준다. 아래 그림과 같이 말이다. 수십개의 샘플을 보냈는데 파일이 달랑 4개라니!!! 도대체 내 시퀀스는 어디에 있단 말인가! 하지만 걱정할 필요 없다. 위에 4개의 파일안에 여러분이 필요한 모든 정보가 들어있다. 파일을 자세히보면 R1, R2라고 되어 있는 파일이 실제 시퀀스가 들어있는 파일이다. R1는 Read1 을 뜻하고 forward read를 말한다. R2는 Read2이고 reverse read이다. paired-end 를 사용했을 경우 이렇게 두개의 파일이..
QIIME을 이용해 키메라 (Chimera)를 제거하는 방법은 Usearch를 이용하는 것과 ChimeraSlayer를 이용하는 것 두가지가 있다. 1. usearch를 이용하는 방법usearch61 은 QIIME기본설치에 포함되지 않기 때문에 따로 설치해야 한다. 그리고, usearch 명령어는 버전 5.2.236 그리고 usearch61은 버전 6.1.544가 설치되어야 한다. 이해하기 어렵지만 두개 버전이 모두 설치 되어야 하고, 최신 버전이 아닌 아래 제공되는 버전을 설치해야 한다. 설치하는 방법은 아래와 같다. 파일을 다운받아 시스템 폴더에 복사해 넣는 것으로 충분하다. curl -O https://raw.githubusercontent.com/edamame-course/2015-tutorial..
QIIME 사용법 QIIME(차임) 을 이용해 16s 시퀀스를 분석하는 방법을 설명하고자 한다. 시퀀싱을 해주는 곳에 따라서 받게 되는 파일이 다를 수 있지만 기계에서 얻어지는 파일을 아무 작업 없이 받았다고 가정하고 글을 쓴다. 가끔 시퀀싱을 해주는 곳에서 퀄리티 트림, merge 등의 작업을 해서 보내주는 경우도 있으니 그런 경우에는 단계 중간에 맞는 부분부터 시작하면 된다. 만약 일루미나 Miseq 에서 시퀀싱을 했다면 세개의 파일을 받게 된다. 1) Undetermined_S0_L001_R1_001.fastq.gz2) Undetermined_S0_L001_R2_001.fastq.gz3) Undetermined_S0_L001_I1_001.fastq.gz 1번 파일은 Paired end의 forwar..
시작하기 전에 이 글은 16s 앰플리콘 시퀀스 분석을 위한 글임을 알려둔다. 16s 앰플리콘 시퀀싱과 샷건 시퀀싱을 흔히 메타지노믹스라고 혼동하여 사용하는 경향이 있는데, 본인은 샷건 시퀀싱을 메타지노믹스라고 부르고 16s를 시퀀싱 한것은 앰플리콘 시퀀싱이라고 불러야 한다고 생각한다. 자세한 내용은 여기를 참고. 16s시퀀싱은 이미 보편화 되어 사용되기 때문에 분석의 방법이나 툴이 어느정도 갖추어져 있다. 사람들이 가장 많이 사용하는 두가지 프로그램은 QIIME과 Muther이다. 두 프로그램 모두 여러 단계를 거쳐야 하는 분석을 한개의 프로그램에서 수행 가능하게 해준다. 1. QIIME (http://qiime.org) 발음은 '차임'으로 한다. 시퀀싱 분석을 위해 거쳐야 하는 많은 단계를 몇개의 co..