티스토리 뷰

메타지노믹스

MG-RAST 어노테이션 서버

메타지노믹스 2016. 11. 9. 01:42


메타지놈 시퀀스를 받고 본격적으로 분석을 하기 위해서는 세가지 정보가 필요하다. 1) 메타데이터, 2) 카운트 테이블, 3) 어노테이션. 이중에서 어노테이션을 설명하려고 한다. 어노테이션은 쉽게말해 시퀀스가 어떤 기능을 가지고 있는지, 어드 유기체에서 왔는지 찾는 것을 말한다. 일루미나로 시퀀싱을 하면 250~300 베이스 페어 길이의 시퀀스를 얻게 된다. 이 시퀀스가 어느 유전자의 한 부분일수도 있고 유전자 사이에 단백질을 만들지 않는 부분일수도 있다. 간혹 드물게 두개 이상의 유전자 부분이 한 시퀀스에 있을 수도 있다. 이렇게 복잡한 경우의 수를 모두 생각해서 어디가 유전자 부분이고, 알려진 단백질 중에 어떤것과 비슷하고 하는 것들을 일일이 연구자가 정하기도 어렵고 또 이런 작업은 대부분 랩탑 수준의 컴퓨터에서는 계산을 수행할 수 없다. 다행히도 미국 알곤 국립 연구소 (Argonne National Laboratory , http://www.anl.gov)에서 슈퍼컴퓨터를 이용해 이런 과정을 대신 수행해 주는 서비스를 무료로 제공하고 있다. 


MG-RAST http://metagenomics.anl.gov/

MG-RAST는 메타지놈 분석을 수행해 주는 서비스로 컴퓨터를 잘 모르는 초보자들이 사용하기 좋다. 기계에서 얻은 Raw 시퀀스를 웹사이트에 업로드하기만 하면 분석된 정보를 한눈에 볼 수 있다. 


서비스를 이용하려면 먼저 계정을 만들어야 한다. "Register"버튼을 누르고 계정 가입을 하고 하루정도 기다리면 계정 승인이 난다. 그럼 오른쪽 위에 '화살표' 버튼을 눌러 파일을 업로드 할 수 있다. 파일이 많지 않은 경우에는 이 페이지에서 업로드 하면 된다. 만약 업로드 해야 하는 파일이 많은 경우에는 API를 이용하면 편리하지만 약간의 컴퓨터 지식이 필요하다. http://api.metagenomics.anl.gov/api.html


MG-RAST의 한가지 단점이라면 좀 오래 기다려야 한다. MG-RAST에서 일하는 사람의 말로는 '매일 수백 테라바이트의 데이터가 올라오기 때문에 다 처리 하기 위해서는 기다리는 시간이 필요하다'고 말한다. 


MG-RAST측에서 말하는 장점은 1) 모든 데이터를 같은 파이프 라인으로 분석한다. 다시말해 분석에 재현성이 크다는 것이다. 2) 모든 데이터 베이스를 이용한다. 이곳에서 KEGG, SEED 등 유명한 데이터 베이스를 모두 이용해 분석해 주므로 사용자가 다른 데이터베이스를 일일이 따로 찾아 새로 분석할 필요도 없고, 결과를 비교하기도 쉽다. 3) 무료다! 4) 컴퓨터를 모르는 사람도 쉽게 이용할 수 있는 결과 페이지를 제공한다. 


컴퓨터를 잘 모르는 경우 마지막 장점이 꽤 크게 다가올 수 있다. 결과 페이지는 아래와 같이 제공된다.




어노테이션을 하는 방법에는 두가지가 있는데 (참고) MG-RAST는 Raw read 분석에 최적화 되어있다. 하지만 Raw read와 Assembly모두 업로드 해서 분석할 수는 있다. 그리고 결과 페이지에서 모든 분석된 파일을 다운로드 받을 수  있다. 


컵퓨터에 익숙한 분들을 위해 API 사용 방법을 소개하면 아래와 같다.

파일을 업로드  하려면, 

curl -H "auth:코드를 여기에 붙인다"  -X POST -F "upload=@/파일패스와 이름"  "http://api.metagenomics.anl.gov/1/inbox/" > curl_output.txt

예를 들면, 

curl -H "auth:AQEmCYUgyh9yuMB9x6vLAFGUu" -X POST -F "upload=@/mnt/data1/jin/H14_ACTTGA_L007_001.fastq.gz" "http://api.metagenomics.anl.gov/1/inbox/" > curl_output_H14_ACTTGA_L007_001.fastq.gz.txt

이렇게 사용할 수 있다.


파일 다운로드도 이런 방법으로 가능하다.  파일이 많은 경우에 이 방법이 특히 유용하다. 


'메타지노믹스' 카테고리의 다른 글

NCBI SRA에 NGS 시퀀싱 파일 올리기  (7) 2017.06.13
NGS 관련 기초 용어 정리  (0) 2017.03.30
RefSoil - Soil reference database 다운로드 받는 방법  (0) 2017.03.23
데이터베이스 정리  (0) 2017.01.11
NGS의 역사  (0) 2017.01.04
댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/03   »
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31
글 보관함