티스토리 뷰
시퀀싱을 하면 결과가 보통 FASTQ 포멧으로 나온다. 하지만 가끔은 FASTA포멧이 필요할 때가 있다. FASTQ 포멧을 FASTA포멧으로 변경하는 방법을 소개한다. 리눅스 또는 맥의 터미널을 이용한다고 가정한다.
cat filename.fastq | paste - - - - | sed 's/^@/>/g'| cut -f1-2 | tr '\t' '\n' > filename.fasta
조금 복잡해 보일 수 있으나 의외로 간편하게 아무런 프로그램을 설치하지 않고도 포멧 변경이 가능하다.
여러개의 파일을 한꺼번에 바꾸려면 다음과 같이 for 구문을 사용하면 된다.
for x in *.fastq;do cat $x | paste - - - - | sed 's/^@/>/g'| cut -f1-2 | tr '\t' '\n' > ${x%.fastq*}.fasta;done
'바이오 인포매틱스 ' 카테고리의 다른 글
리눅스에서 FTP 접속하기 (0) | 2017.01.14 |
---|---|
NCBI 시퀀스 등록 (0) | 2017.01.06 |
미생물 생태학 (Microbial ecology)의 대가는 누구인가요? (0) | 2017.01.05 |
단백질 ID로 DNA 시퀀스 찾기 (0) | 2016.12.09 |
NCBI를 믿어도 되는가? (0) | 2016.11.05 |
댓글