리눅스/유닉스 시스템에서 많이 사용하는 압축 포멧은 gz 와 tar이 있다. gz는 한개의 파일을 압축할 때, tar은 여러개의 파일을 압축해 하나로 만들때 주로 사용한다. 한개 파일 (gz) 압축 풀기만약 sample01.fastq.gz 라는 파일의 압축을 풀고 싶으면 아래와 같이 실행한다. gunzip sample01.fastq.gz 이렇게 하면 sample01.fastq 라는 파일이 만들어 진다. gunzip은 와일드카드를 인식한다. 만약 여러개 파일을 한꺼번에 각각 압축하고 싶다면 아래와 같이 사용할 수 있다gunzip sample*.fastq.gz 한개 파일(gz) 압축하기 만약 sample01.fastq 라는 파일을 압축하고 싶으면 아래와 같이 실행한다. gzip sample01.fastq 그..
파이썬(python)을 이용해 파일을 복사하거나 옮기려면 파이썬에서 시스템 커맨드라인을 실행하게 하면 된다. 먼저, import os 를 불러주고, import osos.system("cp old_file.txt new_file.txt") 이런 식으로 커맨드를 따옴표안에 넣어 실행한다. 커맨드를 변수형태로 부를수도 있다. 예를들어 list.txt 안에 sample01sample02sample03 위와같이 있다고 하자, 그리고 폴더안에 sample01.R1.fastq.gzsample01.R2.fastq.gzsample02.R1.fastq.gzsample02.R2.fastq.gzsample03.R1.fastq.gzsample03.R2.fastq.gz 위와 같은 파일이 있다고 하자. 이 파일들을 new 라는 ..
Mothur SOP 를 따라하려면 Stability파일을 만들어야 하는데, 이게 생각보다 쉽지 않다. 아래는 이 파일을 쉽게 만들 수 있는 방법을 소개한다. 시퀀싱 파일이 각 샘플별로 이미 demultiplex 되어 있고, 파일 이름이 samplename_R1_001.fastq, samplename_R2_001.fastq 와 같은 식으로 되어 있다고 하자. 시퀀스 파일이 있는 폴더 안에서 아래와 같은 방법으로 stability파일을 만든다. ls *R1_001.fastq | cut -f1 -d "_" > groupnames.txt ls *R1_001.fastq > forward.txt ls *R2_001.fastq > reverse.txt paste groupnames.txt forward.txt > t..