티스토리 뷰
바이오인포매틱스 연구를 하다보면 많은 경우 파일이 gz파일로 압축되어 있다. gzip은 단일 파일을 압축하는 좋은 방법이지만 열어보려면 압축을 풀어야 하는 번거로움이 있다. 그런데 파이썬에서 gz 파일의 압축을 풀지 않고 바로 읽을 수 있는 방법이 있다! gzip이라는 라이브러리를 이용하면 된다.
import gzip
gb_file = gzip.open(sys.argv[1],'rb')
이렇게 하면 첫번째 argument 로 받은 파일을 압축 해제 없이 바로 열어볼 수 있다.
예외처리: 만약 읽은 파일이 압축 파일이 아니라면? 압축된 파일과 그렇지 않은 파일을 모두 핸들하기 위해 아래와 같이 사용할 수 있다.
if sys.argv[1][-2:] == 'gz':
gb_file = gzip.open(sys.argv[1],'rb')
else:
gb_file = open(sys.argv[1],'r')
'바이오 인포매틱스 > 파이썬 (Python)' 카테고리의 다른 글
파이선 기본 함수를 사용해 파일 열고 읽기 (0) | 2017.07.25 |
---|---|
[파이썬] 와일드 카드를 이용한 파일 읽기 (0) | 2017.01.20 |
파이썬(python) 에서 파일 복사하기, 옮기기 (0) | 2017.01.10 |
[파이썬] 텍스트 중에 특정 문자가 포함되어 있는지 찾기 (1) | 2016.12.07 |
Genbank 파일에서 단백질과 DNA 시퀀스 추출하기 (0) | 2016.11.28 |
댓글