티스토리 뷰

바이오인포매틱스 연구를 하다보면 많은 경우 파일이 gz파일로 압축되어 있다. gzip은 단일 파일을 압축하는 좋은 방법이지만 열어보려면 압축을 풀어야 하는 번거로움이 있다. 그런데 파이썬에서 gz 파일의 압축을 풀지 않고 바로 읽을 수 있는 방법이 있다! gzip이라는 라이브러리를 이용하면 된다. 


import gzip

gb_file = gzip.open(sys.argv[1],'rb')


이렇게 하면 첫번째 argument 로 받은 파일을 압축 해제 없이 바로 열어볼 수 있다.


예외처리: 만약 읽은 파일이 압축 파일이 아니라면? 압축된 파일과 그렇지 않은 파일을 모두 핸들하기 위해 아래와 같이 사용할 수 있다.


if sys.argv[1][-2:] == 'gz':

gb_file = gzip.open(sys.argv[1],'rb')

else:

gb_file = open(sys.argv[1],'r')


 

댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/03   »
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31
글 보관함