티스토리 뷰

바이오 인포매틱스 /파이썬 (Python)

[파이썬] python에서 gz파일 열기

메타지노믹스 메타지노믹스 2017.01.20 02:56

바이오인포매틱스 연구를 하다보면 많은 경우 파일이 gz파일로 압축되어 있다. gzip은 단일 파일을 압축하는 좋은 방법이지만 열어보려면 압축을 풀어야 하는 번거로움이 있다. 그런데 파이썬에서 gz 파일의 압축을 풀지 않고 바로 읽을 수 있는 방법이 있다! gzip이라는 라이브러리를 이용하면 된다. 


import gzip

gb_file = gzip.open(sys.argv[1],'rb')


이렇게 하면 첫번째 argument 로 받은 파일을 압축 해제 없이 바로 열어볼 수 있다.


예외처리: 만약 읽은 파일이 압축 파일이 아니라면? 압축된 파일과 그렇지 않은 파일을 모두 핸들하기 위해 아래와 같이 사용할 수 있다.


if sys.argv[1][-2:] == 'gz':

gb_file = gzip.open(sys.argv[1],'rb')

else:

gb_file = open(sys.argv[1],'r')


 

신고
댓글
  • 프로필사진 헤이주드 안녕하세요. 저는 qiime으로 community 분석을 진행하는 꼬꼬마 입니다.
    메타지노믹스 관련포스트 잘읽었습니다~

    그래서 저도 무언가 도움을 드릴 수 있을 것 같아서 댓글을 남깁니다.

    argument parser로 click을 추천드립니다.
    pip install click을 하시면 패키지매니지먼트 툴이 click이라는 3rd 파티 프로그램을 설치해 줍니다. 이게 또 물건인지라...ㅎㅎ

    http://click.pocoo.org/5/

    파이썬으로 필요한 라리브러리 & 툴을 검색하고 싶으시면

    https://github.com/vinta/awesome-python

    왠간한 툴은 사람들이 만들어 놓은 것 같습니다. ㅎㅎ

    그럼 즐거운 코딩하세요~

    아 참 개발환경으로는 pycharm 커뮤니티 버전을 추천합니다. ㅎㅎ
    2017.06.03 22:15 신고
  • 프로필사진 메타지노믹스 메타지노믹스 좋은 정보 감사합니다! 2017.06.06 22:50 신고
댓글쓰기 폼
공지사항
Total
3,317
Today
8
Yesterday
20
링크
«   2017/06   »
        1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30  
글 보관함