유닉스/리눅스에서 많이 사용하는 압축 방법은 gz와 tar 이 있다. gz는 한개의 파일을 압축할 때 사용하고 tar은 여러개의 파일은 한개로 묶어줄 때 사용한다. 여러개의 파일을 한개로 묶고 압축까지 하고 싶다면 tar.gz 로 사용할 수 있다. 사용방법은 아래와 같다 1. gz 압축풀기gz는 gzip의 확장자이다. gz로 압축되어 있는 파일을 풀기 위해서는 아래와 같이 한다.gunzip filename.gz 2. gz로 압축하기한개의 파일을 압축할때 gzip을 사용한다.gzip filename 3. tar.gz 압축풀기여러개의 파일/폴더의 경우 tar.gz로 제공되는 경우가 많다. 이 파일은 아래와 같이 압축을 해제한다.tar -zxvf filename.tar.gz 4. tar.gz로 압축하려면 아래..
유닉스는 1969년 처음 발표되어 리눅스로 계승되면서 현재까지 활발하게 사용되고 있다. 윈도우를 사용하는 많은 사용자들에게는 조금 낯설 수 있으나 전문영역에서는 가장 안정적인 시스템으로 여겨지고 있다. 오랜 역사를 가진 만큼 많은 유닉스 명령어도 오랜 시간 '살아남은' 것들이다. 다시말해 사용자들에 의해 그 필요성과 유용성이 철저히 검증되었다고 할 수 있다. 실제로 이들은 하나 하나가 모두 작은 프로그램이다. 하지만 모든 유닉스/리눅스 계열 시스템에 기본으로 장착되어 있어 마치 자체 명령어처럼 느껴지는 것들이다. 이중에 많이 사용하는 것들을 소개한다. 1. cat, head, tail, less, more텍스트 파일을 열어보고 싶을때 사용한다. 유닉스/리눅스의 기본 파일 시스템은 텍스트 파일로서 데이터나..
리눅스/유닉스 시스템에서 많이 사용하는 압축 포멧은 gz 와 tar이 있다. gz는 한개의 파일을 압축할 때, tar은 여러개의 파일을 압축해 하나로 만들때 주로 사용한다. 한개 파일 (gz) 압축 풀기만약 sample01.fastq.gz 라는 파일의 압축을 풀고 싶으면 아래와 같이 실행한다. gunzip sample01.fastq.gz 이렇게 하면 sample01.fastq 라는 파일이 만들어 진다. gunzip은 와일드카드를 인식한다. 만약 여러개 파일을 한꺼번에 각각 압축하고 싶다면 아래와 같이 사용할 수 있다gunzip sample*.fastq.gz 한개 파일(gz) 압축하기 만약 sample01.fastq 라는 파일을 압축하고 싶으면 아래와 같이 실행한다. gzip sample01.fastq 그..
리눅스 커맨드라인 (Command-line)에서 for문을 사용해서 반복 실행이 가능하다!!! 이걸 처음 알았을 때 내게 정말 대박! 이었다. 만약 커맨드라인 (Command-line), 터미널(Terminal), 배쉬(Bash)가 무엇인지 궁금하다면 여기를 클릭! 커맨드 라인을 사용해 프로그램을 돌려본 사람이라면 프로그램을 여러번 반복해서 돌려야 하는 일이 힘들다는 것을 알것이다. 바이오인포매틱스를 하면서 이런 어려움이 피부로 느껴진다. 예를들어 샘플이 60개 라고 하면 파일이 60개가 나오는데, 분석을 하려면 프로그램을 적게는 몇개에서 많게는 열개 넘게 돌려야 한다. 만약 10개의 프로그램을 돌려야 분석이 마쳐진다고 하면 60 X 10 총 600번의 커맨드 입력을 해야한다!!! 이 과정을 자동화 혹은..
지난번 포스트를 통해 자신의 컴퓨터에 터미널을 설치하고 실행하는 방법을 배웠다. 이번에는 터미널에서 사용되는 기본적인 명력어를 익혀 보기로 한다. 터미널에서 사용되는 명령어는 유닉스계열의 명령어를 사용한다. 리눅스와 같다. 맥과 리눅스 운영체제는 유닉스기반에서 만들어졌기 때문에 같은 명령어를 사용한다. 윈도우는 도스기반으로 만들어져서 다르다. 이번에 배울 명령어는 유닉스 계열의 명령어이다. 디렉토리(폴더) 안에 어떤 파일이 있는지 보고 싶을 때현재 내가 있는 폴더안에 어떤 파일이 있는지 보고 싶을 때 아래와 같이 입력하고 엔터를 누른다. List의 약자이다. ls 다른 폴더로 가고 싶을 때컴퓨터 파일 시스템은 트리 구조를 가지고 있다. 트리구조란 폴더안에 폴더.. 이런식으로 생각하면 된다. 현재 있는 폴..
윈도우 환경에 익숙한 대부분의 사용자에게 커맨드라인(Command Line)은 바이오인포매틱스(Bioinformatics)로 들어가는데 가장 큰 허들일 것이다. 심지어 검색으로 나오는 대부분의 결과들이 이미 커맨드라인을 안다고 가정하고 있어서 "도대체 이걸 어떻게 실행하라는 거야!" 라는 생각이 들기도 한다. 본 블로그에서 소개하는 바이오인포매틱스, 파이썬 관련 포스트 들이 또한 커맨드라인을 사용하고 있다. 이 부분을 잘 모르는 사람들을 위해 '컴퓨터를 프로처럼 사용'하는 커맨드라인을 소개한다. 실제로 많은 프로그래머, 컴퓨터 전공자들이 아래와 같은 커맨드라인을 사용한다. 처음에는 조금 어려워 보일 수 있지만 조금만 시간을 들여 익숙해 진다면 컴퓨터 전공자처럼 컴퓨터를 사용할 수 있다!! 터미널 열기제일..