대부분 언어에 기본적인 문법은 비슷하다. 하지만 간혹 기본 문법에서 사소한 차이를 보이기도 한다. 파이선과 다른 대부분의 언어(C++, Java, R) 에서의 If 문을 비교해 보면 아래와 같다 Python, 파이선 if 조건1:statementelif 조건 2:statementelse:statement C++ , Java (자바), R if ( 조건 1) {Statement} else if (조건 2){statement} else {statement}
파이선(Python)을 사용하기 위해서는 먼저 파이선을 설치해야 한다. https://www.python.org 여기 공식 페이지에서 다운로드하고 설치하면 된다. 다운로드를 받으려고 하면 3.x 버전과 2.7.x버전 두가지가 나온다. 3.x 버전은 새로운 문법이 도입되었다. 따라서 두개의 버전이 호환되지 않는다. 많은 바이오 인포매틱스 관련 코드가 이미 2.7.x버전으로 쓰여졌기 때문에 다른 사람들이 쓴 코드를 이용하려면 2.7.x를 쓰는 것이 좋다. 파이선 코드를 작성하고 실행하는 방법은 여러가지가 있지만 가장 프로(?)답게 사용하는 방법을 커맨드 라인을 이용하는 것이다. 커맨드 라인을 사용하는 방법 새로운 언어로 코딩을 처음 시작할 때 가장 먼저 하는 것이 "hello world"이다. 이는 hell..
파이선을 설치하고 실행하는데 성공했다면 이제 본격적으로 파이선을 이용한 코딩을 배워보자. 파이선에는 기본으로 들어있는 괜찮은 함수가 많다. open(파일이름, 모드)파일을 열어주는 함수이다. 파일은 텍스트 파일을 말한다. 파일이름에는 열고싶은 파일 이름을, 모드는 읽기 'r' 또는 쓰기 'w'를 선택한다. 예를들어 아래와 같이 사용한다.open( 'file_name.txt', 'r') 파일을 열었다면 for 문을 사용해 한줄씩 읽어들일 수 있다. for line in open('file_name.txt','r'):print line 이렇게 하면 파일 내용을 한줄씩 line이라는 변수로 읽어서 출력해 준다. strip()위의 예시를 실행해 보면 파일안에 내용을 출력할 때 빈 줄이 하나씩 더 들어가는 것을 ..
유닉스/리눅스에서 많이 사용하는 압축 방법은 gz와 tar 이 있다. gz는 한개의 파일을 압축할 때 사용하고 tar은 여러개의 파일은 한개로 묶어줄 때 사용한다. 여러개의 파일을 한개로 묶고 압축까지 하고 싶다면 tar.gz 로 사용할 수 있다. 사용방법은 아래와 같다 1. gz 압축풀기gz는 gzip의 확장자이다. gz로 압축되어 있는 파일을 풀기 위해서는 아래와 같이 한다.gunzip filename.gz 2. gz로 압축하기한개의 파일을 압축할때 gzip을 사용한다.gzip filename 3. tar.gz 압축풀기여러개의 파일/폴더의 경우 tar.gz로 제공되는 경우가 많다. 이 파일은 아래와 같이 압축을 해제한다.tar -zxvf filename.tar.gz 4. tar.gz로 압축하려면 아래..
유닉스는 1969년 처음 발표되어 리눅스로 계승되면서 현재까지 활발하게 사용되고 있다. 윈도우를 사용하는 많은 사용자들에게는 조금 낯설 수 있으나 전문영역에서는 가장 안정적인 시스템으로 여겨지고 있다. 오랜 역사를 가진 만큼 많은 유닉스 명령어도 오랜 시간 '살아남은' 것들이다. 다시말해 사용자들에 의해 그 필요성과 유용성이 철저히 검증되었다고 할 수 있다. 실제로 이들은 하나 하나가 모두 작은 프로그램이다. 하지만 모든 유닉스/리눅스 계열 시스템에 기본으로 장착되어 있어 마치 자체 명령어처럼 느껴지는 것들이다. 이중에 많이 사용하는 것들을 소개한다. 1. cat, head, tail, less, more텍스트 파일을 열어보고 싶을때 사용한다. 유닉스/리눅스의 기본 파일 시스템은 텍스트 파일로서 데이터나..
최근 통계관련한 연구에 R이 많이 이용된다. 가장 큰 장점은 무료라는 점이다. SPSS 나 SAS와 비교해 무료라는 것은 정말 큰 장점이 아닐 수 없다. 단점은 처음 배우는데 시간이 걸린다는 점 그리고 속도가 C와 같은 다른 프로그램 랭귀지보다 느리다는 점이다. 1. 설치R의 기본 프로그램은 https://www.r-project.org/ 이곳에서 다운로드 받는다. Download R 이라는 링크를 누르면 많은 미러 사이트가 나오는데, 이것은 서버에 부하를 줄이기 위해 같은 파일을 여러곳에 올려놓은 것이다. 자신이 있는 곳에서 가장 가까운 곳을 고르면 된다. 그러면 리눅스, OSX, 윈도우즈의 자신의 운영체제에 맞은 파일을 찾아 다운로드 하면된다. 2. R 스튜디오R을 사용하기 위해 꼭 필요한 프로그램은..
바이오인포매틱스 연구를 하다보면 많은 경우 파일이 gz파일로 압축되어 있다. gzip은 단일 파일을 압축하는 좋은 방법이지만 열어보려면 압축을 풀어야 하는 번거로움이 있다. 그런데 파이썬에서 gz 파일의 압축을 풀지 않고 바로 읽을 수 있는 방법이 있다! gzip이라는 라이브러리를 이용하면 된다. import gzipgb_file = gzip.open(sys.argv[1],'rb') 이렇게 하면 첫번째 argument 로 받은 파일을 압축 해제 없이 바로 열어볼 수 있다. 예외처리: 만약 읽은 파일이 압축 파일이 아니라면? 압축된 파일과 그렇지 않은 파일을 모두 핸들하기 위해 아래와 같이 사용할 수 있다. if sys.argv[1][-2:] == 'gz':gb_file = gzip.open(sys.arg..