텍스트 중에 특정 문자가 포함되어 있는지, 어디에 있는지 찾아야 할 때가 있다. 그때는 아래와 같은 방법을 상용한다. 1. 특정 문자열이 포함되어 있는지 확인할때string = 'test test test'if 'test in string:print string 2. 특정 문자열이 포함된 위치를 확인할 때string = "this is test string"print string.find("test") 3. 특정 문자열이 여러번 포함된 경우import rest = [m.start() for min re.finditer('test', 'test test test test')] print st
QIIME을 이용해 키메라 (Chimera)를 제거하는 방법은 Usearch를 이용하는 것과 ChimeraSlayer를 이용하는 것 두가지가 있다. 1. usearch를 이용하는 방법usearch61 은 QIIME기본설치에 포함되지 않기 때문에 따로 설치해야 한다. 그리고, usearch 명령어는 버전 5.2.236 그리고 usearch61은 버전 6.1.544가 설치되어야 한다. 이해하기 어렵지만 두개 버전이 모두 설치 되어야 하고, 최신 버전이 아닌 아래 제공되는 버전을 설치해야 한다. 설치하는 방법은 아래와 같다. 파일을 다운받아 시스템 폴더에 복사해 넣는 것으로 충분하다. curl -O https://raw.githubusercontent.com/edamame-course/2015-tutorial..
NCBI의 많은 정보가 Genbank 형식으로 저장되어 있다. 하지만 여기에서 내가 원하는 유전자의 단백질이나 DNA의 서열을 얻는 것은 초보자에게 어려울 수 있다. 아래의 파이선 코드를 이용하여 genbank파일에서 단백질과 DNA서열을 얻는 방법을 소개한다. 1. 먼저 NCBI에서 genbank파일을 얻는다. 이 링크 페이지를 예로들어보자. 링크를 눌러 NCBI에 들어가면 Clostridium thermocellum 의 full-genome 정보가 Genbank 형식으로 보여진다. 먼저 이 정보를 다운받기 위해 오른쪽 위에 Send를 누르고, Complete Record, File 을 선택한 후에 Format 부분에서 Genbank(full)을 선택해 준다. 만약 Full버전이 아닌 그냥 Genban..