Title DNA 염기 서열로부터 contig 구성을 위한 프로그램 XFAP의 개발
Author 이병욱 · 박기정 · 김승목 *
Address 생명공학연구소 유전체사업단
Bibliography Korean Journal of Microbiology, 34(1-2),58-63, 1998
DOI
Key Words contig assembly, dimer frequency comparison method, linear space algorithm, X-window program, XFAP
Abstract ‘Contig 구성문제’는 random sequencing 단편들로부터 DNA 염기 서열의 정보를 밝혀낼 경우 발생하는 문제이다. 본 연구에서는 이러한 contig 구성문제를 해결하기 위한 알고리즘을 구성하였으며, X-window 응용 프로그램인 XFAP을 개발하였다. XFAP에서는 dimmer 빈도 비교 방법을 사용하여 중첩 가능성이 없는 단편을 효과적으로 제거하였다. 이 방법은 단편 쌍 중첩에서 최소 수용 중첩 가능성이 없는 단편을 효과적으로 제거하였다. 이 방법은 단편 쌍 중첩에서 최소 수용 중첩 길이 내의 각 단편 사이의 dimmer 빈도 차이를 이용하여 단편쌍을 선별하는 것이다. 또한 단편 쌍 최대치 정렬 과정의 메모리 사용량을 줄이기 위해서, myers 알고리즘을 적용하여 linear space에서 최대치 정렬을 구하는 방법을 사용하였다. 그리고 본 프로그램은 사용자들에게 편리한 그래픽 환경을 제공하기 위해서 Motif 라이브러리를 사용하여 X-window에서 구현되었다. 본 프로그램의 테스트 데이터를 생성하기 위해서 GenBank 데이터베이스에서 일정 길이의 염기 서열을 추출한 다음, sequencing시 일어날 수 잇는 모든 오류들을 고려하여 단편 샘플을 생성하였다. 단편 샘플에 대새서 dimmer 빈도 비교 방법의 효과 및 실행 시간을 측정하였다. 특히 dimmer 빈도 비교 방법의 효율은 단편의 길이에 비례하여 증가하는 것으로 나타났다.
Download PDF Kor_3401~210_58-63p.pdf