Triander – нова програма для візуального аналізу нуклеотидних послідовностей / Дуплій В.П., Дуплій С.А. 2015

Матеріал з ІКБГІ
Перейти до: навігація, пошук
Рис. 1. Диаграммы обхода ДНК последовательности гена нитрат редуктазы Nia1;2 Physcomitrella patens (Генбанк AB232049): а – полная последовательность; б-г – фрагмент AB232049:2601-26300. Для построения использовались нуклеотидные векторы равной длины (а, б) и пропорциональные степени детерминации нуклеотида (в, г). Длина единичного вектора: а-в – равна ширине нуклеотидной кривой, г – больше ширины кривой

Нашей задачей было создание оригинальной программы рендеринга нуклеотидных последовательностей (несколькими различными способами) и предоставление пользователю интерактивных возможностей управления визуализацией (масштабирование, выбор участка последовательности и т.д.) в реальном времени.

В отличие от других способов визуализации, мы предлагаем естественное представление нуклеотидных последовательностей в виде кривых, где в соответствие основаниям поставлены разнонаправленные векторы. В дальнейшем такие векторы будем называть нуклеотидными векторами, а кривые, образованные ими, нуклеотидными кривыми.

Метод основывается на использовании в качестве длины нуклеотидного вектора его «внутреннюю абстрактную характеристику – степень детерминации». Степень детерминации – это числовая характеристика нуклеотида, связанная с его способностью определять аминокислоту в зависимости от положения в кодоне, а также с так называемым эволюционным «давлением». Кроме того, принимается во внимание число водородных связей.

Важным является построение именно трех нуклеотидных кривых, которые соответствуют каждому положению в кодоне, что дает построение трех обходов для каждого положения нуклеотида в триплете. При учете степени детерминации такая диаграмма называется триандром. В предыдущей работе также показано, что гипотетическое количество нуклеотидов в кодоне, отличное от трех, а также случайно сгенерированные нуклеотидные последовательности вообще не приводят к появлению таких визуальных структур, как триандры.

Рис.2 Направление и длина нуклотидных векторов

Среди возможных комбинаций направлений нуклеотидних векторов, т.е. векторов, которые представляют тот или иной нуклеотид на диаграмме, нами была выбрана такая: С – Север, G – Юг, T – Восток, A – Запад (рис. 2). Так как степень детерминации, а значит и длина нуклеотидного вектора составляет для С – 4, для G – 3, для T – 2, для A – 1, то диаграмма обхода последовательности случайно выбранных нуклеотидов в нашем случае распространяется в северо-восточном направлении. Это направление, как и четыре основных, указывается на диаграмме.

Обычно диаграммы обхода ДНК строятся однопиксельными квадратами, поэтому помимо потерь информации из-за прохождения кривой по одним и тем же координатам добавляются потери от слияния лежащих рядом участков кривой. Проблема становится острее при переходе от анализа геномов и хромосом к анализу отдельных генов и регуляторных последовательностей. Мы реализовали возможность задавать длину единичного вектора больше ширины нуклеотидной кривой (рис. 1 г), что с одной стороны сделало диаграммы более читаемыми, а с другой стороны дает возможность таким способом их правильно масштабировать.

Рис.3. Диаграммы обхода последовательности DQ157859 в зависимости от положения основания в кодоне. а – триандр кодирующей области гена сахарозо-фосфат-синтаза 2 Physcomitrella patens (PpSPS2). б – главное окно программы «Triander», представляющее обход последовательности равными по модулю нуклеотидными векторами

Кроме того, большие диаграммы можно смещать по осям координат и задавать для отображения только определенную часть последовательности. Последовательность может быть отображена как в виде триандра (рис. 3 а), ветви которого отображаются кривыми разной толщины, так и обычным методом обхода ДНК, названным в программе по аналогии «монандром». Есть также возможность представить последовательность векторами равной длины. Нужно заметить, что скорости построения диаграмм достаточно для того, чтобы наблюдать анимацию при удерживании кнопки увеличения длины отображаемой последовательности или кнопок смещения ее начала.

Созданная нами программа «Triander» (рис. 3б) визуализирует нуклеотидные последовательности, хранящиеся в файлах формата FASTA и GenBank, а также в обычных текстовых файлах. После загрузки файл доступен для просмотра и редактирования. Диаграммы обхода ДНК строятся в широко распространенном формате векторной графики SVG, реализована возможность сохранения диаграмм в этом формате.

Выводы Разработанная нами программа «Triander» позволяет строить несколько вариантов диаграмм понуклеотидного обхода ДНК. Применение внутренней абстрактной характеристики основания, называемой степенью детерминации, в качестве длины нуклеотидного вектора позволяет проводить как общий визуальный анализ на уровне хромосом и геномов, так и выявлять отдельные нуклеотидные паттерны.

Источники

  • Дуплий В.П., Дуплий С.А. Triander – новая программа для визуального анализа нуклеотидных последовательностей // Фактори експериментальної еволюції органiзмiв: Зб. наук. пр. / Національна академія наук України, Інститут молекулярної біології і генетикп, Укр. Т-во генетиків і селекціонерів iм. М.I. Вавилова; редкол. / В. А. Кунах (голов. ред.) [та iн.] – К.: Укр. т-во генетиків і селекціонерів ім. М.І. Вавилова, 2015. – Т. 17. – С. 51-54
  • Препринт на arXiv: http://arxiv.org/abs/1504.04866

Дополнительная литература по теме

  • Cowin J.E., Jellis C.H., Rickwood D. A new method of representing DNA sequences which combines ease of visual analysis with machine readability // Nucleic Acids Res. – 1986. – 14, № 1. – P. 509–515.
  • Hamori E, Ruskin J.H Curves A Novel Method of Representation of Nucleotide Series Especially Suited for Long DNA Sequences. // J. Biol. Chem. – 1983. – 258, № 2. – P. 1318–1327.
  • Gates M.A. Simpler DNA sequence representations // Nature. – 1985. – 316. – P. 219–219.
  • Lobry J.R. Genomic landscapes // Microbiology Today. – 1999. – 26. – P. 164–165.
  • Duplij D., Duplij S. DNA sequence representation by trianders and determinative degree of nucleotides // J Zhejiang Univ Sci B. – 2005. – 6, № 8. – P. 743–755.
  • Duplij D., Duplij S. Symmetry analysis of genetic code and determinative degree // Biophysical Bull. Kharkov Univ. – 2000. – 488. – P. 60–70.
  • Cebrat S., Dudek M. The effect of DNA phase structure on DNA walks // The European Physical Journal B – Condensed Matter and Complex Systems. EDP Sciences. – 1998. – 3, № 2. – P. 271–276.

Программа и исходный код

Особисті інструменти
Простори назв

Варіанти
Дії
 
   
Інструменти
Іншими мовами