Triander – нова програма для візуального аналізу нуклеотидних послідовностей / Дуплій В.П., Дуплій С.А. 2015

Матеріал з ІКБГІ
Перейти до: навігація, пошук
Рис. 1. Диаграммы обхода ДНК последовательности гена нитрат редуктазы Nia1;2 Physcomitrella patens (Генбанк AB232049): а – полная последовательность; б-г – фрагмент AB232049:2601-26300. Для построения использовались нуклеотидные векторы равной длины (а, б) и пропорциональные степени детерминации нуклеотида (в, г). Длина единичного вектора: а-в – равна ширине нуклеотидной кривой, г – больше ширины кривой

Нашей задачей было создание оригинальной программы рендеринга нуклеотидных последовательностей (несколькими различными способами) и предоставление пользователю интерактивных возможностей управления визуализацией (масштабирование, выбор участка последовательности и т.д.) в реальном времени.

В отличие от других способов визуализации, мы предлагаем естественное представление нуклеотидных последовательностей в виде кривых, где в соответствие основаниям поставлены разнонаправленные векторы. В дальнейшем такие векторы будем называть нуклеотидными векторами, а кривые, образованные ими, нуклеотидными кривыми.

Метод основывается на использовании в качестве длины нуклеотидного вектора его «внутреннюю абстрактную характеристику – степень детерминации». Степень детерминации – это числовая характеристика нуклеотида, связанная с его способностью определять аминокислоту в зависимости от положения в кодоне, а также с так называемым эволюционным «давлением». Кроме того, принимается во внимание число водородных связей.

Важным является построение именно трех нуклеотидных кривых, которые соответствуют каждому положению в кодоне, что дает построение трех обходов для каждого положения нуклеотида в триплете. При учете степени детерминации такая диаграмма называется триандром. В предыдущей работе также показано, что гипотетическое количество нуклеотидов в кодоне, отличное от трех, а также случайно сгенерированные нуклеотидные последовательности вообще не приводят к появлению таких визуальных структур, как триандры.

Рис.2 Направление и длина нуклотидных векторов

Среди возможных комбинаций направлений нуклеотидних векторов, т.е. векторов, которые представляют тот или иной нуклеотид на диаграмме, нами была выбрана такая: С – Север, G – Юг, T – Восток, A – Запад (рис. 2). Так как степень детерминации, а значит и длина нуклеотидного вектора составляет для С – 4, для G – 3, для T – 2, для A – 1, то диаграмма обхода последовательности случайно выбранных нуклеотидов в нашем случае распространяется в северо-восточном направлении. Это направление, как и четыре основных, указывается на диаграмме.

Обычно диаграммы обхода ДНК строятся однопиксельными квадратами, поэтому помимо потерь информации из-за прохождения кривой по одним и тем же координатам добавляются потери от слияния лежащих рядом участков кривой. Проблема становится острее при переходе от анализа геномов и хромосом к анализу отдельных генов и регуляторных последовательностей. Мы реализовали возможность задавать длину единичного вектора больше ширины нуклеотидной кривой (рис. 1 г), что с одной стороны сделало диаграммы более читаемыми, а с другой стороны дает возможность таким способом их правильно масштабировать.

Рис.3. Диаграммы обхода последовательности DQ157859 в зависимости от положения основания в кодоне. а – триандр кодирующей области гена сахарозо-фосфат-синтаза 2 Physcomitrella patens (PpSPS2). б – главное окно программы «Triander», представляющее обход последовательности равными по модулю нуклеотидными векторами

Кроме того, большие диаграммы можно смещать по осям координат и задавать для отображения только определенную часть последовательности. Последовательность может быть отображена как в виде триандра (рис. 3 а), ветви которого отображаются кривыми разной толщины, так и обычным методом обхода ДНК, названным в программе по аналогии «монандром». Есть также возможность представить последовательность векторами равной длины. Нужно заметить, что скорости построения диаграмм достаточно для того, чтобы наблюдать анимацию при удерживании кнопки увеличения длины отображаемой последовательности или кнопок смещения ее начала.

Особисті інструменти
Простори назв

Варіанти
Дії
 
   
Інструменти