WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


Pages:     | 1 |   ...   | 6 | 7 || 9 |

Поэтому проводится отбор точек для расчетов по критерию: попадание в интервал [Pmax(I) - 0,90Ч Pmax(I)] при I>50 Вт/м2 и в интервал [Pmax(I)-0,95.Pmax(I)] при I<50 Вт/м2, где Pmax(I) - точки на огибающей. Правильностью критерия отбора точек в какой-то степени является протекание процедуры линеаризации.

Обычно она протекает быстро и требуется сравнительно малое количество итераций для стабилизации решения.

Рис. 36. Диаграмма рассеяния и световая кривая.

3.8. Экосистемы.

Компьютерное моделирование нашло широкое применение в экологии. В частности этот метод используется при изучении вопросов существования вида [15].

Некоторые модели представлены ниже.

Однопараметрическая модель неограниченного роста:

Nk+1 = Nk R (30), где Nk – численность популяции, k – номер отсчета системного времени, R – параметр модели, аналог скорости роста. В этой модели не учитывается внутривидовая конкуренция.

Двухпараметрическая модель ограниченного роста:

Nk+1 =Nk R/(1+a Nk) (31), где Nk – численность популяции, k – номер отсчета системного времени, R – параметр модели, аналог скорости роста, a – параметр модели, служит для ограничения размера популяции. Чем больше a, тем меньше рост.

Трехпараметрическая модель ограниченного роста:

Nk+1 =Nk R/(1+(a Nk)b) (32), где Nk – численность популяции, k – номер отсчета системного времени, R – параметр модели, аналог скорости роста, a – параметр модели, служит для ограничения размера популяции, b – нелинейный параметр модели, служит для получения особых вариантов поведения роста популяции. Численное изучение этой модели позволило обнаружить четыре характерные ситуации: монотонный рост; ограниченный рост с затухающими колебаниями, незатухающими колебаниями, флуктуациями (случайными изменениями).

Данные модели дискретные, но можно построить и непрерывную кинетическую модель, ее уравнение:

при этом r – некий аналог скорости, К – предельное значение численности популяции. Эта двухпараметрическая модель называется логистической кинетической моделью.

Рассмотрим одну из моделей межвидовой конкуренции. Если сосуществуют два вида, которые активно воздействуют друг на друга, то возникают процессы межвидовой конкуренции и борьбы. Наиболее известна модель (кинетическая) Вольтера - Лотки конкуренции двух видов:

Коэффициенты (12 и 21) определяют связь между двумя видами и интенсивность межвидовой конкуренции. Если увеличение особей второго вида ведет к уменьшению особей первого вида, то второй вид подавляет первый.

Очевидно, чем больше волков, тем меньше зайцев. В модели 6 параметров – ее изучение очень сложно, поэтому обычно фиксируют часть параметров. В общем случае изучение этой параметрической модели показало, что популяции хищников и жертв испытывают циклические изменения.

Рассмотрим пример построения описательной модели популяции рыб, имеющейся в озере, для прогнозирования её численности.

Пусть х(t) – численность рыб в момент времени t; х(0)=х0 - это численность рыб в начальный момент времени. Естественно предположить, что в первые годы, когда питания и пространства для каждой особи достаточно, скорость роста численности пропорциональна самой численности х: dx/dt=kx, где k – коэффициент пропорциональности. То есть, чем больше численность рыб, тем больше в единицу времени они оставляют потомства (больше скорость роста популяции). Но постепенно с ростом х возникает ограничение скорости роста численности, которое упрощенно считаем пропорциональным частоте встречаемости рыб: ах2, а – коэффициент пропорциональности.

Можно построить математическую модель вида:

dx/dt = kx – ах2 (36).

Решение этого уравнения представляется следующим образом:

x(t) = kx0 exp(kt)/(k – a x0(1-exp(kt)) (37).

Настройка модели – это подбор её параметров (например, а и k). Для этого проводят серию экспериментов с объектом (получают несколько значений х(t) для разных t). Методом наименьших квадратов строят экспериментальную кривую зависимости x(t), используя вышеприведенную формулу, то есть в процессе расчетов подбирают оценки коэффициентов а и k, обеспечивающие минимальные отклонения экспериментальных данных от прогноза по формуле.

Эти коэффициенты иногда можно получить из литературных данных.

Представленную описательную модель можно использовать, например, для прогноза численности рыб через определённый промежуток времени.

Марковские процессы, о которых упоминалось ранее, используются для описания популяций. Процесс с дискретными состояниями S0, S1, S2…, Sn называется процессом гибели и размножения, если все состояния можно вытянуть в одну цепь, в которой каждое из средних состояний (S1, S2…, Sn-1) переходит только в соседние состояния, которые, в свою очередь, переходят обратно, а крайние состояния (S0 и Sn ) - только в соседние состояния. Переход вправо связан с размножением единиц популяции, а влево – с их гибелью.

Марковским процессом гибели и размножения с непрерывным временем называется такой случайный процесс, который может принимать только целые неотрицательные значения. Изменения этого процесса могут происходить в любой момент времени, т.е. в любой момент времени он может либо увеличиться на единицу, либо уменьшиться на единицу. Различают процессы чистого размножения (интенсивность всех потоков гибели равна нулю) и чистой гибели (интенсивность всех потоков размножения равна нулю). При постоянных интенсивностях потоков гибели и размножения и конечном числе состояний будет существовать стационарный режим. Система S с конечным числом состояний (n+1), в которой протекает процесс гибели и размножения с постоянными интенсивностями потоков гибели и размножения, является простейшей эргодической системой. Предельные вероятности для простейшего эргодического процесса гибели и размножения, находящегося в стационарном режиме, определяются по следующим формулам:

Pk = P0( 0 1 … k-1 ) /(µ1 µ2 … µk) (38);

k = 1, 2…n;

P0 = {1 + 0 1/ µ1 µ2 +…+ 0 1 … n-1/ µ1 µ2 … µn} (39).

Вероятность k-го состояния в схеме гибели и размножения равна дроби, в числителе которой стоит произведение всех интенсивностей размножения, стоящих левее Sk, а в знаменателе – произведение всех интенсивностей гибели, стоящих левее Sk, умноженной на вероятность крайнего левого состояния системы Р0.

4. Информационные модели биохимических систем. Элементы биоинформатики.

Биохимик, работая с информационными моделями, обычно имеет дело с базами, банками данных и инструментами их анализа [33, 34, 35]. Перекрывание различных областей знаний привело к появлению качественно новых образований, таких как биологическая информатика (биоинформатика; другое название – компьютерная биология) и химическая информатика (химинформатика; другое название – компьютерная химия) (рис. 37).

Рис. 37. Перекрывание различных областей знаний.

Перечислим информационные системы, касающиеся биологических наук.

Первый тип – архивные информационные системы. К таким информационным системам относятся:

GeneBank & EMBL – здесь хранятся первичные последовательности;

PDB – пространственные структуры белков.

Второй тип – курируемые информационные системы, за достоверность данных в которых отвечают их владельцы. В них информацию никто не присылает, ее из архивных баз данных отбирают эксперты, проверяя достоверность информации – что записано в этих последовательностях, какие есть экспериментальные основания считать, что эти последовательности выполняют ту или иную функцию.

К таким информационным системам относятся:

Swiss-Prot – наиболее качественная база данных, содержащая аминокислотные последовательности белков;

KEGG – информация о метаболизме (такая, которая представлена на карте метаболических путей);

FlyBase – информация о Drosophila;

COG – информация об ортологичных генах.

Поддержание базы требует работы кураторов или аннотаторов.

Третий тип – производные информационные системы. Они получаются в результате обработки данных из архивных и курируемых информационных систем. В них входят:

SCOP – База данных структурной классификации белков (описывается структура белков);

PFAM – База данных по семействам белков;

GO (Gene Ontology) – Классификация генов (попытка создания набора терминов, упорядочивания терминологии);

ProDom – белковые домены;

AsMamDB – альтернативный сплайсинг у млекопитающих.

Интегрированные информационные системы, в которых вся информация сведена вместе. Зная имя гена, можно найти всю связанную с ним информацию – в каких организмах встречается, в каком месте генома локализован, какие функции выполняет:

NCBI Entrez – доступ к информации о нуклеотидных и аминокислотных последовательностях и структурах;

Ecocyc – все о E. coli – гены, белки, метаболизм и пр.

Работа с информационными системами представляется следующим образом:

1. Сравнение последовательностей (выравнивание двух последовательностей; глобальное и локальное выравнивание, вес выравнивания, матрицы аминокислотных замен; дот-матрицы; глобальное выравнивание: алгоритм Нидельмана-Вунша; локальное выравнивание:

алгоритм Смита-Ватермана; другие алгоритмы локального выравнивания;

другие варианты выравнивания (fitting, overlaps, блочное выравнивание, сплайсированное выравнивание); статистическая значимость выравниваний и ее зависимость от вероятностной модели последовательности; зависимость выравнивания от параметров).

2. Множественное выравнивание (динамическое программирование;

последовательное выравнивание (Clustal); другие алгоритмы множественного выравнивания (DIALIGN, Match-Box, алгоритм Леонтовича-Бродского); профили, скрытые марковские модели; поиск блоков).

3. Поиск по сходству в базах данных (Smith-Waterman; хэширование (lookup table); BLAST; FASTA ; оценка значимости (E-value, P-value);

фильтрация повторов и обработка участков малой сложности (фильтрация, пересчет значимости); паттерны (Prosite), профили, Psi-BLAST, HMM (PFAM)).

4. Автоматическое аннотирование последовательности. Онтология.

5. Пространственная структура биополимеров (PDB (структура записи PDB, визуализация, анализ структурных особенностей, моделирование);

предсказание вторичной структуры белков; предсказание третичной структуры белков по гомологии; threading ; docking; предсказание параметров спирали ДНК; предсказание вторичной структуры РНК (представление вторичной структуры РНК, минимизация энергии вторичной структуры, динамические модели РНК, сравнительный подход по гомологичным и изофункциональным РНК)).

6. Предсказание функции по последовательности (белки (анализ гомологов, функциональные сигналы, лидерные пептиды и трансмембранные сегменты, сайты модификации); ДНК (функциональные сайты, гены прокариот, гены эукариот, сравнительные методы предсказания генов); РНК (поиск РНК с заданной структурой)).

7. Молекулярная эволюция (эволюция молекул и организмов;

филогенетическое дерево как математический объект; модели эволюции;

алгоритмы построения филогенетических деревьев (матрица расстояний, методы, основанные на матрице расстояний (UPGMA, neighbour-joining, minimal evolution, топологические инварианты и др.), другие методы (максимальная экономия, максимальное правдоподобие), алгоритмические проблемы поиска оптимального дерева, bootstrapping, согласование деревьев); эволюция на уровне генома; анализ популяционных данных (SNP, тандемные повторы, митохондрии и Y-хромосомы, данные по рестрикции)).

8. Статистика последовательностей ДНК ((ди)нуклеотидный состав (изохоры, GC-острова, картирование старта репликации); частые и редкие слова (вероятностные проблемы); статистика ДНК как характеристика генома).

9. Вычислительная геномика (метаболическая реконструкция (в т.ч.

неортологичные замещения); позиционный анализ; эволюция регуляторных взаимодействий; эволюция белковых семейств, их доля в геноме).

Компьютерное моделирование используют для предсказания структур и выяснения причин существования той или иной структуры. Например, одна из причин существования неспирализованных участков в белковой глобуле - взаимодействие между положительно заряженной аммонийной и отрицательно заряженной карбоксилатной группами (-N+H3 … OOC-; электростатическое притяжение и водородная связь) [23], что показано на рис. 38.

Рассмотрим пример предсказания вторичной структуры РНК.

Вторичная структура РНК – структура, образуемая спаренными основаниями на однонитевой молекуле РНК. Биологическая роль вторичной структуры: структурная (РНК – рибосомная, тРНК), регуляторная (рибопереключатели, микроРНК).

Рис. 38. Взаимодействие между аммонийной и карбоксилатной группами (N+H3 … -OOC-; электростатическое притяжение и водородная связь) в белке.

На рис. 39 показана типичная вторичная структура РНК.

Рис. 39. Одна из моделей вторичной структуры РНК.

Рассмотрим и другие модели структуры РНК (рис. 40).

Рис. 40. Различные модели вторичной структуры РНК.

Вся РНК состоит из петель и спиралей. Петли бывают следующих типов:

шпилька, внутренняя, выпячивание, множественная, псевдоузел. Возникает задача о спаренности. Биологическая формулировка этой задачи звучит так: дана последовательность РНК, определить ее правильную вторичную структуру.

Количество возможных вторичных структур очень велико. Задачу можно сформулировать таким образом (законным с точки зрения физики): надо минимизировать энергию, поскольку правильная вторичная структура наиболее стабильная. С точки зрения биологии это не совсем верно, но формулировка очень удобная. Далее вопрос об оптимизации.

Предположим, что мы не будем минимизировать усилия по поиску, а все переберем. Построим такой граф, в котором вершины – потенциальные спирали, а ребра проводятся, если две потенциальные спирали в вершинах совместимы (то есть, если две спирали могут одновременно существовать в данной молекуле РНК). Тогда вторичной структурой будет любой полный подграф, то есть такой граф, в котором все вершины между собой соединены – "клика". В этом случае задача такова: в графе найти клику. Клика будет соответствовать хорошей структуре. К сожалению, задача поиска клики в графе является математически неудобной – для нее, скорее всего, не существует эффективного алгоритма решения (кроме полного перебора всех вариантов).

Комбинаторный подход заключается в следующем:

Построим граф в котором вершины – потенциальные нуклеотидные пары (или потенциальные спирали). Ребро проводится, если пары совместимы (не образуют псевдоузлов и не имеют общих оснований).

Допустимая вторичная структура – клика в этом графе (рис. 41).

Рис. 41. Иллюстрация комбинаторного подхода.

Если удалить fgh, то получается клика (некая вторичная структура).

Вторичная структура может быть представлена в виде правильной скобочной структуры. Левая часть – открывающая скобка, правая часть – закрывающая скобка. Вторичную структуру представляют и в виде дерева, но важно, что количество возможных структур порядка 1,8L (это доказывается в теореме). Это очень много, поэтому задача поиска клики не эффективна.

Возможна структура без псевдоузлов при правильном скобочном выражении. Такую структуру представим в виде дерева (рис. 42). Количество возможных структур посчитаем по формуле Т(L) 1.8 L.

Рис. 42. Структура без псевдоузлов.

Тем не менее, есть алгоритм так называемого динамического программирования, который позволяет за кубичное (а не квадратичное, как раньше) время найти структуру, имеющую наибольшее количество спаренных оснований. Задача поиска оптимального пути на графе решается методами динамического программирования следующим образом. Пишем одну последовательность над другой. Имеется некая ячейка, в которой хранится вес наилучшего выравнивания префиксов (фрагментов последовательности от начала до данного места). И если известен вес наилучшего выравнивания в ячейках, то можно определить вес наилучшего выравнивания в четвертой ячейке. Для того, чтобы найти вес оптимального выравнивания, надо просмотреть m*n ячеек (количество ячеек в прямоугольной матрице M*N). Как принято говорить в информатике, это есть квадратичный алгоритм. Он занимает время и размер памяти, пропорциональный квадрату длины последовательности.

И вместо случайного перебора большого числа вариантов, решаем задачу довольно быстро. Основная идея его (как и любого алгоритма динамического программирования) заключается в том, что если знаем все решения на какой-то части, то можем сказать, какое будет решение на чуть большем фрагменте.

Pages:     | 1 |   ...   | 6 | 7 || 9 |






© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.