О квази генетическом коде

Примечаниеот автора: Приводится класс полимино, моделирующий фундаментальное свойство генетического кода, а именно то, что 20 различных аминокислот, входящих в структуру белков, образованы из 4 различных нуклеотидов. Этот класс полимино назван квазигенетическим
Загрузить архив:
Файл: ref-21889.zip (48kb [zip], Скачиваний: 40) скачать

Творческая группа юных математиков – программистов, руководимая Братом Михаилом Шишигиным.

(Церковь Христа Спасителя)

О КВАЗИ ГЕНЕТИЧЕСКОМ КОДЕ

Аннотация

Приводится класс полимино, моделирующий фундаментальное свойство генетического кода, а именно то, что 20 различных аминокислот, входящих в структуру белков, образованы из 4 различны нуклеотидов. Этот класс полимино назван квазигенетическим кодом.

Вводятся унарные операции <- , -1, *> над матрицами 4*2


a1

a2

W =

b1

b2

c1

c2

d1

d2

состоящими из элементов 0, 1, 2, 3, а именно:


a2

a1

4 - a2

4 - a1

2 - d1

2 - d2

W= -

b2

b1

=

4 - b2

4 - b1

W-1

=

2 - c1

=

- c2

c2

c1

=

4 - c2

4 - c1

,

2 - b1

2 - b2

d2

d1

4 - d2

4 - d1

2 - a1

2 - a2

=

2

2

──

d1

d2

2

2

c1

c2

,

2

2

b1

b2

2

2

a1

a2

W*=(W)-1, a + b = (a + b)(mod 4), a - b = (a - b)(mod 4),

a,bÎ{ 0, 1, 2, 3}.


W = W,(W-1) = (W)-1.

Используя введенные операции над матрицами 4*2, элементы квазигенетического кода можно записать так:

a, b, g, d, l, t, a, b, g,d, a-1, b-1, g-1, d-1, l-1, t-1, a*, b*, g*, d*, где

a =

3

1

b=

3

2

g =

3

1

2

1

2

0

1

3

0

1

0

1

2

1

1

3

1

3

0

1

2

1

l =

3

1

t =

3

1

d =

0

1

3

1

3

1

3

1

3

1

1

3

1

3

1

3

3

1

О КВАЗИГЕНЕТИЧЕСКОМ КОДЕ

Данная работа посвящена геометрическим структурам, моделирующим фундаментальное свойство генетического кода, а именно то, что 20 различных аминокислот, входящих в структуру белков, образованы из 4 различных нуклеотидов.

Положим, что прямоугольник размером4*2должен быть покрыт прямоугольниками размером2*1 (домино). Причём, нечётное число домино должно выходить за пределы как стороны  AB, так и стороны CD(рис. 1).

B
C
A
D

Рис. 1

Покрытие, в котором домино, выходящие за пределы сторон  AB и CD, однозначно определяют структуру покрытия прямоугольника ABCD, назовём жестким покрытием. Например, покрытиеa) (рис. 2.) является жестким, а покрытияb) иc) (рис. 2.) такими не являются.

B
C
B
C
B
C
A
D
A
D
A
D

a)

b)

c)

Рис. 2

Прямоугольник размером4*2nразобьём вертикалями на nпрямоугольников шириной в длину домино, которые пронумеруем слева направо и назовём шагами. Множество жестких покрытий прямоугольника размером4*2назовём квазигенетическим кодом. Покрытие прямоугольника размером 4*2n, при котором покрытие каждого шага представляет собой жесткое покрытие, назовём квазигенетическим покрытием.

Будем считать, что клетка прямоугольникаABCD  находится в состоянии 0, 1, 2, 3, если она покрыта домино, ориентированным соответственно вверх, вправо, вниз, влево.

0

3

1

2

Рис. 3

Матрицу размером4*2, соответствующую жесткому покрытию прямоугольника ABCD будем называть квазинуклеотидной матрицей, либо квазинуклеотидом. Матрицу размером 4*2n , соответствующую квазигенетическому покрытию прямоугольника размером 4*2n , будем называть белковой матрицей.

Методом последовательного исключения (перебором) можно показать, что существуют 20 различных, жестких покрытий прямоугольника ABCD. в Таблице 1 приведены все 20 жестких покрытий прямоугольника4*2и соответствующие им квазинуклеотидные матрицы.

Таблице 1


3

1

3

2

3

1

a=

2

1

b=

2

0

g =

1

3

0

1

0

1

2

1

1

3

1

3

0

1

b=

2

1

2

1

0

2

d =

0

1

3

0

3

1

1

3

1

3

b*=

1

3

d-1=

1

3

3

2

3

1

2

0

2

1

0

1

0

1

1

3

b-1=

1

3

g-1=

2

1

a-1=

2

1

2

1

0

1

0

1

0

2

1

3

3

1

3

0

3

1

3

1

3

2

3

1

a=

3

2

d =

3

0

l =

3

1

3

0

3

1

3

1

1

3

1

3

1

3

l = l

3

1

3

1

3

2

g=

1

3

t =

3

1

g*=

3

0

3

2

1

3

1

3

3

0

3

1

3

1

3

1

t-1 =

1

3

t-1 =t*    ,     t =   t, l-1 = l*

3

1

3

1

l-1=

1

3

1

3

1

3

a*=

3

2

d*=

3

1

3

1

3

0

3

2

3

1

3

1

3

0

3

1

Пустьзаписи   a + b , a - bобозначают (a + b)(mod 4),(a - b)(mod 4), где

a, b Î { 0, 1, 2, 3}.

                      

Введём унарные операции     <- , -1, *>   над матрицей  4*2


a1

a2

W =

b1

b2

c1

c2

d1

d2

,

состоящей из элементов 0, 1, 2, 3.

Положим


a2

a1

4 - a2

4 - a1

2 - d1

2 - d2

W= -

b2

b1

=

4 - b2

4 - b1

W-1

=

2 - c1

=

2 - c2

c2

c1

=

4 - c2

4 - c1

,

2 - b1

2 - b2

d2

d1

4 - d2

4 - d1

2 - a1

2 - a2

W =W ,   (W-1)-1=W.

=

2

2

──

d1

d2

2

2

c1

c2

,

2

2

b1

b2

2

2

a1

a2

2 +d2

d1

2 +c2

2 +c1   .

2 +b2

2 +b1

2 +a2

2 +a1

Положим

W* =

W*=(W)-1,                 


Нетрудно показать, что         W = W,(W-1) = (W)-1, (W-1)-1=W.

Используя введенные операции над матрицами 4*2,квазинуклеотидные матрицы можно записать так(см. Таблицу 1) :

a, b, g, d, l, t, a, b,g,d, a-1, b-1, g-1, d-1, l-1, t-1, a*, b*, g*, d*.

Введём понятие генетической информации белковой матрицы. Последовательность из количества единичных элементов в правых столбцах квазинуклеотидных подматриц белковой матрицы будем называть генетической информацией. Например, на рис. 4 показано квазигенетическое покрытие прямоугольника размером 4´22 , которому соответствует белковая матрица с генетической информацией 1 3 3 1 3 3 1 3 3 1 3.

1

2

3

4

5

6

7

8

9

10

11

1

3

3

1

3

3

1

3

3

1

3

2

1

3

1

3

1

3

2

2

1

3

1

3

1

3

1

3

1

3

1

3

1

0

2

2

1

3

1

3

0

0

1

3

1

3

2

1

3

1

3

1

3

2

1

3

0

0

1

3

1

3

1

3

1

3

1

3

0

2

1

3

1

3

2

0

1

1

3

1

3

1

3

1

3

1

3

1

3

1

3

0

1

3

1

3

0

2

3

b

a

l

d

d

l

a

g

t-1

g

a

Рис. 4

Используя «жёсткость» упаковки квазигенетическогопокрытия, можно показать, что квазигенетическийкод обладает высокой помехоустойчивостью.

Предложение 1. По двум любым строкам квазигенетического покрытия прямоугольника, размером 4´2n (n>1) , можно полностью восстановить покрытие, а, следовательно, и генетическую информацию.

Предложение 2. Зная жёсткие покрытия на нечётных шагах квазигенетического покрытия прямоугольника размером, 4´2(2k+1), можно полностью восстановить покрытие, а, следовательно, и генетическую информацию.

Дальнейшие исследования должны показать плодотворность идеи квазигенетического кода.

Приложение.

2

1

3

1

3

1

3

2

2

1

3

1

3

1

3

1

3

1

3

1

3

1

0

2

2

1

3

1

3

0

0

1

3

1

3

2

1

3

1

3

1

3

2

1

3

0

0

1

3

1

3

1

3

1

3

1

3

0

2

1

3

1

3

2

0

1

1

3

1

3

1

3

1

3

1

3

1

3

1

3

0

1

3

1

3

0

2

3

2

1

3

1

3

1

3

2

2

1

3

1

3

1

3

1

3

1

3

1

3

1

0

2

2

1

3

1

3

0

0

1

3

1

3

2

1

3

1

3

1

3

2

1

3

0

0

1

3

1

3

1

3

1

3

1

3

0

2

1

3

1

3

2

0

1

1

3

1

3

1

3

1

3

1

3

1

3

1

3

0

1

3

1

3

0

2

3

2

1

3

1

3

1

3

2

2

1

3

1

3

1

3

1

3

1

3

1

3

1

0

2

2

1

3

1

3

0

0

1

3

1

3

2

1

3

1

3

1

3

2

1

3

0

0

1

3

1

3

1

3

1

3

1

3

0

2

1

3

1

3

2

0

1

1

3

1

3

1

3

1

3

1

3

1

3

1

3

0

1

3

1

3

0

2

3

2

1

3

1

3

1

3

2

2

1

3

1

3

1

3

1

3

1

3

1

3

1

0

2

2

1

3

1

3

0

0

1

3

1

3

2

1

3

1

3

1

3

2

1

3

0

0

1

3

1

3

1

3

1

3

1

3

0

2

1

3

1

3

2

0

1

1

3

1

3

1

3

1

3

1

3

1

3

1

3

0

1

3

1

3

0

2

3