СТАТИСТИЧЕСКАЯ МОДЕЛЬ АМИНОКИСЛОТНОГО КОДА ВТОРИЧНОЙ СТРУКТУРЫ БЕЛКА
Б. В. Шестопалов
Институт цитологии РАН, Санкт-Петербург;
электронный адрес: shest@mail.cytspb.rssi.ru
Представлена статистическая модель аминокислотного кода вторичной структуры белка, описанного в предыдущей
статье. Модель основана на структурных данных 2258 белков (использовано 417112 остатков аминокислот). Совпадение
вычисленной по модели и экспериментальной вторичной структуры для обучающей выборки и тестовой выборки (104
белковые цепи, использовано 21166 остатков аминокислот) почти одинаково и составляет 60 и 61 % соответственно, что
равно пороговому значению для моделей, где, как и здесь, учитываются только ближайшие и средние по дальности
взаимодействия. Как следствие, модель может быть использована для вычисления вторичной структуры белка, особенно
в случаях, когда используются дополнительная информация и экспертный анализ, что характерно для наиболее успешных
методов предсказания. Модель также может быть использована для анализа изменений вторичной структуры в процессе
сворачивания белковой цепи и для моделирования образования супервторичной структуры.
Ключевые слова: кодирование вторичной структуры белка, предсказание вторичной структуры белка
Back
Contents
Main