Надо Знать

добавить знаний



Таксономическая база данных NCBI



План:


Введение

Таксономическая база данных NCBI является частью базы GenBank, подразделения Национального центра биотехнологической информации США (NCBI). Она содержит более 165 000 организмов, которые представлены в базах данных как минимум одной нуклеотидной или белковой последовательности. Таксономический браузер (TaxBrowser) может использоваться чтобы просмотреть позицию организма или таксона в таксономической иерархии или чтобы получить данные с любой из основных баз данных системы Entrez для этого организма. TaxBrowser также позволяет доступ к системам "Map Viewer", "BLAST" и "Trace Archive" через внешние ссылки.

Поиск в базе данных может производиться по целому, частичной или фонетической названием организма. В дополнение к этому, ссылки на организмы, которые часто используют в биологических исследованиях, приведены отдельно. Система отображения способна показывать таксономические дерева выбранного пользователем фрагмента всей базы данных NCBI.


1. История

Созданная в 1988 году, NCBI стала домом базы данных нуклеотидных последовательностей GenBank. В то же время стала очевидной необходимость создания таксономической базы данных чтобы дополнить нуклеотидные базы данных. Проблемы с таксономией, которые используют такие базы данных, были давно известны: каждая из баз данных имеет свою собственную таксономию, каждая отличная от других, и ни одна не находятся в соглашении с текущими таксономическими соглашениями (даже если можно представить, что такая вещь существует), и все они содержат широкое разнообразие различных видов ошибок и шероховатостей. В результате, не всегда известно (даже в пределах той же базы данных), или две записи относятся к одному и тому же виду.

Чтобы предотвратить этих проблем, команда NCBI создала инструмент для интеграции нескольких известных таксономических баз как нуклеотидных баз данных, так и некоторых других, например международную систему ICTV для вирусов, USDA для растений и FlyBase для Drosophilidae. После этого была проведена конференция на базе морской биологии в Митч-Согин представителей таксономических баз данных и специалистов по систематике для унификации базы данных. Представители Европейской лаборатории молекулярной биологии (EMBL), Швейцарской базы данных белков (SwissProt) и Японской базы данных ДНК (DDBJ) согласились принять эту базу за таксономический стандарт.


2. Особенности

Одной из особенностей системы NCBI есть возможность легкой модификации выданных данных пользователем, чтобы он мог расположить их по одной из классических систем. Второй - практически полный переход на филогенетическую таксономии.

В результате этого подхода, класичниа концепция таксономических категорий (рангов) исчезает. Например, при редактировании таксономической базы протозоа, сотрудники NCBI заменили суффиксы ранга семьи (-idae,-ida,-iformes т.п.) на общие суффиксы (-ids), хотя предыдущие названия остались в базе как синонимы, так что пользователь может проводить по ним поиск .

Сотрудники NCBI также пытаются собрать статистику по использованию всех возможных названий организма или таксона и формализовать систему названий, приходя к единому стандарту.


3. Сравнение с другими базами данных

База данных NCBI не была создана исключительно специалистами из систематики и следует несколько иным целям. Поэтому результирующая база данных несколько отличается от ведущих исключительно систематических баз, таких как "Рабочая группа по таксономических баз данных" (TDWG), "Международная организация информации о растениях" (IOPI) и "Виды 2000" (Species 2000). Например, база NCBI несколько меньше из-за отсутствия молекулярных данных, необходимых для точной классификации (что является стандартом NCBI), для большого количества организмов (хотя она быстро пополняется).

Еще одним известным конкурентом является "Интегрированная система таксономической информации" (ITIS). ITIS прежде всего использует таксономическую литературу, которая опирается на экологические данные. Система строится "сверху вниз", располагая организмы в известной системе таксонов. В отличие от нее, система NCBI должна найти место для каждого организма, которых попадает в молекулярных баз данных. Кроме того, как уже было упомянуто выше, система NCBI использует строго филогенетический подход, что иногда приводит к разногласиям с классическими системами. В результате система отличается значительным количеством "неклассифицированных" организмов и групп, хотя считается точной с филогенетического / кладистичнои точки зрения.


4. Ресурсы Интернет


код для вставки
Данный текст может содержать ошибки.

скачать

© Надо Знать
написать нам