The Atlantic: Геном человека — наконец-то! – расшифрован

Проекту «Геном человека» оставалось исследовать 8 процентов нашей ДНК. Теперь, впервые, эти загадочные части расшифрованы

Автор: Сара Чен

Когда в 2000 году геном человека впервые был назван «расшифрованным», эта новость была встречена с большим международным энтузиазмом. Две соперничающие группы, которые боролись за право закончить геном первыми — один большой консорциум, возглавляемый правительством США, другой — отстающая частная компания — договорились объявить о совместном успехе. Они пожали друг другу руки в Белом доме. Билл Клинтон председательствовал во главе стола. Тони Блэр по такому случаю телепортировался из Лондона. «Мы переживаем необыкновенный момент в истории науки» — заявлял один из выдающихся учёных – «Как будто взобрались на вершину Гималаев».

Но на самом деле геном человека был далёк от полной расшифровки. Ни одна из групп не достигла настоящей вершины. Как признавали даже журналисты того времени, эта версия была скорее черновиком, изобилующим длинными участками, где последовательность ДНК представлялась нечеткой или отсутствовала. Частная компания вскоре изменила свое направление и прекратила проект, хотя ученые из государственного консорциума продолжали работать. В 2003 году, с меньшим блеском, но с большим количеством заголовков, геном человека снова был объявлен расшифрованным.

Но на самом деле и в этот раз о полноценном успехе говорить было нельзя. Даже в пересмотренном проекте не хватало около 8 процентов генома. Это были самые трудные для секвенирования части, полные повторяющихся символов, которые было просто невозможно прочитать с помощью тогдашней технологии.

Наконец, в мае этого года отдельная группа ученых без лишнего пафоса разместила в Интернете препринт научной статьи с описанием того, что можно считать первой действительно полной расшифровкой генома человека — всех 3,055 миллиардов символов в 23 хромосомах человека. Группа, возглавляемая относительно молодыми исследователями, работала через Slack по всему миру, чтобы завершить задачу, оставленную 20 лет назад. На этот раз не было пышного объявления в Белом доме, не было разговоров о восхождении на вершину Гималаев; сама работа все еще находится на рассмотрении для официальной публикации в журнале. Но отсутствие помпы не означает малозначительность: чтобы завершить геном человека, эти ученые должны были выяснить, как составить карту его самых загадочных и повторяющихся областей, которые, возможно, теперь наконец-то получат свое научное признание.

«Я считаю это вехой» — говорит Стивен Хеникофф, молекулярный биолог из Онкологического исследовательского центра Фреда Хатчинсона, который не участвовал в проекте. Хеникофф изучает один из тех загадочных, трудно поддающихся секвенированию областей генома, на которых предыдущие проекты по геному человека спотыкались: центромеры, которые представляют собой слегка сжатую середину каждой хромосомы. Хромосомы, которых у человека 23 пары, состоят из длинного непрерывного участка ДНК, который может быть сжат в форме стержня; ДНК на центромере особенно плотная.

На пяти хромосомах человека центромера находится не посередине, а очень близко к одному из концов, разделяя хромосому на один длинный и один очень короткий рукав. Эти короткие рукава также полны повторов, которые до сих пор не были полностью секвенированы. Центромеры, короткие рукава и другие типы повторяющихся регионов составили большую часть из 238 миллионов символов, которые консорциум в итоге добавил или исправил в геноме человека.

Богатые повторами сегменты генома человека обычно не содержат генов, что является одной из причин, по которой ими долгое время пренебрегали. Генетики в основном сосредоточились на генах, потому что их функция очевидна и проста: ген кодирует белок. (Одним из главных сюрпризов ранних проектов генома человека стало то, как мало в нашей ДНК на самом деле кодируется белков — всего 1 процент. Роль остальных 99 процентов становится все более понятной). Действительно, были намеки на то, что эти богатые повторами регионы также играют важную роль в том, как гены экспрессируются и передаются, а аномалии в них связаны с раком и старением. Консорциум также обнаружил 79 новых генов, скрытых среди повторов. Имея в руках карту этих повторяющихся областей, ученые смогут более тщательно исследовать их функции.

По словам Адама Филлиппи, генетика из Национального института здоровья США, который является одним из руководителей консорциума Telomere-to-Telomere (T2T), завершившего работу над геномом, усилия по завершению генома были «полностью низовыми». (Теломеры — это участки на концах хромосом, поэтому «теломера к теломере» означает «от конца до конца»). Филлиппи и Карен Мига, генетик из Калифорнийского университета в Санта-Крузе, решили создать консорциум в 2018 году, после беседы, когда они поняли, что оба питают амбиции по завершению генома человека.

«Я влюблен в повторы», — говорит Мига, который пришел в проект как биолог, пытающийся понять, что эти самые повторы означают. Филлиппи, компьютерщик по образованию, привнес в него технические знания. Традиционные технологии секвенирования фрагментируют ДНК на мелкие фрагменты, и компьютерные алгоритмы должны собрать их воедино, как кусочки головоломки. Проблема в том, что фрагменты повторяющихся регионов выглядят почти одинаково. Теперь две новые технологии секвенирования «с длинным прочтением» — PacBio HiFi и Oxford Nanopore — позволяют ученым считывать более длинные участки генома. Эти секвенаторы все еще не могут обрабатывать куски, достаточно большие, чтобы пересечь всю центромеру или короткий рукав, но, по крайней мере, у алгоритмов есть более крупные части головоломки для сборки.

Роль центромерных последовательностей, как и многих других повторяющихся областей, еще не до конца понятна, но классически они известны как ключ к делению клетки. Когда клетка делится на две части, белковое веретено прикрепляется к центромерам, раздвигая хромосомы, чтобы каждая клетка получила нужное число хромосом. Когда в яйцеклетках или сперматозоидах это происходит неправильно, дети могут родиться с хромосомными аномалиями, такими как синдром Дауна или синдром Тернера. Когда это происходит в других частях тела, мы можем получить, например, клетки крови, в которых слишком много или слишком мало хромосом. Это является отличительной чертой старения: нередко мужчины старше 70 лет теряют Y-хромосомы в своих клетках крови. В одной из двух сопутствующих работ, выложенных вместе с полным геномом, консорциум T2T показал, что технология длинных считываний Oxford Nanopore может также использоваться для картирования того, где именно белковое веретено прикрепляется к центромере. Изучение последовательностей в этих областях может дать новые подсказки по поводу хромосомных аномалий.

Богатые повторами короткие ветви хромосом также загадочны. Они определенно играют какую-то роль в клеточном механизме, который переводит гены в белки, и знание их последовательностей может пролить свет на эту функцию. Брайан Макстей, биолог из Национального университета Ирландии в Голуэе, сравнивает полный геном со «списком деталей» хромосом, который позволяет ученым пробовать извлекать строительные блоки один за другим. Зная список деталей, мы можем сказать: «Вот как выглядит наша хромосома» — говорит Макстей. «Давайте удалим это и посмотрим, как это повлияет на функцию хромосомы».

Каким бы впечатляющим ни был технический подвиг секвенирования полного генома человека, ученые сказали мне, что один геном — это только один снимок. Гораздо интереснее будет посмотреть, как эти повторяющиеся регионы меняются со временем от человека к человеку, от вида к виду. «Что происходит при раке? Что происходит в процессе развития? Что произойдет, если вы сравните потомство с родителями?» — говорит Хеникофф. Консорциум доказал, что эти повторяющиеся регионы поддаются секвенированию с помощью новых технологий длинного чтения. Теперь они могут быть применены к большему количеству геномов, что позволит ученым сравнивать один с другим.

Мига говорит, что конечная мечта — прочитать каждый геном, от конца до конца, от теломеры до теломеры. Но сначала у группы есть более насущная цель. Если бы вы захотели упрекнуть новый геном в том, что он не является «полным», вы могли бы указать на тот факт, что он состоит только из одного набора из 23 хромосом, тогда как нормальные человеческие клетки имеют 23 пары. Чтобы упростить задачу, группа использовала клетки из определенного типа опухоли, которая развивается из аномальной оплодотворенной яйцеклетки и в итоге имеет только 23 хромосомы. Группе придется использовать другие клетки с 23 парами хромосом, чтобы завершить так называемый «диплоидный» геном.

«Следующей важной вехой станет прочтение обычных диплоидных геномов», — говорит Шилпа Гарг, генетик из Копенгагенского университета в Дании. Гарг использовала PacBio HiFi для быстрого прочтения генома человека за исключением некоторых сложных участков, таких как центромеры, со скоростью несколько раз в день. Такая скорость может помочь и в клинических условиях, облегчив врачам более регулярную диагностику пациентов с помощью секвенирования генома. (Для сравнения, по ее словам, прочтение геномов с помощью старых технологий секвенирования занимает до трех недель). По-настоящему полное секвенирование генома, повторяющиеся регионы и все остальное, становится все проще и быстрее.

Оригинал: The Atlantic

Похожие Записи

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Последние <span>истории</span>

Поиск описаний функциональности, введя ключевое слово и нажмите enter, чтобы начать поиск.