AI-драгдизайн: первая молекула прошла Фазу II.

TL;DR

R&D в фарме переживает структурный кризис: средняя стоимость вывода препарата выросла до $2.23 млрд, а LoA с Фазы I — ~6.7%. Компании сознательно «убивают» кандидатов раньше (стратегия fail faster), что смещает провалы в сторону Фазы II — с «плохой химии» к «сложной биологии». Новая связка GNN-предикторов + генеративные модели + MOO/RL + AlphaFold 3 (с учётом induced fit) резко повышает drug-likeness (успех в Фазе I до 80–90%), но не решает целиком проблему «правильной мишени». 2024–2025 принесли первый клинический прорыв (Insilico) и показательную неудачу (BenevolentAI). Дальше гонка — за моделированием не молекулы, а болезни.


За кулисами прорывов — сломанный процесс R&D

От мРНК-вакцин до CRISPR — заголовки сияют. А реальность R&D — «Долина Смерти»: пропасть между открытием и полкой аптеки. И она ширится.

  • Средняя стоимость на 1 препарат: $2.23 млрд (2024)
  • Время: 10–15 лет
  • LoA с Фазы I: ~6.7%
  • Успех Фазы I: < 40% (против >75% в 2006–2008)

Компании переходят к fail faster: используют биомаркеры уже в Фазе I и намеренно останавливают сомнительные проекты раньше, чтобы не сжигать сотни миллионов во II–III фазах. Возникает жёсткий спрос на инструменты, которые отсекают провалы ещё до Фазы I.

Кризис в цифрах (2024–2025)

МетрикаПоказатель
Средняя стоимость R&D на 1 препарат$2.23 млрд
Среднее время R&D10–15 лет
Общая вероятность одобрения (LoA) с Фазы I~6.7%
Вероятность успеха Фазы I< 40% (vs >75% в 2006–08)
Вероятность успеха Фазы II~28%
Вероятность успеха Фазы III~55%

Анатомия провала: где «ломается» кандидат

Главные причины клинических неудач — недостаточная эффективность и токсичность. Фильтры ADMET (Absorption, Distribution, Metabolism, Excretion, Toxicity) — это полоса препятствий, на которой и теряются 93% молекул.

«Метаболическая печь»: CYP450

Ферменты CYP1/2/3 метаболизируют до 80% клинических препаратов. Риски:

  • преждевременное разрушение молекулы → потеря эффективности;
  • токсичные метаболиты;
  • лекарственные взаимодействия и передозировки.

«Клеточный вышибала»: P-glycoprotein (P-gp)

ATP-зависимые насосы выбрасывают ксенобиотики из клетки. Если молекула — субстрат P-gp, она не достигнет мишени в нужной концентрации. В онкологии P-gp — ключ к множественной лекарственной устойчивости.

«Скрытая угроза сердцу»: канал hERG

Случайная блокада hERG удлиняет интервал QT и может вызвать Torsades de Pointes. Десятки препаратов отозваны именно из-за этого.

Вывод: задача — не «ключ к замку», а многокритериальная оптимизация (MOO): активность к мишени, безопасность (hERG), не-P-gp-субстрат, управляемый CYP-метаболизм, растворимость и ещё десятки параметров. Человеку тяжело держать 20+ ограничений одновременно — ИИ справляется.


Инструментарий ИИ (2025): от предсказаний к дизайну

1) GNN-предикторы свойств

Молекула — это граф. GNN с «передачей сообщений» строят эмбеддинги атомов/связей и предсказывают токсичность (hERG), субстратность P-gp, растворимость, логР, метаболизм и т.п. Это позволяет in silico отбрасывать миллионы плохих вариантов до синтеза.

2) Генеративный дизайн + MOO/RL

Связка VAE/GAN/Diffusion + RL учится выдавать молекулы, которые максимизируют функцию вознаграждения:
Reward = 2×Активность − 5×hERG + 1×Растворимость + …
Мы переходим от пассивного «отсеиваем плохое» к проактивному созданию хорошего.

3) AlphaFold 3 — мощно, но не магия

AF3 (май 2024) моделирует комплексы «белок-лиганд/ДНК/РНК/ион». Ограничение — induced fit: значимые конформационные перестройки белка при связывании AF3 учитывает слабо (обучение на «статике»). Практический пайплайн-2025:

  1. берём статическую структуру из AF3,
  2. доучитываем динамику молекулярной динамикой или диффузионными/Transformer-моделями.

Сравнение подходов

Биологический вызовТрадиционноAI-решение (2025)
Предсказание токсичности (hERG/ADMET)in vitro / in vivoGNN-модели
Дизайн молекулы de novoручной переборVAE/GAN/Diffusion + RL
Одновременная оптимизациялинейный цикл «дизайн→провал»MOO/RL-оптимизация
3D-структура белкакристаллография (годы)AlphaFold 2
Комплекс белок-лиганддокинг (грубо)AlphaFold 3
Induced fitMD (дорого)MD + новые диффузионные/Transformer-модели

От кода к клинике: первые «жёсткие» итоги (2024–2025)

Победа: Insilico Medicine — рентосертиб (ISM001-055)

  • Новая мишень TNIK для фиброза найдена ИИ; молекула создана de novo.
  • От таргета до Фазы I — <30 месяцев (против 4–6 лет).
  • Июнь 2025: Фаза IIa в Nature Medicine: у пациентов с ИЛФ — значимое улучшение FVC (+98.4 мл vs −20.3 мл в плацебо).
    → Первый в истории клинический proof-of-concept для ИИ-мишени + ИИ-молекулы.

Проверка реальностью: BenevolentAI — BEN-2293

  • Фаза I прошла (безопасность ок),
  • Фаза IIa провалена по эффективности, программа закрыта (2024).
    → ИИ улучшает drug-likeness, но не гарантирует «правильность мишени».

Титаны на старте (2025)

  • Exscientia × Recursion: слияние (ноя 2024), новые Фазы 1/2 в онкологии (EXS74539, EXS73565).
  • Isomorphic Labs (Google/DeepMind): лето 2025 — активный найм под первые клинические испытания; инвестиции ~$600 млн.
  • Insilico: готовит Фазы IIb/III и двигает пайплайн 30+ ИИ-кандидатов.

Сводно по компаниям

КомпанияПрепаратЗаболеваниеСтатус на 2025
Insilico MedicineРентосертиб (ISM001-055)ИЛФПОБЕДА: Фаза IIa успешна, публикация
BenevolentAIBEN-2293Атопический дерматитПРОВАЛ: IIa неэффективна, закрыт
Isomorphic Labs(не анонс.)Онко/иммунологияНА СТАРТЕ: готовят клинику в 2025
Exscientia / RecursionEXS74539, EXS73565ОнкологияВ ИГРЕ: клиника 1/2 в 2025

Ключевая статистика AI-first vs исторические данные

  • Фаза I (ADMET/безопасность):
    AI-препараты: 80–90% vs исторические 40–65% (и <40% в последних когортах).
  • Фаза II (эффективность):
    AI-препараты: ~40% vs средние ~28–40%.

Итоговая таблица

Клиническая фазаЧто тестируемИсторический успех (2014–2023)Успех AI-first (2024)Вывод
Фаза IБезопасность, PK (ADMET, hERG)~40–65% (падение до <40%)80–90%ИИ почти решил вопрос drug-likeness
Фаза IIЭффективность / валидность мишени~28–40%~40%Новый узкое место — биология

Что это значит для индустрии

  1. ИИ сместил «Долину Смерти». Раньше — провалы в Фазе I из-за токсичности и PK. Теперь — в Фазе II из-за «не той» биологии. Это прогресс: деньги тратятся на проверку гипотез болезни, а не на спасение токсичных химий.
  2. Первое клиническое доказательство есть. Случай Insilico показывает, что ИИ может найти и правильную мишень, и правильную молекулу.
  3. Но гарантии нет. Кейсы вроде BenevolentAI напоминают: биология человека сложнее любых датасетов. Нужны модели уровня «болезнь-система», интеграция многомодальных омных данных и клинических сигналов.
  4. Гонка 2025+: лидеры двигаются от structure-based к disease-level моделям — многоуровневая причинность, каузальные графы, симуляции тканей/органов, реал-ворлд данные.

Глоссарий (суперкоротко)

  • ADMET — абсорбция, распределение, метаболизм, выведение, токсичность.
  • hERG — сердечный K⁺-канал; его блокада → удлинение QT, риск аритмий.
  • P-gp — мембранный насос, «выплёвывает» лекарства из клетки.
  • GNN — графовые нейросети, естественное представление молекул.
  • MOO/RL — многокритериальная оптимизация с обучением с подкреплением.
  • AlphaFold 3 — предсказание комплексов; ограничение — induced fit.

Заключение

ИИ уже радикально улучшил ранний этап — качественную химию. Следующая граница — качественная биология: выбор правильных мишеней и понимание болезней как динамических систем. Это и есть новый R&D-ландшафт: меньше «дорогих тупиков», больше осмысленных клинических экспериментов.