Дифференциальный двумерный электрофорез [two-dimensional difference gel electrophoresis, 2D-DIGE; Unlü et al. (1997)] доступный и чувствительный метод, который позволяет сравнивать уровень экспрессии белков в различных выборках. Этот метод часто используется в протеомике для выявления биомаркеров.

Схема протеомного эксперимента

В этой части курса вы познакомитесь с различными способами анализа данных, полученных протеомными методами. Мы рассмотрим анализ 2-DE (two-dimensional gel electrophoresis) данных с момента, когда информация об интенсивности пятен уже получена (и нормализована), т.е. собственно анализ данных для ответа на биологический вопрос исследования (Sellers and Miecznikowski 2012, Valledor et al. 2014).

Раздел 1 посвящен языку статистического программирования R (R Core Team 2021). Читатели познакомятся с работой в среде RStudio (RStudio Team 2019), освоят основные элементы языка R.

В разделе 2 обсуждаются техники подготовки и предварительной обработки данных протеомных исследований. Мы поговорим о том, в каком формате удобно хранить данные, каким образом их можно использовать в R, мы обсудим проблему пропусков в данных и научимся их заполнять.

Раздел 3 посвящен методам классификации. В нем рассказывается о различных типах расстояний, и алгоритмах, которые используются для кластеризации белков или проб. Читатели научатся строить дендрограммы, оценивать надежность их ветвей, рисовать тепловые карты экспрессии белков.

В разделе 4 говорится о методах сравнения уровня экспрессии в разных пробах или группах проб. Читатель научится выявлять дифференциально экспрессируемые белки при помощи fold change анализа и модерируемого t-критерия. Кроме того, мы обсудим проблемы, возникающие при множественном тестировании и статистические поправки, которые позволяют их избегать.

Раздел 5 рассказывает о выявлении групп маркеров с похожим уровнем экспрессии при помощи анализа главных компонент (Principal Component Analysis, PCA).

Раздел 6 посвящен многомерному анализу паттернов дифференциальной экспрессии при помощи сочетания регрессии методом частных наименьших квадратов и дискриминантного анализа (Partial Least Squares Regression and Discriminant Analysis, PLS-DA).

Заметки к лекциям этого модуля написаны при помощи RMarkdown (Xie et al. 2018, 2020, Allaire et al. 2021) и knitr (Xie 2014, 2015, 2021).

Ссылки

Allaire, J., Y. Xie, J. McPherson, J. Luraschi, K. Ushey, A. Atkins, H. Wickham, J. Cheng, W. Chang, and R. Iannone. 2021. Rmarkdown: Dynamic documents for r.
R Core Team. 2021. R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria.
RStudio Team. 2019. RStudio: Integrated development environment for R. RStudio, Inc., Boston, MA, USA.
Sellers, K. F., and J. C. Miecznikowski. 2012. Statistical Analysis of Gel Electrophoresis Data. Pages 199–216 in S. Magdeldin, editor. Gel Electrophoresis - Principles and Basics. INTECH Open Access Publisher.
Unlü, M., M. E. Morgan, and J. S. Minden. 1997. Difference gel electrophoresis: A single gel method for detecting changes in protein extracts. Electrophoresis 18:2071–2077.
Valledor, L., M. C. Romero-Rodríguez, and J. V. Jorrin-Novo. 2014. Standardization of Data Processing and Statistical Analysis in Comparative Plant Proteomics Experiment. Pages 51–60 in J. V. Jorrin-Novo, S. Komatsu, W. Weckwerth, and S. Wienkoop, editors. Plant Proteomics. Humana Press.
Xie, Y. 2014. Knitr: A comprehensive tool for reproducible research in R. in V. Stodden, F. Leisch, and R. D. Peng, editors. Implementing reproducible computational research. Chapman; Hall/CRC.
Xie, Y. 2015. Dynamic documents with R and knitr. 2nd edition. Chapman; Hall/CRC, Boca Raton, Florida.
Xie, Y. 2021. Knitr: A general-purpose package for dynamic report generation in r.
Xie, Y., J. J. Allaire, and G. Grolemund. 2018. R markdown: The definitive guide. Chapman; Hall/CRC, Boca Raton, Florida.
Xie, Y., C. Dervieux, and E. Riederer. 2020. R markdown cookbook. Chapman; Hall/CRC, Boca Raton, Florida.


(C) 2019-present Marina Varfolomeeva, Arina Maltseva