Wikipedia talk:WikiProject Molecular Biology/Computational Biology/13th ISCB Student Wikipedia competition announcement
Mikrobiyom Çalışmalarında Kullanılan R Paketleri
[edit]Özet
Mikrobiyom araştırmaları, yüksek verimli dizileme teknolojisinin ortaya çıkmasıyla hızla genişlemiştir. Buna paralel olarak, güçlü biyoinformatik araçların geliştirilmesi, karmaşık mikrobiyal veri kümelerinin işlenmesi ve analiz edilmesi için çok önemli hale gelmiştir. Kapsamlı paket ekosistemi ile R programlama dili, mikrobiyom çalışmalarında istatistiksel analiz için tercih edilen platform olarak ön plana çıkmıştır. Bu derleme, mikrobiyom veri analizini kolaylaştırmak için tasarlanmış birkaç önemli R paketini özetlemekte, işlevlerini, güçlü yönlerini ve tipik araştırma iş akışlarına entegrasyonlarını vurgulamaktadır.
Anahtar Kelimeler : R paketleri, mikrobiyom, veri analizi
Giriş
Toplulukların ve mikrobiyomların araştırılması sağlık, çevre bilimi ve tarım gibi çeşitli alanlarda önem taşımaktadır. Bu toplulukların yapısını ve işlevlerini anlamak için gelişmiş analitik araçlar gereklidir. Hesaplama ve grafikler için kullanılan bir programlama dili olan R, mikrobiyom verilerini analiz etmek için özel olarak tasarlanmış paketler sunmaktadır. Bu paketler boyutsallık, seyreklik ve kompozisyonel doğa gibi mikrobiyom verilerinin ortaya çıkardığı zorlukları ele almak için tasarlanmıştır.
R, Yeni Zelanda'daki Auckland Üniversitesi'nden Ross Ihaka ve Robert Gentleman tarafından geliştirilen ücretsiz ve açık kaynaklı bir programlama dili olarak öne çıkıyor. "R Geliştirme Çekirdek Ekibi" şu anda bakımını denetlemektedir (Win vd., 2023). SPSS, MINITAB ve MATLAB gibi işlenmiş veri setleriyle mükemmel sonuçlar veren araçların aksine R, hem işlenmiş hem de ham verileri işleme konusunda çok yönlüdür. En yeni algoritmalar da dahil olmak üzere bir dizi yöntemi destekler. Ayrıca R'nin gücü, özellikle karmaşık veri kümeleri için etkili olan görselleştirme yeteneklerinde yatmaktadır. Esnekliği, onu görsel veri temsillerini keşfetmek için güçlü bir araç haline getirir (Win vd., 2023).
R'nin yetenekleri, R'de çeşitli veri analizi görevlerine izin veren bir dizi veri işleme ve analiz tekniği sağlayan paketlerle önemli ölçüde artırılmıştır. 31 Ocak 2023 itibariyle CRAN'da 18.981 ve Bioconductor'da 2.183 R paketi mevcuttu ve R'nin sağlam veri işleme ve analiz özelliklerini sergiliyordu (Win ve diğerleri, 2023).
Son yıllarda, aşağı akış mikrobiyom analizi için R platformunda çok sayıda R paketi geliştirilmiş ve bu da ilgili araştırma alanına önemli katkılar sağlamıştır (Win vd., 2023).
Mikrobiyom Araştırmalarında Anahtar R Paketleri
Mikrobiyom araştırmaları için özel olarak tasarlanmış birkaç R paketi bulunmaktadır:
1.tidyMicro: Bu paket, R'deki tidyverse anlayışından yararlanarak mikrobiyom veri analizine kullanıcı dostu bir yaklaşım sağlar (Carpenter ve ark., 2021). Bu, açık kaynaklı işbirliğini teşvik ederken yorumlanabilirliği artırmak için standart analizlerin yeni uzantılarını içerir.
2. Microeco: Hızlı, esnek ve modülerleştirilmiş bir seçenek olan microeco, mikrobiyal topluluk ekolojisinde veri madenciliğindeki yetenekleriyle öne çıkmaktadır (Liu ve ark., 2020). Araştırmacılara ön işleme, çeşitlilik analizi, diferansiyel bolluk testi vb. için araçlar sağlar.
3. Mikrobiyom R paketi: Bu paket, mikrobiyal topluluk verilerini işlemek ve analiz etmek için çok sayıda araç sunar ve araştırmacılara veri görselleştirmeden karşılaştırmalı topluluk profiline kadar her konuda yardımcı olur (microbiome R paketi, 2022).
4. Mikrobiyom Verilerinin R ile İstatistiksel Analizi: Bu kaynak, kendisi bir paket olmasa da, kamu malı veriler ve adım adım rehberlik sunarak mikrobiyom veri analizinde R uygulamasını anlamak için hayati önem taşımaktadır (Xia ve ark., 2018).
Mikrobiyom araştırmaları, karmaşık mikrobiyom verilerini analiz etmek ve görselleştirmek için büyük ölçüde özel R paketlerine dayanır. Mikrobiyom çalışmalarının farklı yönlerini kolaylaştırmak için çeşitli R paketleri geliştirilmiştir. Örneğin, "coda4microbiome" hem kesitsel hem de boylamsal çalışmalar için CoDA çerçevesinde bileşimsel veri analizi sağlayan bir pakettir (Calle vd., 2023; Calle & Susín, 2022). Öte yandan, "animalcules" mikrobiyom verileri için etkileşimli analitik ve görselleştirme araçları sağlamaktadır (Zhao vd., 2021). Ayrıca, "microbiomedataset" mikrobiyom verilerini verimli bir şekilde düzenlemek ve işlemek için bir çerçeve sunmaktadır (Shen, 2023).
Ayrıca, gelişmiş istatistiksel modeller kullanarak mikrobiyom göreceli bolluk verilerini analiz etmeye odaklanan "metamicrobiomeR" gibi paketler de bulunmaktadır (Ho & Li, 2018). "MicrobiomeR", mikrobiyom analizi iş akışlarını basitleştirip standartlaştırarak kullanıcılara NIH'nin Nephele iş akışı (pipeline) çıktı dosyaları sağlamaktadır (Gilmore vd., 2019). "MBECS", mikrobiyom verilerindeki toplu etkileri ele alarak düzeltme yöntemlerini bir R yazılım paketine entegre etmektedir (Olbrich ve ark., 2023). "SplinectomeR", boylamsal mikrobiyom çalışmalarında grup karşılaştırmalarına olanak tanıyarak araştırmacıların benimsemesini pratik ve kolay hale getirmektedir (Shields-Cutler ve ark., 2018). "microViz" mikrobiyom veri görselleştirme ve istatistiksel analiz konusunda uzmanlaşmıştır (Barnett et al., 2021).
Ayrıca "NetCoMi", R'deki mikrobiyom verileri için kapsamlı bir ağ oluşturma ve karşılaştırma aracı sunmaktadır (Peschel ve ark., 2020). "phyloMDA", filogenetik dizileme verilerini içe aktarmak, depolamak ve analiz etmek için araçlar sağlayarak filogeniye duyarlı mikrobiyom veri analizine odaklanmaktadır (Liu ve ark., 2022). Bu paketler, tidyverse tabanlı mikrobiyom veri analizi için "tidyMicro" (Carpenter vd., 2021), tekrarlanabilir etkileşimli analiz ve grafikler için "phyloseq" (McMurdie ve Holmes, 2013) ve negatif binom ve sıfır şişirilmiş karma modeller için "NBZIMM" (Zhang ve Yi, 2020) gibi diğerleriyle birlikte mikrobiyom araştırmalarının ilerlemesine önemli ölçüde katkıda bulunmaktadır.
Sonuç
Sonuç olarak, mikrobiyom araştırmaları için özel olarak tasarlanmış çeşitli R paketlerinin mevcudiyeti, araştırmacıların karmaşık mikrobiyom verilerini verimli bir şekilde analiz etmelerini, görselleştirmelerini ve yorumlamalarını sağlamada önemli bir rol oynamakta ve nihayetinde çeşitli ortamlarda yaşayan mikrobiyal topluluklara ilişkin anlayışımızı geliştirmektedir. Ancak yine de farklı bakış açıları getiren, farklı yorumlamalar ve analizler için araçlar geliştirilmesine ihtiyaç vardır. Kubatkbra (talk) 17:44, 3 May 2024 (UTC)
References:
1. Barnett, D., Arts, I., & Penders, J. (2021). Microviz: an r package for microbiome data visualization and statistics. The Journal of Open Source Software, 6(63), 3201. https://doi.org/10.21105/joss.03201
2. Calle, M. and Susín, A. (2022). Coda4microbiome: compositional data analysis for microbiome studies.. https://doi.org/10.1101/2022.06.09.495511
3. Calle, M., Pujolassos, M., & Susín, A. (2023). Coda4microbiome: compositional data analysis for microbiome cross-sectional and longitudinal studies. BMC Bioinformatics, 24(1). https://doi.org/10.1186/s12859-023-05205-3
4. Carpenter, C., Frank, D., Williamson, K., Arbet, J., Wagner, B., Kechris, K., … & Kroehl, M. (2021). Tidymicro: a pipeline for microbiome data analysis and visualization using the tidyverse in r. BMC Bioinformatics, 22(1). https://doi.org/10.1186/s12859-021-03967-2
5. Gilmore, R., Hutchins, S., Zhang, X., & Vallender, E. (2019). Microbiomer: an r package for simplified and standardized microbiome analysis workflows. The Journal of Open Source Software, 4(35), 1299. https://doi.org/10.21105/joss.01299
6. Ho, N. and Li, F. (2018). Metamicrobiomer: an r package for analysis of microbiome relative abundance data using zero-inflated beta gamlss and meta-analysis across studies using random effect models.. https://doi.org/10.1101/294678
7. Liu, T., Zhou, C., Wang, H., Zhao, H., & Wang, T. (2022). Phylomda: an r package for phylogeny-aware microbiome data analysis. BMC Bioinformatics, 23(1). https://doi.org/10.1186/s12859-022-04744-5
8. McMurdie, P. and Holmes, S. (2013). Phyloseq: an r package for reproducible interactive analysis and graphics of microbiome census data. Plos One, 8(4), e61217. https://doi.org/10.1371/journal.pone.0061217
9. Olbrich, M., Künstner, A., & Busch, H. (2023). Mbecs: microbiome batch effects correction suite. BMC Bioinformatics, 24(1). https://doi.org/10.1186/s12859-023-05252-w
10. Peschel, S., Müller, C., Mutius, E., Boulesteix, A., & Depner, M. (2020). Netcomi: network construction and comparison for microbiome data in r. Briefings in Bioinformatics, 22(4). https://doi.org/10.1093/bib/bbaa290
11. Shen, X. (2023). Microbiomedataset: a tidyverse-style framework for organizing and processing microbiome data.. https://doi.org/10.1101/2023.09.17.558096
12. Shields-Cutler, R., Al-Ghalith, G., Yassour, M., & Knights, D. (2018). Splinectomer enables group comparisons in longitudinal microbiome studies. Frontiers in Microbiology, 9. https://doi.org/10.3389/fmicb.2018.00785
13. Zhang, X. and Yi, N. (2020). Nbzimm: negative binomial and zero-inflated mixed models, with application to microbiome/metagenomics data analysis. BMC Bioinformatics, 21(1). https://doi.org/10.1186/s12859-020-03803-z
14. Zhao, Y., Federico, A., Faits, T., Manimaran, S., Segrè, D., Monti, S., … & Johnson, W. (2021). Animalcules: interactive microbiome analytics and visualization in r. Microbiome, 9(1). https://doi.org/10.1186/s40168-021-01013-0
15. Wen, T., Niu, G., Chen, T., Shen, Q., Yuan, J., & Liu, Y. X. (2023). The best practice for microbiome analysis using R. Protein & cell, 14(10), 713–725. https://doi.org/10.1093/procel/pwad024