Điều tiết biến dưỡng và phân tử tính trạng tích tụ anthocyanin trong diều kiện bị stress P của giống khoai lang ruột tím
Nguồn: Lei Zhang, Afsheen Zehra, Rong Jin, Jinhua Zhou, Lili Lu, Wei Jiang, Yan Yang, Zulfiqar Ali Sahito, Wanlin Yang, Zhonghou Tang. 2026. Molecular and metabolic regulation of anthocyanin accumulation under phosphorus stress in purple-fleshed sweet potato. Plant Physiol Biochem.; 2026 Apr: 233:111061. doi: 10.1016/j.plaphy.2026.111061.
![]()
Khoai lang ruột tím PFSP (purple-fleshed sweet potato) (Ipomoea batatas) là giống khoai lang giàu nguồn anthocyanins, mà chất này có khả năng thực hiện antioxidants (chống ô xi hóa), đóng góp nhiều vào kết quả chống chịu stress. Tuy nhiên, những cơ chế phân tử điều tiết sinh tổng hợp anthocyanin của giống khoai lang PFSP trong điều kiện thiếu hoặc đói lân vẫn chưa được biết rõ. Theo nghiên cứu này, người ta tiến hành phân tích transcriptomic và metabolomic trên giống khoai lang Xuzishu No. 8 được trồng với 3 nghiệm thức xử lý lân khác nhau: XP0 (0 g), XP1 (1.85 g), và XP2 (3.70 g). Cho dù phosphorous không ảnh hưởng đáng kể đến hàm lượng anthocyanin tổng số, nhưng có sự thay đổ đáng chú ý trong hoạt tính của những enzymes chủ lực về sinh học (CHl, DFR, OPC, PAL và UFGT). Kết quả phân tích RNA-seq xác định được 8,906 gen DEGs (differentially expressed genes) với 11.215 gen mới qua nghiệm thức xử lý này. Phương pháp “KEGG pathway enrichment analysis” cho kết quả là hấu hết những gen DEGs đếu gắn liền với sinh tổng hợp chất phenylpropanoid. Phổ biểu hiện metabolomic đã phát hiện được 110 chất biến dưỡng DEMs (differentially expressed metabolites), trong đó, có sáu DEMs là phỗ biến cho mọi nghiệm thức và có 16 DEMs được chia sẻ giữa 2 nhóm nghiệm thức. Chú thích chức năng di truyền của DEMs chỉ ra rằng có một ức chế chung trong lộ trình sinh tổng hợp anthocyanin, qua những nghiệm thức xử lý, trong khi đó, sinh tổng hợp flavone và flavonol vẫn duy trì hoạt động rất nhất quán. Chú ý, quercetin-3-O-glucoside xuất hiện để đóng vai chủ chốt trong việc khôi phục sinh tổng hợp anthocyanin. Phân tích có tính chất tích hợp transcriptome và metabolome cho thấy có một sự điều tiết rất mạnh kết hợp giữa DEGs và DEMs, đặc biệt, trong lộ trình sinh tổng hợp anthocyanin và flavonoid. Bên cạnh, kết quả phân tích “canonical correspondence” (CCA) và PCA (principal component analysis),biểu đồ “biplot” cho thấy tính trạng tích tụ anthocyanin được điều khiển bởi hoạt động tích hợp của rất nhiều gen, với phần mềm Tai6.6720 xác định được một gen điều tiết chủ yếu liên kết chặt với các chất biến dưỡng tích cực (pelargonidin-3-O- glucoside và cyanidin-3-O- glucoside). Kết quả nhấn mạnh tác động có ý nghĩa của stress thiếu lân trên sự tái lập trình phiên mã và biến dưỡng của lộ trình sinh tổng hợp anthocyanin như một phản ứng thích nghi. Kết quả cho thấy luận điểm khoa học mới về hệ thống điều tiết di truyền điều khiển tính trạng tích tụ anthocyanin trong khoai lang, một nền tảng có giá trị của chiến lược quản lý dinh dưỡng và nội dụng cải tiến giống phân tử nhằm cải thiện giống khoai chống chịu stress.
Xem https://pubmed.ncbi.nlm.nih.gov/41941854/
GHI CHÚ
Để làm chủ được chuỗi phân tích tích hợp dữ liệu Transcriptomics (RNA-seq) và Metabolomics, nằm trong lĩnh vực tiên tiến và thú vị nhất của Sinh học hệ thống (Systems Biology).
1. Nền tảng về RNA-seq & Metabolomics (Kiến thức đầu vào)
Trước khi tích hợp, bạn phải hiểu rõ bản chất của từng loại dữ liệu độc lập.
Transcriptomics (RNA-seq)
Pipeline xử lý dữ liệu thô (Raw data): Cách QC (FastQC), cắt lọc (Trimmomatic), mapping vào hệ gen tham chiếu (HISAT2, STAR) và đếm số đọc (featureCounts).
Phân tích biểu hiện gen sai biệt (DEG - Differentially Expressed Genes): Hiểu cách hoạt động của các gói lệnh như
DESeq2hoặcEdgeR(sử dụng phân phối Negative Binomial).Chuẩn hóa dữ liệu: Phân biệt RPKM, FPKM, TPM và cách chuyển đổi log-transform để vẽ biểu đồ.
Metabolomics
Đặc thù dữ liệu: Dữ liệu định tính/định lượng từ sắc ký khối phổ (LC-MS, GC-MS) hoặc NMR.
Xử lý sơ bộ (Preprocessing): Alignment, lọc nhiễu (noise filtering), và chuẩn hóa dữ liệu (normalization/scaling như Auto-scaling, Pareto scaling) vì nồng độ chất chuyển hóa chênh lệch rất lớn.
Định danh chất (Metabolite Identification): Cách tra cứu các ID chất trên các database như HMDB, PubChem, ChEBI.
2. Phân tích thống kê đa biến (PCA, CCA & Biplot)
Đây là nhóm công cụ giúp bạn giảm chiều dữ liệu (dimensionality reduction) và tìm mối quan hệ giữa các tập dữ liệu lớn.
PCA (Principal Component Analysis - Phân tích thành phần chính)
Bản chất: Phương pháp học không giám sát (unsupervised). Nó giúp bạn gom cụm các mẫu (samples) xem các nhóm sinh học (ví dụ: Đối chứng vs. Bệnh lý) có tách biệt rõ ràng không.
Kiến thức cần học: Cách giải thích tỷ lệ phương sai (Variance explained) của PC1, PC2.
CCA (Canonical Correspondence Analysis - Phân tích tương hợp chuẩn)
Bản chất: Phương pháp phân tích trực giao có giám sát/ràng buộc (constrained). Thường dùng để xem tập dữ liệu này (ví dụ: Metabolome) bị giải thích hoặc “ràng buộc” như thế nào bởi tập dữ liệu kia (ví dụ: một nhóm Gen biến động hoặc các yếu tố môi trường).
Kiến thức cần học: Phân biệt giữa CCA tuyến tính (Canonical Correlation Analysis) và CCA phi tuyến trong sinh thái/vi sinh (Correspondence).
Biplot
Cách đọc biểu đồ: Biplot kết hợp cả Score plot (vị trí của các mẫu) và Loading plot (hướng và độ dài của các vector biến - gen hoặc chất chuyển hóa).
Nguyên lý: Nếu một mẫu nằm cùng hướng với một vector chất chuyển hóa, nghĩa là mẫu đó có nồng độ chất đó cao. Nếu hai vector (Gen A và Chất B) nằm sát nhau và kéo dài, chúng có mối tương quan thuận mạnh.
3. Phân tích làm giàu con đường sinh học (KEGG Pathway Enrichment)
Biến danh sách “Gen” hoặc “Chất” khô khan thành ý nghĩa sinh học.
Học thuyết thống kê: Hiểu cách tính toán thông qua Kiểm định siêu hình (Hypergeometric test) hoặc Fisher’s Exact Test.
Nguyên lý: Giả sử bạn có 100 gen biến động, nếu 20 gen trong số đó cùng thuộc con đường “Glycolysis” (Đường phân), thuật toán sẽ tính xem tỷ lệ này là ngẫu nhiên hay thực sự có ý nghĩa sinh học.
Công cụ cần học: * Web-based: David, MetaboAnalyst (rất mạnh cho Metabolomics).
- R packages:
clusterProfiler(đỉnh cao cho RNA-seq),Pathview(để tô màu gen/chất lên sơ đồ con đường KEGG).
- R packages:
4. Tích hợp dữ liệu “Multi-omics” (Transcriptome + Metabolome)
Đây là đỉnh tháp - nơi bạn liên kết RNA và Metabolite lại với nhau.
Tích hợp dựa trên Con đường (Pathway-based Integration)
- Joint Pathway Analysis: Đưa cả danh sách DEG (từ RNA-seq) và danh sách chất biến động (from Metabolomics) vào chung một sơ đồ KEGG để xem con đường nào bị ảnh hưởng toàn diện từ mức độ phiên mã đến sản phẩm chuyển hóa.
Tích hợp dựa trên Thống kê & Mạng lưới (Correlation & Network-based)
Học hệ số tương quan: Pearson/Spearman correlation giữa biểu hiện Gen và nồng độ Chất.
Công cụ nâng cao:
WGCNA (Weighted Gene Co-expression Network Analysis): Tìm các module gen đồng biểu hiện, sau đó tương quan các module này với nồng độ các chất chuyển hóa.
mixOmics (R package): Công cụ cực mạnh chuyên framework DIABLO, PLS-DA để tích hợp đa omics.
Cytoscape: Phần mềm dùng để vẽ và tối ưu mạng lưới tương tác Gen - Chất.
Kế hoạch hành động: Bạn nên học gì trước?
Ngôn ngữ lập trình: Học chắc R (hoặc Python, nhưng R mạnh hơn về mảng Multi-omics nhờ hệ sinh thái Bioconductor). Học cách dùng
ggplot2để vẽ Biplot.Thống kê cơ bản đến đa biến: Hiểu rõ , (FDR), Hiệp phương sai (Covariance), và Đại số tuyến tính cơ bản (Ma trận, Vector riêng - Eigenvector để hiểu PCA).
Thực hành theo chuỗi (Pipeline):
Bước 1: Chạy dữ liệu RNA-seq bằng
DESeq2Ra danh sách Gen.Bước 2: Chạy dữ liệu Metabolomics Ra danh sách Chất.
Bước 3: Chạy PCA cho từng tập dữ liệu để check QC.
Bước 4: Dùng
MetaboAnalyst(bản web) để chạy thử Joint Pathway Analysis (đây là cách dễ tiếp cận nhất để thấy bức tranh tổng quan).Bước 5: Học code gói
mixOmicshoặcclusterProfilertrên R để tùy biến chuyên sâu.
Không có nhận xét nào:
Đăng nhận xét