近日,《分子園藝》(Molecular Horticulture)在線發表了中國農業科學院鄭州果樹研究所桃遺傳育種團隊的文章。該文報道的PeachMD數據庫(http://www.peachmd.com)首次集成桃基因組、表觀遺傳組、群體遺傳變異及多維度表型數據,并深度整合CRISPR設計、GWAS分析等工具,為推動桃分子育種和功能基因組學研究提供數據支持。
桃果實表型多樣性。中國農科院鄭果所供圖
隨著高通量測序技術的快速發展和測序成本的顯著降低,生物大數據呈現出指數級增長的態勢。在桃的遺傳育種研究領域,多組學技術的廣泛應用催生了基因組、轉錄組、表觀組等多維度、多層次的海量數據資源。這些數據的積累為解析桃的進化歷程、挖掘重要性狀的關鍵基因以及指導分子育種實踐提供了前所未有的機遇。
然而,面對如此龐大且復雜的多組學數據,如何高效整合、深度挖掘并從中提取有價值的生物學信息,已成為當前研究者面臨的主要挑戰之一。這不僅需要強大的計算分析能力,更依賴于系統化的數據管理平臺和智能化分析工具的開發與應用。因此,多組學數據庫的建立成為推動桃遺傳育種研究的重要基石。
PeachMD數據庫涵蓋了迄今為止最新和最全面的桃多組學資源庫。數據庫收集并整合了已發表的12個桃基因組(支持基因組間共線性分析)、329個轉錄組數據集(包括不同組織、不同發育階段,支持FPKM/TPM/Read Count多維度表達譜分析)、102個全基因組亞硫酸氫鹽測序(解析CG/CHG/CHH不同位點甲基化調控模式)以及1313個全基因組重測序數據(含13類關鍵農藝性狀表型)。
數據庫秉承全過程式的設計理念,通過CRISPR-GWAS聯動,實現從基因挖掘到分子設計全流程覆蓋。此外,PeachMD數據庫還支持多模式檢索,從基因ID、啟動子、蛋白結構域等多維度查詢,一鍵獲取基因序列信息。集成的Gene LiftOver工具作為基因組數據分析的“橋梁工具”,方便不同基因組間的基因比較。
總之,PeachMD提供的多組學關聯分析工具,能夠揭示基因組變異-表觀變異-轉錄差異協同調控網絡,便于數據的利用。因此,它有望成為推動桃分子育種和功能基因組學研究的重要資源,為相關領域的研究提供強有力的數據支持。
中國農業科學院鄭州果樹研究所博士研究生李昂和助理研究員孫世航為論文第一作者,研究員曾文芳為通訊作者。該研究得到了國家自然科學基金、河南省科技攻關項目、中國農業科學院科技創新工程、鄭州果樹研究所基本科研業務費等項目資助。
相關論文信息:https://doi.org/10.1186/s43897-025-00157-z