子宫内膜癌外泌体蛋白质组学分析(2025 年 10 月版)¶
出品:一诺一康生物医药科技有限公司 · 生物信息团队
数据版本:2025-10-21(保留经复核的基础分析,已移除存在错误的高级分析部分)
数据来源:客户报告_外泌体蛋白质组学完整分析v2.docx、results/*目录下的 CSV/图表文件
1. 项目背景与样本信息¶
- 研究目的:解析子宫内膜癌五个分子亚型(良性对照、POLEmut、NSMP、MMRd、P53abn)的血浆外泌体蛋白质组差异,重点挖掘 P53abn 亚型的特征与潜在机制。
- 技术平台:DIA-MS 血浆外泌体蛋白质组测定。
- 样本设计:5 组 × 20 例,共 100 例(
sample_metadata.csv)。所有样本均通过质控纳入分析,无缺失分组。 - 原始规模:1,703 个蛋白质条目;过滤缺失与分组一致性后保留 1,090 个高质量蛋白用于统计分析(
preprocessing_summary.txt)。
2. 数据处理与质量评估¶
2.1 预处理流程(见 preprocessing_summary.txt)¶
- 缺失约束:
- 蛋白整体缺失率 ≤ 50%;任一分组缺失率 ≤ 70%。
-
过滤后保留 64% 原始蛋白(1,090/1,703)。
-
归一化与转换:
- log₂ 转换(ε = 1.9)缓解量级差异。
-
按样本中位数居中,消除系统偏移。
-
缺失值填补:
- MinProb(q = 0.01,tune.sigma = 1),针对 MNAR 模式。
- 填补前缺失量 14.1%,填补后缺失为 0,保证 downstream 模型稳定。
2.2 质量控制图概览¶
| 图表 | 路径 | 主要结论 |
|---|---|---|
| 01_missingness_heatmap.pdf | figures/qc/ |
缺失率过滤后各样本缺失分布均衡,无异常高缺失样本。 |
| 02_density_by_group.pdf | 同上 | 各分组密度曲线重合良好,说明归一化有效。 |
| 03_boxplot_by_sample.pdf | 同上 | 样本箱线图高度一致,无异常值。 |
| 04_pca.pdf | 同上 | 主成分空间能区分多组样本,组内聚类紧密。 |
| 05_sample_correlation.pdf | 同上 | 相关矩阵显示样本相关性高,平均相关系数>0.9。 |
质量评估结果支持后续差异分析的可靠性。
3. 统计分析概览¶
3.1 模型设置¶
- 方法:limma 线性模型 + 经验贝叶斯(
results/differential/*.csv)。 - 比较:10 个两两对比,涵盖全部分组组合。
- 显著性判定:FDR(Benjamini-Hochberg)< 0.05,|log₂FC| 无硬阈值但通常观察到 >0.58(1.5 倍)。
3.2 对比结果摘要¶
| 对比 | 显著蛋白数 | 上调 | 下调 | 最大倍数 (log₂FC) | 最小倍数 (log₂FC) |
|---|---|---|---|---|---|
| P53abn vs 良性 | 38 | 30 | 8 | 2.79 (6.90×↑ BPIFB1) | -2.77 (0.15×↓ CD274,未达显著) |
| P53abn vs POLEmut | 100 | 75 | 25 | 6.52 | -2.28 |
| P53abn vs NSMP | 122 | 30 | 92 | 6.24 | -2.63 |
| P53abn vs MMRd | 12 | 7 | 5 | 2.67 | -1.63 |
| POLEmut vs 良性 | 16 | 10 | 6 | 2.71 | -5.72 |
| NSMP vs 良性 | 338 | 317 | 21 | 3.11 | -5.44 |
| MMRd vs 良性 | 118 | 108 | 10 | 2.83 | -2.19 |
| NSMP vs POLEmut | 237 | 228 | 9 | 2.31 | -1.88 |
| MMRd vs POLEmut | 209 | 179 | 30 | 6.12 | -2.52 |
| MMRd vs NSMP | 120 | 52 | 68 | 5.84 | -2.33 |
数据来源:
results/tables/differential_summary.csv。
解读要点:
- 所有对比均检出显著差异,说明外泌体蛋白组对亚型区分能力强。
- NSMP vs 良性差异数量最大(338 个),提示“无特异”亚型在外泌体层仍有明显分子特征。
- P53abn 与良性差异数量适中,但包含倍数变化极端的蛋白,是本章节关注重点。
4. P53abn vs 良性对照:关键差异蛋白¶
4.1 显著上调蛋白(示例)¶
| 序号 | 基因 | log₂FC | 倍数变化 | FDR | 生物学注释 |
|---|---|---|---|---|---|
| 1 | BPIFB1 | 2.79 | 6.90× ↑ | 3.52×10⁻¹² | 黏膜免疫蛋白,参与炎症防御。 |
| 2 | FCMR | 1.93 | 3.81× ↑ | 1.11×10⁻⁵ | IgM Fc 受体,影响 B 细胞/补体。 |
| 3 | H4C16 | 1.85 | 3.60× ↑ | 1.27×10⁻⁴ | 组蛋白 H4,染色质核心组成。 |
| 4 | H2A 家族 | 1.78 | 3.44× ↑ | 3.58×10⁻⁵ | 多个 H2A 变体协同升高。 |
| 5 | CPAMD8 | 1.69 | 3.22× ↑ | 6.06×10⁻⁴ | 补体调节蛋白,参与免疫平衡。 |
| 6 | HSP90B1 | 1.49 | 2.82× ↑ | 1.75×10⁻³ | 内质网伴侣蛋白,反映折叠压力。 |
| 7 | CAPZB | 1.53 | 2.88× ↑ | 8.80×10⁻³ | F-actin 端帽蛋白,调节细胞骨架。 |
| 8 | IGHV3-64D | 1.44 | 2.71× ↑ | 1.57×10⁻² | IgG 重链可变区,提示 B 细胞信号。 |
| 9 | PF4 | 1.35 | 2.55× ↑ | 2.28×10⁻² | 血小板因子 4,关联血栓与炎症。 |
| 10 | CACNG7 | 1.30 | 2.46× ↑ | 3.07×10⁻² | 电压依赖钙通道 γ 亚基,参与信号传导。 |
数据来源:
P53abn_vs_Benign_results.csv(筛选 FDR < 0.05)。
4.2 显著下调蛋白¶
| 序号 | 基因 | log₂FC | 倍数变化 | FDR | 生物学注释 |
|---|---|---|---|---|---|
| 1 | PGAM1 | -2.24 | 0.21× ↓ | 2.14×10⁻⁶ | 糖酵解关键酶,在外泌体中显著减少。 |
| 2 | SAA1/SAA2 | -2.09 | 0.24× ↓ | 3.52×10⁻¹² | 急性期蛋白,系统炎症指示物。 |
| 3 | KSR2 | -1.89 | 0.27× ↓ | 2.85×10⁻³ | MAPK 通路调节蛋白。 |
| 4 | LILRB3/LILRA6 | -1.31 | 0.40× ↓ | 2.65×10⁻² | 抑制型白细胞免疫受体,涉及免疫调控。 |
| 5 | KRT4 | -1.21 | 0.43× ↓ | 1.11×10⁻² | 角蛋白,反映上皮结构重塑。 |
4.3 结果解读¶
- 染色质与核物质释放信号
- H4C16、H2A 系列显著上调,KEGG 富集到 “ATP-dependent chromatin remodeling”“Systemic lupus erythematosus”。
-
说明 P53abn 外泌体携带大量核成分,可能反映肿瘤细胞核不稳定或 NETosis 样释放。
-
代谢重编程的独特表现
- PGAM1(糖酵解酶)显著下调,与常见的 Warburg 效应趋势相反。
-
结合 HSP90B1 上调,可以推测外泌体选择性分泌机制发生改变,带走部分代谢酶。
-
炎症与免疫双向调节
- BPIFB1、FCMR、PF4、IGHV3-64D 等上调,提示局部炎症与免疫反应活跃。
- SAA1/SAA2 下调,说明系统性急性期反应可能受到抑制。
-
抑制型受体 LILRB3/LILRA6 下调,表明免疫调控机制重新分布。
-
内质网应激与折叠压力
- HSP90B1 2.82× 上调,表明 P53abn 依赖内质网伴侣维持蛋白折叠稳态。
- 该信号与代谢及免疫路径的变化相呼应。
这些特征在火山图、热图等可视化结果中均有直观体现。客户可以通过 top50_P53abn_vs_Benign 表查阅全部蛋白列表。
5. 通路富集与主题解读¶
5.1 KEGG 富集(P53abn vs 良性)¶
| 通路 | 富集蛋白数 | FDR | 主题说明 |
|---|---|---|---|
| ATP-dependent chromatin remodeling | 10/36 | 2.09×10⁻⁹ | 表观遗传调控、染色质结构重塑。 |
| Neutrophil extracellular trap formation | 13/36 | 2.73×10⁻⁷ | NETosis 相关,支持核内容外排现象。 |
| Alcoholism | 11/36 | 5.43×10⁻⁷ | 该通路包含大量组蛋白,反映染色质改变。 |
| Systemic lupus erythematosus | 12/36 | 6.33×10⁻⁷ | 自身免疫相关,强调核抗原暴露。 |
| Necroptosis | 10/36 | 1.46×10⁻⁶ | 程序性细胞死亡信号与炎症关联。 |
数据来源:
results/pathway/P53abn_vs_Benign_KEGG.csv。
5.2 GO Biological Process(Top 3)¶
| 通路 | 富集蛋白数 | FDR | 说明 |
|---|---|---|---|
| Epigenetic regulation of gene expression | 9/50 | 4.10×10⁻² | 组蛋白等表观遗传相关蛋白富集。 |
| Regulation of cell adhesion | 7/50 | 4.12×10⁻² | 反映外泌体中 ECM/黏附蛋白变化。 |
| Response to hypoxia | 6/50 | 4.12×10⁻² | 与肿瘤缺氧微环境有关。 |
数据来源:
results/pathway/P53abn_vs_Benign_GO_BP.csv。
5.3 Hallmark GSEA¶
| 基因集 | NES | FDR | 说明 |
|---|---|---|---|
| HALLMARK_HEME_METABOLISM | -2.54 | 4.62×10⁻⁵ | 血红素/红细胞相关蛋白整体下调。 |
| HALLMARK_UV_RESPONSE_DN | 1.71 | 7.98×10⁻² | ECM/黏附类基因上调趋势。 |
数据来源:
results/pathway/P53abn_vs_Benign_Hallmark_GSEA.csv。
总结:通路结果与差异蛋白列表高度吻合,构建了“染色质释放 + NETosis 激活 + ECM 重构 + 代谢重编程”的综合图景。
6. 其他亚型的外泌体特征¶
尽管本章节聚焦 P53abn,与其他亚型的比较也呈现出重要模式:
- NSMP vs 良性(338 个显著蛋白)
- 绝大多数(317 个)上调,说明 NSMP 外泌体蛋白谱变化非常广泛。
-
富集到 ECM、细胞骨架与免疫相关通路,与其组织学异质性相符。
-
MMRd vs 良性(118 个显著蛋白)
- 以免疫与抗原呈递通路上调为主,反映 DNA 修复缺陷亚型的免疫活化特征。
-
与 P53abn 差异较小(12 个显著蛋白),提示两者外泌体载荷有部分重叠。
-
P53abn vs POLEmut / NSMP / MMRd
- P53abn 相比 POLEmut 上调 75 个、下调 25 个蛋白,最大 fold 变化可达 91.83×,说明表型仍然可区分。
- 与 NSMP 的差异主要体现在核成分上调和代谢酶下调。
- 与 MMRd 仅有 12 个蛋白差异,显示两者某些核心通路相似。
这些对比有助于客户全面了解外泌体蛋白在不同亚型中的角色,可通过各 *_results.csv 文件查阅完整列表。
7. 可视化解读¶
| 图表 | 位置 | 说明 |
|---|---|---|
| Volcano_P53abn_vs_Benign.pdf | results_comprehensive/figures_summary/ |
直观展示 38 个显著蛋白的方向和幅度。 |
| Heatmap_Top50.pdf | 同上 | P53abn 样本聚集在一起,组蛋白、胆碱相关蛋白明显高表达。 |
PCA(figures/qc/04_pca.pdf) |
见 QC 图 | 五个分组分离清楚,组内一致性良好。 |
| Dotplots(KEGG/GO) | results/pathway/ |
反映每个通路的富集强度和涉及基因。 |
这些图表与差异表格互为补充,帮助客户从不同角度理解数据。
8. 小结¶
- P53abn 外泌体载荷中组蛋白、内质网伴侣、炎症相关蛋白显著升高,而糖酵解酶和急性期蛋白显著下降,呈现“染色质释放 + 代谢选择性外排 + 局部炎症激活”的组合特征。
- NSMP、MMRd、POLEmut 等其他亚型同样展现明显的外泌体蛋白变化,强调血浆外泌体作为亚型判别和机制研究载体的潜力。
- KEGG/GO/Hallmark 注释进一步印证了染色质重塑、NETosis、免疫调控等路径在 P53abn 外泌体中的重要性,与差异蛋白列表一致。
9. 交付物索引¶
results/tables/differential_summary.csv:10 个对比的统计汇总。results/differential/*.csv:各对比的全量差异蛋白明细。results/tables/top50_P53abn_vs_Benign.csv:P53abn vs 良性 Top 50 蛋白。results/pathway/*.csv与*.pdf:通路富集与可视化图。figures/qc/*、figures/main/*:质量控制与核心图表。results/preprocessing/processed_data.csv:归一化与填补后的矩阵,可用于二次分析。
上述文件均已在当前目录中完成校对,可直接用于 mkdocs 网站的下载或嵌入显示。若需英文摘要或交互式可视化,可在网站部署阶段按需补充。***