子宫内膜癌石蜡组织蛋白质组学分析(2025 年 10 月版)¶
出品:一诺一康生物医药科技有限公司 · 生物信息团队
数据版本:2025-10-21(仅包含经复核的基础分析结果)
主要依据:客户报告_石蜡组织蛋白质组学完整分析_最终版v2.docx、results/*目录下的差异、通路与可视化文件
1. 项目背景与样本设计¶
- 研究对象:P53 突变型子宫内膜癌患者肿瘤组织(Tumor, CA)与配对癌旁组织(Adjacent, N)。
- 样本规模:44 份 FFPE 组织数据(22 肿瘤 + 22 癌旁),其中 20 对配对样本用于配对差异分析,其余单侧样本保留在预处理矩阵中(
sample_metadata_correct.csv)。 - 蛋白规模:保留 5,737 个蛋白(
expression_matrix_with_genes.csv),每个样本鉴定蛋白数超过 5,500 个。 - 分析目标:识别肿瘤与癌旁组织之间的蛋白表达差异、总结主要功能通路变化,并为多组学整合提供组织层面的证据。
2. 数据处理与质量评估¶
2.1 预处理概要¶
- 矩阵构建:以 Spectronaut 输出为基础,对 44 个样本生成带基因注释的表达矩阵(
expression_matrix_with_genes.csv)。 - 归一化:所有样本经 log₂ 转换与中位数归一化(
normalized_expression_matrix.csv),保证强度分布可比。 - 缺失处理:沿用项目既定的覆盖率过滤与保守填补策略,确保进入 limma 模型的蛋白在大多数样本中有可用信号。
- 配对信息:
sample_metadata_correct.csv标注 patient_id,共 20 个完整配对;差异分析将 patient 作为阻断因子建模。
2.2 质量控制图(results/figures_qc/)¶
| 图表 | 结论摘要 |
|---|---|
| 01_missing_value_heatmap.pdf | 样本间缺失模式均匀,无异常样本。 |
| 02_raw_intensity_distribution.pdf / 03_normalized_intensity_distribution.pdf | 归一化后箱线图和密度曲线对齐,消除批次差异。 |
| 04_sample_correlation_heatmap.pdf | 肿瘤与癌旁样本相关性均高(r > 0.9),配对样本之间保持较强一致性。 |
| P_value_distribution_histogram.pdf | P 值在 0 附近富集,提示真实差异信号存在。 |
| LogFC_distribution.pdf | log₂FC 分布右偏,说明肿瘤样本存在较多上调蛋白。 |
这些结果表明数据质量满足后续统计分析需求。
3. 统计分析与显著性概览¶
3.1 模型设置¶
- 方法:limma 配对线性模型(对 20 对配对样本拟合)。
- 比较:肿瘤 vs 癌旁(CA_vs_N)单一对比。
- 显著性:
- 在 FDR < 0.05 条件下未检出蛋白(最小 FDR ≈ 0.158)。
- 在名义标准 P < 0.01 下共获得 356 个蛋白(上调 323、下调 33),作为后续描述的基础集合。
详细结果见
Tumor_vs_Adjacent_complete_with_genes.csv。
P < 0.01 蛋白清单可通过筛选P.Value字段获得。
3.2 差异规模与方向¶
- P < 0.01:356 个蛋白;其中 90% 以上在肿瘤组织中上调。
- 倍数变化:log₂FC 绝对值主要集中在 0.6–1.2(约 1.5–2.3 倍)。
- 代表性结果:
- 上调:MZB1、S100A8、TYMP、MUC1、SDC1、EZR 等。
- 下调:ALDH1A1、CAV1、CAVIN2、ISOC1、AKAP12、GNG4 等。
- 可视化:
02_Volcano_Plot.pdf显示肿瘤样本总体位于右侧(上调为主),蓝色点稀少。04_Heatmap_Top50_Proteins.pdf展示前 50 个名义显著蛋白的表达模式,肿瘤与癌旁样本分组清晰。
4. 名义显著蛋白的生物学特征¶
以下解读均基于 P < 0.01 的 356 个蛋白,需注意这些结果未通过 FDR 校正。
4.1 上调蛋白(P < 0.01)¶
| 基因 | log₂FC | P 值 | 备注 |
|---|---|---|---|
| MZB1 | 1.17 | 4.45×10⁻⁴ | B 细胞/浆细胞分泌相关蛋白,提示免疫细胞活跃。 |
| S100A8 | 1.17 | 9.12×10⁻³ | 炎症相关钙结合蛋白,与髓系反应相关。 |
| TYMP | 0.91 | 5.09×10⁻⁴ | 胸苷磷酸化酶,参与血管生成和核苷代谢。 |
| MUC1 | 0.82 | 1.36×10⁻³ | 膜黏蛋白,常见于上皮肿瘤标志。 |
| SDC1 (CD138) | 0.79 | 8.09×10⁻³ | 细胞外基质受体,与肿瘤微环境和黏附调节相关。 |
整体趋势指向免疫细胞浸润增强、分泌通路激活以及上皮黏附蛋白的重塑。
4.2 下调蛋白(P < 0.01)¶
| 基因 | log₂FC | P 值 | 备注 |
|---|---|---|---|
| ALDH1A1 | -0.96 | 5.72×10⁻³ | 醛脱氢酶家族成员,参与氧化还原与代谢。 |
| CAV1 | -0.85 | 9.25×10⁻³ | 雞蛋白家族,与 caveolae 结构相关。 |
| CAVIN2 | -0.85 | 8.64×10⁻³ | 与 caveolae 形成及膜张力调节相关。 |
| ISOC1 | -0.77 | 5.87×10⁻⁴ | 代谢酶,肿瘤样本中表达降低。 |
| GNG4 | -0.64 | 1.64×10⁻³ | G 蛋白 γ 亚基,参与信号转导。 |
这些下调蛋白多属于细胞结构和代谢类,提示肿瘤组织在膜结构与代谢稳态方面发生重塑。
5. 功能注释与通路富集(基于 P < 0.01 蛋白)¶
5.1 KEGG ORA(KEGG_All_P001.csv)¶
| 通路 | 富集蛋白数 | p.adjust | 主题解读 |
|---|---|---|---|
| Phagosome | 20/215 | 3.22×10⁻⁴ | 表明吞噬与抗原处理活跃。 |
| Antigen processing and presentation | 13/215 | 3.22×10⁻⁴ | 支持免疫识别与 MHC 相关功能增强。 |
| Rheumatoid arthritis / Leishmaniasis 等免疫疾病通路 | 10/215 | ≤ 4.53×10⁻⁴ | 反映免疫网络与炎症反应的高表达。 |
5.2 GO Biological Process(GO_BP_All_P001.csv)¶
前几项富集均聚焦于免疫与淋巴细胞活动,例如:
- Lymphocyte proliferation(p.adjust = 4.19×10⁻⁴)
- Antigen processing and presentation of peptide antigen(p.adjust = 4.19×10⁻⁴)
- Leukocyte proliferation / activation 等。
这与名义显著蛋白中大量免疫标志物上调高度一致。
5.3 Hallmark GSEA(tissue_fgsea_hallmark_CA_vs_N.csv)¶
GSEA 使用整矩阵排序,得到以下显著富集结果(padj < 0.05):
| 基因集 | NES | padj | 方向 |
|---|---|---|---|
| HALLMARK_ALLOGRAFT_REJECTION | 2.08 | 2.13×10⁻³ | 上调,说明免疫识别和抗原呈递路径激活。 |
| HALLMARK_APICAL_JUNCTION | -2.37 | 1.85×10⁻² | 下调,提示细胞黏附与细胞连接分子在肿瘤组织中减少。 |
| HALLMARK_ANGIOGENESIS | -1.89 | 1.85×10⁻² | 下调,显示肿瘤与癌旁在血管生成相关蛋白上存在差异。 |
其余基因集 padj > 0.05,这里不做展开。
5.4 综合解读¶
- 免疫相关蛋白集体上调:KEGG/GO/Hallmark 均指向抗原处理、淋巴细胞增殖、同种移植排斥等免疫主题,与 MZB1、S100A8、TYMP 等名义显著蛋白一致。
- 细胞黏附与结构蛋白下调:GSEA 中 Apical Junction、Angiogenesis 等基因集向下富集,与 CAV1、CAVIN2、AKAP12 等结构蛋白下调吻合。
- 代谢与氧化还原变化:ALDH1A1、ISOC1 等代谢酶下调,提示肿瘤组织的代谢稳态与癌旁不同。
6. 可视化图解读¶
| 图表 | 位置 | 说明 |
|---|---|---|
| 01_PCA_plot.pdf | results/figures_main/ |
肿瘤与癌旁样本在主成分空间分离明显,配对样本相邻。 |
| 02_Volcano_Plot.pdf / Volcano_Plot_Enhanced.pdf | 同上 | 展示名义显著蛋白的方向和幅度。 |
| 04_Heatmap_Top50_Proteins.pdf / Heatmap_Top50_Grouped_by_Condition.pdf | 同上 | 前 50 个 P < 0.01 蛋白清晰区分两组样本,热图标注便利。 |
| KEGG/GO Dotplots & Barplots | results/pathway/ |
对应 ORA 结果,呈现富集通路的规模和显著性。 |
这些图形可直接嵌入 mkdocs 页面,帮助客户从宏观和微观两个视角理解结果。
7. 小结¶
- 在配对 limma 模型下未获得 FDR < 0.05 的蛋白,说明本批次样本的统计功效有限;但从名义显著(P < 0.01)角度仍观察到 356 个差异蛋白。
- 名义显著蛋白主要集中于免疫、炎症和分泌相关分子,上调比例占 90% 以上。
- KEGG/GO/Hallmark 注释一致显示免疫活化、抗原呈递增强以及上皮黏附结构的下调,补充了肿瘤组织微环境的分子图景。
- 这些结果可与外泌体、代谢组数据结合使用,为多组学整合与机制分析提供组织层面的佐证。
8. 交付文件索引¶
results/differential/Tumor_vs_Adjacent_complete_with_genes.csv:涵盖全部蛋白、log₂FC、P 值与 FDR。results/differential/Tumor_vs_Adjacent_FDR01.csv:P < 0.01 的蛋白清单(含折叠变化)。results/pathway/*.csv:KEGG / GO / Reactome / Hallmark 等富集结果及其图表。results/figures_main/*、results/figures_qc/*:核心与质量控制图形。results/preprocessing/normalized_expression_matrix.csv:归一化矩阵,可用于自定义二次分析。
以上内容均已与原始文件核对,可直接用于 mkdocs 网站展示。***