跳转至

子宫内膜癌石蜡组织蛋白质组学分析(2025 年 10 月版)

出品:一诺一康生物医药科技有限公司 · 生物信息团队
数据版本:2025-10-21(仅包含经复核的基础分析结果)
主要依据:客户报告_石蜡组织蛋白质组学完整分析_最终版v2.docxresults/* 目录下的差异、通路与可视化文件


1. 项目背景与样本设计

  • 研究对象:P53 突变型子宫内膜癌患者肿瘤组织(Tumor, CA)与配对癌旁组织(Adjacent, N)。
  • 样本规模:44 份 FFPE 组织数据(22 肿瘤 + 22 癌旁),其中 20 对配对样本用于配对差异分析,其余单侧样本保留在预处理矩阵中(sample_metadata_correct.csv)。
  • 蛋白规模:保留 5,737 个蛋白(expression_matrix_with_genes.csv),每个样本鉴定蛋白数超过 5,500 个。
  • 分析目标:识别肿瘤与癌旁组织之间的蛋白表达差异、总结主要功能通路变化,并为多组学整合提供组织层面的证据。

2. 数据处理与质量评估

2.1 预处理概要

  • 矩阵构建:以 Spectronaut 输出为基础,对 44 个样本生成带基因注释的表达矩阵(expression_matrix_with_genes.csv)。
  • 归一化:所有样本经 log₂ 转换与中位数归一化(normalized_expression_matrix.csv),保证强度分布可比。
  • 缺失处理:沿用项目既定的覆盖率过滤与保守填补策略,确保进入 limma 模型的蛋白在大多数样本中有可用信号。
  • 配对信息sample_metadata_correct.csv 标注 patient_id,共 20 个完整配对;差异分析将 patient 作为阻断因子建模。

2.2 质量控制图(results/figures_qc/

图表 结论摘要
01_missing_value_heatmap.pdf 样本间缺失模式均匀,无异常样本。
02_raw_intensity_distribution.pdf / 03_normalized_intensity_distribution.pdf 归一化后箱线图和密度曲线对齐,消除批次差异。
04_sample_correlation_heatmap.pdf 肿瘤与癌旁样本相关性均高(r > 0.9),配对样本之间保持较强一致性。
P_value_distribution_histogram.pdf P 值在 0 附近富集,提示真实差异信号存在。
LogFC_distribution.pdf log₂FC 分布右偏,说明肿瘤样本存在较多上调蛋白。

这些结果表明数据质量满足后续统计分析需求。


3. 统计分析与显著性概览

3.1 模型设置

  • 方法:limma 配对线性模型(对 20 对配对样本拟合)。
  • 比较:肿瘤 vs 癌旁(CA_vs_N)单一对比。
  • 显著性
  • 在 FDR < 0.05 条件下未检出蛋白(最小 FDR ≈ 0.158)。
  • 在名义标准 P < 0.01 下共获得 356 个蛋白(上调 323、下调 33),作为后续描述的基础集合。

详细结果见 Tumor_vs_Adjacent_complete_with_genes.csv
P < 0.01 蛋白清单可通过筛选 P.Value 字段获得。

3.2 差异规模与方向

  • P < 0.01:356 个蛋白;其中 90% 以上在肿瘤组织中上调。
  • 倍数变化:log₂FC 绝对值主要集中在 0.6–1.2(约 1.5–2.3 倍)。
  • 代表性结果
  • 上调:MZB1、S100A8、TYMP、MUC1、SDC1、EZR 等。
  • 下调:ALDH1A1、CAV1、CAVIN2、ISOC1、AKAP12、GNG4 等。
  • 可视化
  • 02_Volcano_Plot.pdf 显示肿瘤样本总体位于右侧(上调为主),蓝色点稀少。
  • 04_Heatmap_Top50_Proteins.pdf 展示前 50 个名义显著蛋白的表达模式,肿瘤与癌旁样本分组清晰。

4. 名义显著蛋白的生物学特征

以下解读均基于 P < 0.01 的 356 个蛋白,需注意这些结果未通过 FDR 校正。

4.1 上调蛋白(P < 0.01)

基因 log₂FC P 值 备注
MZB1 1.17 4.45×10⁻⁴ B 细胞/浆细胞分泌相关蛋白,提示免疫细胞活跃。
S100A8 1.17 9.12×10⁻³ 炎症相关钙结合蛋白,与髓系反应相关。
TYMP 0.91 5.09×10⁻⁴ 胸苷磷酸化酶,参与血管生成和核苷代谢。
MUC1 0.82 1.36×10⁻³ 膜黏蛋白,常见于上皮肿瘤标志。
SDC1 (CD138) 0.79 8.09×10⁻³ 细胞外基质受体,与肿瘤微环境和黏附调节相关。

整体趋势指向免疫细胞浸润增强、分泌通路激活以及上皮黏附蛋白的重塑。

4.2 下调蛋白(P < 0.01)

基因 log₂FC P 值 备注
ALDH1A1 -0.96 5.72×10⁻³ 醛脱氢酶家族成员,参与氧化还原与代谢。
CAV1 -0.85 9.25×10⁻³ 雞蛋白家族,与 caveolae 结构相关。
CAVIN2 -0.85 8.64×10⁻³ 与 caveolae 形成及膜张力调节相关。
ISOC1 -0.77 5.87×10⁻⁴ 代谢酶,肿瘤样本中表达降低。
GNG4 -0.64 1.64×10⁻³ G 蛋白 γ 亚基,参与信号转导。

这些下调蛋白多属于细胞结构和代谢类,提示肿瘤组织在膜结构与代谢稳态方面发生重塑。


5. 功能注释与通路富集(基于 P < 0.01 蛋白)

5.1 KEGG ORA(KEGG_All_P001.csv

通路 富集蛋白数 p.adjust 主题解读
Phagosome 20/215 3.22×10⁻⁴ 表明吞噬与抗原处理活跃。
Antigen processing and presentation 13/215 3.22×10⁻⁴ 支持免疫识别与 MHC 相关功能增强。
Rheumatoid arthritis / Leishmaniasis 等免疫疾病通路 10/215 ≤ 4.53×10⁻⁴ 反映免疫网络与炎症反应的高表达。

5.2 GO Biological Process(GO_BP_All_P001.csv

前几项富集均聚焦于免疫与淋巴细胞活动,例如:

  • Lymphocyte proliferation(p.adjust = 4.19×10⁻⁴)
  • Antigen processing and presentation of peptide antigen(p.adjust = 4.19×10⁻⁴)
  • Leukocyte proliferation / activation 等。

这与名义显著蛋白中大量免疫标志物上调高度一致。

5.3 Hallmark GSEA(tissue_fgsea_hallmark_CA_vs_N.csv

GSEA 使用整矩阵排序,得到以下显著富集结果(padj < 0.05):

基因集 NES padj 方向
HALLMARK_ALLOGRAFT_REJECTION 2.08 2.13×10⁻³ 上调,说明免疫识别和抗原呈递路径激活。
HALLMARK_APICAL_JUNCTION -2.37 1.85×10⁻² 下调,提示细胞黏附与细胞连接分子在肿瘤组织中减少。
HALLMARK_ANGIOGENESIS -1.89 1.85×10⁻² 下调,显示肿瘤与癌旁在血管生成相关蛋白上存在差异。

其余基因集 padj > 0.05,这里不做展开。

5.4 综合解读

  • 免疫相关蛋白集体上调:KEGG/GO/Hallmark 均指向抗原处理、淋巴细胞增殖、同种移植排斥等免疫主题,与 MZB1、S100A8、TYMP 等名义显著蛋白一致。
  • 细胞黏附与结构蛋白下调:GSEA 中 Apical Junction、Angiogenesis 等基因集向下富集,与 CAV1、CAVIN2、AKAP12 等结构蛋白下调吻合。
  • 代谢与氧化还原变化:ALDH1A1、ISOC1 等代谢酶下调,提示肿瘤组织的代谢稳态与癌旁不同。

6. 可视化图解读

图表 位置 说明
01_PCA_plot.pdf results/figures_main/ 肿瘤与癌旁样本在主成分空间分离明显,配对样本相邻。
02_Volcano_Plot.pdf / Volcano_Plot_Enhanced.pdf 同上 展示名义显著蛋白的方向和幅度。
04_Heatmap_Top50_Proteins.pdf / Heatmap_Top50_Grouped_by_Condition.pdf 同上 前 50 个 P < 0.01 蛋白清晰区分两组样本,热图标注便利。
KEGG/GO Dotplots & Barplots results/pathway/ 对应 ORA 结果,呈现富集通路的规模和显著性。

这些图形可直接嵌入 mkdocs 页面,帮助客户从宏观和微观两个视角理解结果。


7. 小结

  1. 在配对 limma 模型下未获得 FDR < 0.05 的蛋白,说明本批次样本的统计功效有限;但从名义显著(P < 0.01)角度仍观察到 356 个差异蛋白。
  2. 名义显著蛋白主要集中于免疫、炎症和分泌相关分子,上调比例占 90% 以上。
  3. KEGG/GO/Hallmark 注释一致显示免疫活化、抗原呈递增强以及上皮黏附结构的下调,补充了肿瘤组织微环境的分子图景。
  4. 这些结果可与外泌体、代谢组数据结合使用,为多组学整合与机制分析提供组织层面的佐证。

8. 交付文件索引

  • results/differential/Tumor_vs_Adjacent_complete_with_genes.csv:涵盖全部蛋白、log₂FC、P 值与 FDR。
  • results/differential/Tumor_vs_Adjacent_FDR01.csv:P < 0.01 的蛋白清单(含折叠变化)。
  • results/pathway/*.csv:KEGG / GO / Reactome / Hallmark 等富集结果及其图表。
  • results/figures_main/*results/figures_qc/*:核心与质量控制图形。
  • results/preprocessing/normalized_expression_matrix.csv:归一化矩阵,可用于自定义二次分析。

以上内容均已与原始文件核对,可直接用于 mkdocs 网站展示。***