蛋白质组学在肿瘤生物标志物发现中的作用

探讨蛋白质组学在肿瘤生物标志物的发现，特别是癌症药物开发中所用生物标志物的发现和分析中不断演化的作用。

癌症药物开发所用生物标志物发现中的蛋白质组学

尽管基因组学已经用于生物标志物的发现很长一段时间，但是所发现基因功能的解释，需要在功能网络的背景下，借助蛋白质组学的力量进行¹。

蛋白质组学生物标志物可以提供蛋白质动态特性的关键信息，包括功能、转译后修饰、与其他生物分子的相互作用以及对环境因素的反应1。随着质谱（MS）与其他先进分析技术的发展，蛋白质组学工作流可以以生物标志物发现所需高精确度与高分辨率，对大型数据集进行分析。

蛋白分离技术

蛋白分离和分析的可靠和经验证方法，是发现蛋白生物标志物的关键。复杂蛋白或肽样本分离的 三种常用技术包括

聚丙烯酰胺凝胶电泳（PAGE）或十二烷基硫酸钠聚丙烯酰胺凝胶电泳（SDS-PAGE）
2D凝胶电泳（2D-PAGE）
高效液相色谱法（HPLC）

下面将详细讨论这些技术。

SDS-PAGE

SDS-PAGE是基于大小分离蛋白的一种常用的一维方法。首先使用变性剂处理样本，以裂解二硫键，然后使用去污剂（SDS），使样本的蛋白上均匀带净负电荷。通过施加电流，去折叠和带负电荷的蛋白，在凝胶基质（亦即聚丙烯酰胺）上迁移，其中小的蛋白阻力小迁移更快。

在电泳后，使用染料（例如Coomassie绿、SYPROTM Ruby）使凝胶着色，观察分离的蛋白，然后进行电转膜，以便进行免疫印迹研究，或者切取凝胶，以便以MS等技术进行进一步分析。

2D-PAGE

然而，对于复杂蛋白混合物的深入分析，特别是生物标志物的发现和开发，一维分离常常不足。将等电聚焦（IEF）与SDS-PAGE技术联用，可以分别通过电荷与大小分离蛋白。这种二维方法被称为“2D-PAGE”，由于一次可以分析数千种蛋白，而长期成为蛋白质组学的主流技术²。

正常情况下，根据氨基酸组成不同，蛋白携带净负电荷或者净正电荷。等电点（pI）是指蛋白质净电荷为零的pH值。可以利用这种特性，使样本通过一种既定pH梯度电泳（常常是凝胶管或凝胶条），分离蛋白混合物。

在蛋白达到其相应pI后，蛋白迁移停止，即“聚焦”在特定的pH点上。将IEF凝胶插入到传统的一维凝胶，进行SDS-PAGE的基于大小分离。通过对染色凝胶进行观察和图像分析，测量样本中蛋白的总数目，或者进行“斑点”提取，以便通过MS进行更加详细的研究。

尽管2D-PAGE已经被广泛应用，但是仍然存在局限性。例如，一些高酸性或高碱性蛋白难于分离，而低丰度蛋白则不容易检测到。

HPLC

HPLC是一种高分辨率和高重现性技术。首先使用酶（例如胰蛋白酶）消化蛋白，获得肽片段，然后与溶剂相混合，使之在高压下流动，经过内填吸附剂颗粒的色谱柱。市场上可以购买到用于蛋白和肽分析的多种色谱柱，包括针对大小、疏水性、电荷或者特定氨基酸序列等特征设计的色谱柱。

蛋白与吸附剂颗粒相互作用的差异，与从色谱柱上洗脱下来的速率变化相关。通过特定的检测器（例如吸光度检测器，如紫外或光度二极管阵列），可以采集这种数据，并将其转换为色谱图。

与2D-PAGE相比较，HPLC的敏感性显著更高，并且动态范围更宽，可以更好地进行低丰度蛋白的检测。HPLC还可以与MS联用，获得一种强大的蛋白质组学工作流。

其他有用的蛋白分离工具（尽管在此不予讨论）还包括毛细管电泳和亲和色谱。

不同类型的蛋白质组学平台

基于MS的方法

蛋白质组学与生物标志物发现严重依赖MS。有两种典型的方案：

“自下而上（bottom-up）”方案，先对完整蛋白进行酶法消化，然后使用MS对肽碎片进行表征。
在“自上而下（top-down）”方案中，由MS对完整的蛋白进行直接裂解，以获取鉴定序列数据。

尽管存在着多种MS技术和仪器，但是均包括三个主要的部分：（1）一个离子源，（2）一个质量分析仪，（3）一个离子检测系统。蛋白和肽的电离可以产生带电荷的气体离子，后者由质量分析仪基于质荷比分离。由离子检测系统精确测量质量值及其丰度，生成质谱供分析。

随着质谱仪的重大创新，出现了配备先进质量分析仪及/或探测器的现代化仪器。这些仪器包括飞行时间（TOF）质谱仪、傅里叶变换离子回旋共振（FT-ICR）质谱仪与Orbitrap质谱仪，它们均可以提供非常准确的质量分辨率³。

如上所述，基于MS的技术还可以与不同的技术相耦联，例如电泳与HPLC。这些联用可以提供一种协同方案，用于特别复杂的蛋白混合物，对于这种混合物的分析，单独应用其中任何一种技术均不足够。

表面增强激光解吸/电离飞行时间质谱（SELDI TOF-MS），也称为“ProteinChip®技术”，是生物标志物发现中广泛应用的另外一种联用方案⁴。这种高通量的技术利用有独特色谱表面的芯片，基于物理和化学特性（疏水性、亲水性、酸性、碱性、表面亲合性）分离蛋白。首先经过一个洗涤步骤以去除污染物与未结合的蛋白，然后使用吸能基质使样本结晶，再使用TOF-MS分析。

SELDI TOF-MS拥有使其成为生物标志物发现中一种有用工具的一系列特征。例如，它需要的样本量较少，并且可以容易地对一些粗样本进行分析，例如活检组织和体液。另外，对于低分子量蛋白的检测，这种技术也拥有高敏感性。因此，它可以发现其他方法遗漏的生物标志物。

尽管SELDI TOF-MS技术存在一些公认的挑战（这些挑战大多与实验设计差有关）⁵，但是通过这种技术，已经在多种癌症类型中，发现了多种潜在的生物标志物。例如，在近期一项研究中，使用SELDI TOF-MS对血清进行谱分析，发现了一小组蛋白，这组蛋白可以将乳腺癌患者与健康对照（包括良性乳腺疾病）相鉴别⁶。

基于亲和试剂阵列的方法

尽管在蛋白生物标志物发现领域中，基于MS的方法占主导，但是也出现了一些替代性策略，并获得了推广。例如，蛋白、抗体与组织微阵列（TMA）方法是进行蛋白检测和定量的高敏感靶向方案，并且具有多路复用（达 5000-路）能力，可以自动进行高通量样本分析。尽管在发现过程中，预定义靶点引入了一定水平的偏倚，但是基于亲和试剂阵列的方法，具有在不同的样本类型（例如组织、血浆、细胞系、生物液体/实体）中，对一些经验证疾病生物标志物进行监测的强大临床潜力。

已经出现了多种亲和试剂，为临床场景下生物标志物发现与开发提供支持。这些亲和试剂包括抗体（如O-link、Myriad、Kiloplex1000）与基于核酸的适配体（如Somascan）⁷。在这些阵列中，对蛋白水平进行定量的方法包括了传统免疫分析方案中使用的方法，以至更加先进的基于阵列平台的统计分析。

蛋白微阵列主要有两种类型：

正相蛋白阵列（FPPA）
反相蛋白阵列（RPPA）

在FPPA（通常是指“抗体阵列”）中，将大量的针对不同蛋白靶点的亲和试剂（抗体），固定在玻璃阵列玻片上。将被试样本（例如裂解液、体液）铺在阵列上，然后通过标志二级抗体，对结合蛋白进行检测⁸。

在RPPA中，将被试样本点在玻璃阵列玻片上，然后将每个阵列与特定抗体相孵育。使用这类蛋白微阵列，可以在一次测试中，测量大量样本中的一种蛋白，这对于癌症生物标志物发现与开发来说是重要的。还可以将来自同一裂解液的样本点在不同的阵列上，然后将这些阵列与不同的抗体相孵育，从而实现多路复用功能⁸。

与FPPA相比较，RPPA常常是首选，因为后者的信号检测仅需要一种抗体。另外，还可以在同一阵列玻片上，采用系列稀释的被试样本，对信号进行优化，以与分析的动态范围相拟合。这是重要的，因为抗体亲和力受蛋白浓度的影响⁹。

在临床上，RPPA平台已经展现出希望，特别是在与激光捕获微切割技术相联用，以评估不同的肿瘤细胞群时。例如，能够测量HER2受体、相关家族成员（EGFR和HER3）以及下游信号分子的总蛋白与磷酸化（活化）水平的RPPA，可以发现对pan-HER小分子抑制剂有应答的新患者亚组¹⁰。

基于抗体与亲和性的MS方法

基于抗体的蛋白质组学技术还可以与MS方法联用，实现兼具免疫分析和MS优势并且可以高灵敏度对大量蛋白进行快速分析的工作流。这些技术的例子包括抗体富集的选择反应检测（SRM）与亲和MS¹¹。

亲和柱固定抗体的肽富集与MS的联用，为生物标志物的发现，带来了很大的希望，特别是对于一些复杂的样本，例如内含浓度动态范围大的数千种蛋白的血清。例如，这种方案已被用于开发可以预测乳腺癌患者他莫昔芬耐药性的检测方法⁶。

尽管基于亲合性的阵列具有一些已发现优势，但是这种技术也存在一些挑战。例如，所产生数据完全依赖于可用抗体。在生物标志物发现的靶向方案中，该问题仍然是一个大问题，因为开发和验证这些试剂，不是一件小事。大多数基于亲和阵列的平台，仅包括数百种抗体，用于总或修饰蛋白水平的检测⁹。因为抗体的特异性不确定，对已经复杂的数据进行解释有困难，影响广泛临床使用的信心。

生物信息学

随着“～组学”技术的发展，大型数据集正以不断加速的步伐产生。随着蛋白质组学技术的持续发展与延伸，一些库和资源（例如ProteomXchange、PRIDE、GPMdb、neXtProt、ProteomDb、Human Protein Atlas、PeptideAtlas、SRMAtlas、HPP Browser和MissingProteinPedia），将在生物标志物发现的促进中，越加扮演重要作用¹²。

已经开发出了一些新的计算工具，以减轻大量的现有的蛋白质组学相关文献的挖掘负担，为复杂MS实验的优化提供支持，或者提供急需的大型数据库处理能力¹²。

在生物标志物研究与发现的特定生物信息学方法方面，也做出了大量的工作。这些方向包括处理高维数据集的先进统计工具，以临床数据训练和验证潜在生物标志物的算法，以及将多种生物标志物类型和既往认识相整合的方法¹³。

未来的蛋白质组学平台技术

随着用于靶点定量的经验证和高特异抗体增多，基于亲合性的蛋白质组学平台将继续发展。另外，可以鉴别一种蛋白不同蛋白质变体的更完善亲合试剂的开发，将可以进一步推进该技术在生物标志物发现中的应用 ³。

对于基于MS的蛋白质组学平台来说，因为混杂离子造成噪音，低丰度肽的检测常常是一种挑战。潜在的解决方案是通过离子迁移谱进行气相分段。高场非对称波形离子迁移系统已被证实可以进行肽离子的气相分离，获得多电荷簇的富集，从而可以对蛋白质组进行更全面分析¹⁴。

毛细管电泳（CE）-MS是HPLC-MS之外的一种肽分析替代和补充策略。因为所需样本量少，并且具有高可重现性，该技术常用于临床研究或患者评估中。这种技术还可以检测亲水肽¹⁵。CE-MS已被用于癌症生物标志物的发现，特别是在尿液的谱分析中。例如，在多种癌症类型中，发现了一组193种肽，这些肽被这些癌症类型所共有，有可能作为一般原发或复发肿瘤标志物使用¹⁶。

还使用基于MS的方法，对CE进行了优化，以对中质量范围的蛋白进行有效的分析¹⁷，并进行微尺度的多维分段（如基于动态pH-界面的CE），以将覆盖率改善至与2D-LC-CE-MS/MS相似的程度¹⁸。

尽管CE-MS在生物标志物的发现中有用，但是这种技术尚未被广泛采用。至少原因是在蛋白质组学领域中，对LC-MS更加熟悉，并且引入新的CE设备，将带来相关成本。

结论

癌症生物标志物是发现和开发新型癌症疗法的关键。它们也是临床实践中的关键要素，可用于风险评估、诊断、预后以及确定治疗效果、安全性及/或复发等环节。

肿瘤生物标志物发现中的蛋白质组学技术正处于不断发展变化中。过去一些年，MS、基于抗体和亲合性方法等技术快速发展，开启了癌症早期发现和个体化治疗策略可用生物标志物的开发之路。然而，将候选生物标志物有效和快速地从实验室转化到临床，仍然是一种挑战。克服这些挑战，需要多学科协作，获取不同领域的支持，采取多组学方法，这样转化成功概率才大。

蛋白质组学在肿瘤生物标志物发现中的作用

癌症药物开发所用生物标志物发现中的蛋白质组学