跳至正文内容

框架与方法 · 发布于 2026年6月28日 · 8 分钟阅读

如何读懂研究用多肽的分析证书 (CoA) 与为何其决定可重复性

分析证书 (Certificate of Analysis, CoA) 是把具体一瓶多肽与其背后数据连接起来的文件。它不是营销话术,也不是装饰性的标签,而是某一批次的分析记录,包含 HPLC 纯度、质谱观测质量、合成日期与储存条件。读懂一份 CoA,是可重复实验与无人能复现结果之间的分界。本指南梳理真正重要的字段、如何仅凭文件验证身份与纯度,以及为什么在 2026 年,论文方法部分应当紧随供应商名称之后写明 LOT 号。

Frasco de vidrio editorial — certificado de análisis (CoA) en péptidos de investigación

CoA 究竟是什么,以及它不是什么

CoA 是一份技术文件,报告某一批合成多肽的质量控制结果。它由制造商出具,在更严格的情境下,由独立的第三方实验室出具。其最小信息单位是批次 (LOT)。同一种多肽在不同周次合成的两瓶产品属于不同批次,需要分别对应不同的 CoA。一份适用于该产品 “任何瓶” 的通用 CoA 并不是真正的 CoA,而是一份产品说明书。

最常见的误读,是把 CoA 当作二元的质量印章 (“有 CoA / 没 CoA”)。在实际工作中,这份文件的价值取决于具体数字:此批次报告的 HPLC 纯度是多少、质谱仪观测到的质量是多少、报告是否有责任分析师签名。一份没有可追溯批次、没有附带色谱图、没有签名的 CoA,证据力非常有限。

对于准备发表的研究者,CoA 还承担取证功能。如果半年后审稿人质疑 HaCaT 实验为何无法复现,所用批次的 CoA 是排除杂质引入变异的第一份证据。没有这份文件,可追溯性会在最起始的一环断裂。

真正重要的字段

一份合格的 CoA 有一组不可省略的核心字段:多肽名称与单字母氨基酸序列 (例如 GHK 写作 H-Gly-His-Lys-OH);批号与合成日期;由序列计算得到的理论分子量,以及由质谱测得的观测分子量;HPLC (高效液相色谱) 纯度百分比,并注明检测波长 (通常为 UV 214 或 220 nm,这是多肽键的吸收区);推荐储存条件;有效期或复检日期。

可选但值得具备的字段:声明的反离子 (乙酸盐、TFA);相关时的含水量;用于敏感细胞培养时的内毒素结果。一个关键提醒:反离子会改变瓶中干粉的真实质量。标注为 “乙酸盐形式” 的多肽,其重量可能有 5–15% 来自乙酸根,这会直接影响摩尔浓度计算。

值得多看两遍的字段是附带的 HPLC 色谱图本身,而不仅仅是那个纯度数字。同样是 98%,可能是一个紧邻的大杂质峰 (结构相近,难以分离),也可能是一系列分散的小峰 (混合物)。对于敏感实验,色谱图的形态与那个百分数同样重要。

通过观测质量验证身份

身份验证通过比较理论分子量 (由序列计算) 与质谱观测分子量来完成,通常使用 ESI-MS (电喷雾电离质谱) 或 MALDI-TOF (基质辅助激光解吸电离飞行时间质谱)。在高分辨率仪器上,理论值与观测值的差异小于 0.1 Da 即视为身份吻合;在低分辨率仪器上,经典容差为 ±1 Da。

一个容易让初入门研究者困惑的技术细节:谱图上显示的质量通常是质子化的分子离子 [M+H]+ 或多电荷离子 [M+nH]n+,而不是中性质量。CoA 应当报告已解卷积后的中性质量,但仍值得查看附带的谱图。若主离子吻合、同位素分布符合分子式预期,身份即得到确认。若出现 +16 Da (甲硫氨酸氧化)、+22 Da (钠加合物) 或 −18 Da (脱水) 等邻近信号,这些信息单纯的纯度数字未必能反映。

对于较大的多肽 (>30 个氨基酸) 或不稳定的修饰,MALDI-TOF 通常信号更清晰;对于中小型多肽,ESI 是行业标准。两种方法都可接受,前提是观测质量在容差范围内,且所用方法在 CoA 上明确声明。

HPLC 纯度:百分数意味着什么,不意味着什么

反相 HPLC 纯度的计算方式,是将目标多肽峰的面积除以色谱图中全部峰的总面积,再以百分比表示。标准检测波长是 UV 214 nm,此处多肽骨架的酰胺键有吸收,响应与各物种的多肽质量大致成正比。

98% 纯度的含义是:在 UV 可检测到的多肽物质中,98% 对应目标产物。它不衡量盐分,不衡量残余水分,也不衡量内毒素。因此一份 HPLC 纯度 99% 的多肽,完全可以同时含有 10% 的乙酸根反离子——这是两个独立维度。对于临床前研究,可辩护的做法是使用 ≥98% 纯度;在对结构性杂质特别敏感的实验中 (竞争结合实验、酶动力学实验),目标应为 ≥99%。

1–2% 的杂质听起来微不足道,但若那是一个对同一靶点仍保留部分亲和力的截短变体,它对结果的污染会被显著放大。除了那个总体数字,还要关注所报告的杂质是随机的 (合成噪声) 还是系统性的 (始终是同一个邻近峰),后者提示这是合成过程中可重复出现的副产物。

批号、签名,以及为何 LOT 应出现在 “方法” 部分

由责任分析师或实验室质量控制负责人签字的 CoA,与一份自动生成的 PDF 在文件效力上存在差别。签名意味着一名具名个人为所报告的数据负责;在审计、复核或纠纷中,这种区别是有意义的。受 ICH Q6B 启发的国际良好实践,把这条责任链视作质量体系的一部分,而非行政细节。

为保证可重复性,规则非常简单:在任何论文或预印本的方法部分,批号都应当与多肽名称、供应商一同出现。“GHK-Cu 购自 X 供应商,LOT 240315,HPLC 纯度 99.2%,经 ESI-MS 确认身份” 是可被复现的信息。“购自 X 供应商的 GHK-Cu” 则不是——后续批次的纯度、反离子或系统性杂质特征都可能不同。

这一做法在多肽研究文献中目前仍未普及,这正是不可重复性的一个安静成因。报告 LOT 不是官僚式的形式主义,而是另一家实验室能否真正确认你结论的分水岭,也是期刊与预印本平台越来越重视的方法透明度要素。

CoA 不覆盖的事项

界定文件的覆盖范围同样重要。CoA 报告的是多肽在合成后分析时刻的状态。它不证明运输后产品的完整性、运输过程中的保存条件,也不证明复溶后的行为。冷链、冻融循环、紫外光照与湿度暴露都发生在 CoA 出具之后,属于终端使用者的责任。

CoA 也不覆盖与实验体系本身的相互作用。一种纯度 99.5% 的多肽,仍可能因为在纳摩尔浓度下被塑料壁吸附、因为游离甲硫氨酸或半胱氨酸而被氧化、或在不合适的溶剂中聚集而失活。这些是实验设计变量,而非批次缺陷。

最后,任何 CoA 都不能把研究用多肽变成临床产品。这类材料仅供研究使用 (Research Use Only)。本文中涉及的任何生物学描述,均指向临床前文献中报告的体外或动物模型观察,而非任何人类使用建议。

要点摘要

  • 真正的 CoA 是批次特异的:包含 LOT 号、合成日期、附色谱图的 HPLC 纯度,以及与理论值对比的质谱观测质量。
  • 98–99% 的 HPLC 纯度衡量的是多肽相对含量,而非总干重:反离子 (乙酸根、TFA) 可占干粉 5–15%,直接影响摩尔计算。
  • 身份在观测质量与理论值差异不超过 0.1 Da (高分辨率) 或 1 Da (低分辨率) 时得到确认,理想情况下附 ESI 或 MALDI 谱图。
  • 在任何论文方法部分注明多肽 LOT 号,是其他实验室能够真正复现工作的最低实践标准。
  • CoA 不证明出货后的条件:复溶稳定性与冷链完整性是终端实验室的责任。

本文描述的是科学文献中已发表的发现。所引产品仅供科学与实验室研究使用,不构成任何医疗建议或治疗主张。