上周,“袁來如此”專欄就大分子生物分析方法的校準曲線的設計、生成和編輯的思考和建議展開了詳細介紹(袁來如此|大分子生物分析概論(四_上):校準曲線的設計,生成和編輯),本期將延續(xù)上期內容,重點介紹大分子生物分析方法校準曲線擬合模型和權重進行取舍的方法。
本系列文章介紹的生物分析是指定量地測定在動物和人體體液或組織中的生物藥(本文特指蛋白質類生物藥,包括單抗,細胞因子,生長素,融合蛋白等)的濃度。大多數生物分析方法都基于免疫測試方法(Immunoassays),或者更廣義地稱為,配體結合式測試方法(ligand binding assays, LBA)。這些方法涉及一系列試劑的使用,如抗藥物抗體,其它抗體,生物藥的靶標蛋白等。
配體結合式測試方法(LBA,也稱為immunoassays)是一種常用的定量分析工具。在LBA方法中,待測物濃度與響應數據之間的關系是質量作用定律驅動的非線性關系,兩個被廣泛接受和經過驗證的LBA校準曲線的回歸模型是4參數logistic(4PL)和5參數logistic(5PL)曲線擬合模型。選擇適當的回歸模型和權重函數是LBA方法開發(fā)的關鍵組成部分。
在分析方法開發(fā)期間,應對選定的模型和權重函數進行評估,并在驗證期間加以確認。關于確定或選擇適當的回歸模型和權重函數的實際操作方法,在已發(fā)表的文獻中頗為有限,本文將提出一個結構化的、有序的方案來確定兩者。
在LBA中觀察到的實驗響應是一個配體(待測物)和檢測系統中使用的特定捕獲/檢測試劑的平衡結合的結果。實驗響應與對數變換后濃度之間的這種關系是非線性的,使得典型的LBA校準曲線為全部或部分的S型(sigmoidal)。常見的非線性回歸模型為4PL和5PL,擬合模型的選擇可能由曲線的形狀所驅動。完全的 sigmoidal曲線(其中頂部和底部平臺區(qū)是鏡像)通常使用4PL 模型。部分sigmoidal曲線,即非對稱曲線,通常使用5PL模型(4PL、5PL模型詳細解讀請戳《袁來如此|大分子生物分析概論(四_上):校準曲線的設計,生成和編輯》)。
由于LBA中配體平衡結合(equilibrium binding)的特性,經常會觀察到測試響應的非恒定的方差(non-constant variance of response),這種不等同方差稱為異方差性(heteroscedasticity)。如果在曲線擬合時不考慮應對異方差性,則可能導致最終結果中出現回算錯誤和更大的偏差。為了減少異方差性的影響并提高曲線擬合的質量,必須盡量減少具有較高方差(higher variance)的校準點對曲線擬合的貢獻,廣義最小平方 (generalized least squares)和方差穩(wěn)定變換(variance stabilizing transformation)可以用來解決這個問題。這些方法要么在每個擬合迭代后更新權重函數;要么轉換數據和模型,以使用普通最小平方模型,而不使用權重函數。在已發(fā)表的方法中,線性回歸斜率方法(linear regression slope approach)可能是最實用的。本文下面討論這個方法。
大多數與 LBA測試相關的軟件為各種擬合模型和常用的權重函數(如 1/Y 或 1/Y2)提供了內置的選擇。相關監(jiān)管指南建議使用最簡單,并充分描述了待測物濃度與其響應之間關系的模型。在選擇回歸模型(加或不加權重)時,如果對曲線形狀的目視評估和對使用的統計方法進行比較,如比較F測試和chi-square p value,并不容易,其結果可能會令人困惑。這里常見的挑戰(zhàn)是如何依據相關知識,合理地選擇其中之一。
本文將介紹一組案例研究,其中采用藥代動力學定量分析方法,用于血清或血漿中蛋白生物藥的定量,以及使用通用的統計軟件來確定適當的擬合模型和權重因子。
LBA方法是評估生物藥的PK/TK時的主要定量分析方法,該方法的特異性和選擇性取決于目標待測物與其他生物分子(如受體、和針對候選生物藥的抗體)的相互作用。LBA方法中觀察到的信號/響應與生物藥的濃度間接相關。
下面的示例A、B和C都使用了LBA方法,如電化學發(fā)光(ECL)檢測平臺或比色法ELISA檢測平臺,用于定量分析血漿或血清(人或食蟹猴)中的蛋白生物藥濃度。每個案例研究中的分析方法簡述如下:
案例A:對Meso Scale Discovery(MSD)Multi-Array?微孔板,使用單克隆抗藥物抗體(5 ?g/mL)包板,過夜;之后,與含有藥物的樣品在室溫下孵育60分鐘;洗板后,結合到板上的藥物與biotinylated單克隆檢測抗體(2.5??g/mL)孵育60分鐘;然后加入0.1??g/mL 的Streptavidin-ruthenium,再孵育60分鐘;之后,MSD儀器在特定條件下檢測到來自ruthenium 的電化學發(fā)光信號。
案例B:對streptavidin 包被的MSD Multi-Array?微孔板,在室溫下,以biotinylated單克隆抗體(4mg/mL)包板60至120分鐘;隨后,含有藥物的樣品在上述微孔板上孵育90分鐘;使用小鼠抗人IgG Fc-Ruthenium(0.36mg/mL)孵育60分鐘,以結合被抗體捕獲的生物藥;之后,MSD儀器在特定條件下檢測到來自ruthenium 的電化學發(fā)光信號。
案例C:在Costar微孔板上,在4°C包被藥物靶點(4 mg/mL),過夜;與靶點結合后的生物藥,再與50 ng/mL的biotinylated單克隆抗體孵育60分鐘;之后,再與1:50,000稀釋后的avidin D-HRP 孵育60分鐘;隨后,加入HRP酶底物,TMB,以產生色度反應;然后用硫酸停止該反應,并在酶標儀Spectramax上,測量450nm的光學密度(OD)。
異方差性(Heteroscedasticity)
在采集到的實驗運行的標準校準數據集合(standard calibration data)中,可以通過觀察測試信號的標準偏差(SD)和校準點濃度之間的關系來評估異方差性。為此,分別評估了案例A、B和C在方法開發(fā)過程中獲得的6、7和10個獨立運行。
首先,使用Microsoft Excel 2010計算標準方差,其次使用 GraphPad Prizm 7 來繪制每個校準品測試信號的SD與校準點濃度的關系圖。在目視考查了SD變化的趨勢后,就可以確定對權重函數的需求。如果SD發(fā)生移動,則表明了異方差性,因此,需要使用權重函數。如果SD在校準品濃度范圍內是恒定的,則無需加權。
當在校準曲線中觀察到測試信號的標準偏差隨濃度發(fā)生變化時,就需要對更精確的數據點(具有較低SD的數據)使用權重函數來調整曲線的擬合。在 GraphPad Prizm 7 中,可以使用圖形線性回歸方法(graphical linear regression approach)計算權重函數因子如下:
步驟1. 繪制下述二者的關系圖:對數轉換后的測試信號平均值與對數轉換后的SD,對二者使用相同的對數底數(10或2)。
步驟2. 在步驟1中得到的線性回歸直線的斜率值(k)乘以2,以確定權重函數因子(weighting function factor),即2k。
為了平衡所有校準點的貢獻,在4PL或5PL曲線擬合中應用權重函數 1/Y2k(其中Y是測試信號,2k是權重因子),以盡量減少weighted sum-of-squares,從而獲得更好的準確度和精密度。
將權重函數 1/Y2k 應用于曲線擬合模型 (4PL 或 5PL)后,再使用Watson LIMS,將回算的校準點濃度插入加權擬合的曲線(假定這些校準點是未知濃度的樣本)。
如果對所有測試運行和對每個標準校準點(錨定點除外),累積%RE在±15% 之內并且累積%CV≤15%,則回歸模型是可以接受的;但對于定量下限(LLOQ)和上限(ULOQ),接受標準一般 %RE±20和累積 %CV≤20。估計的定量范圍(ROQ)是在符合上述接受標準的最低和最高標準濃度之間確定的。在 MS Excel 2010 中,累計%RE和累積%CV 分別計算為:[100 - 100 x(回算濃度的平均值/標稱濃度)]和 100 X(回算濃度的標準方差/回算濃度的平均值)。
之后,使用 GraphPad Prizm 7 繪制 4PL 和 5PL 之間準確度(累積cumulative %RE)和精密度(累積cumulative %CV)的比較圖?;貧w模型的適宜性可使用此可視化圖形工具來判斷:在可接受的范圍內包含了更多標準校準點,而且累積 %RE 和累積 %CV 較低模型,就是應該選擇的模型。如果兩種模型的效能非常相似,則可通過是否具有加權4PL來做選擇 ,因為一般遵循 Occam’s razor 原則, 即以最少的假設,發(fā)現數據和模型之間的關系。
圖1. 選擇曲線擬合模型以提高曲線性能的方法。實際工作流程描述了選擇權重函數和曲線擬合模型的每個步驟和整個過程。
本文提出了一種結構化的方法,通過選擇正確的曲線擬合模型和權重函數,以擴展 LBA分析方法的定量范圍(圖1)。該方法完全從數學的角度出發(fā),確定一條校準曲線是否需要加權重以及哪種加權方式最合理。如果收集到的數據中呈現出的異質性,則在準確度和精密度行為方面,對4PL和5PL兩個模型(以及確定的權重函數)進行比較;如果未觀察到異方差性,則對不含權重量4PL和5PL模型進行比較。以下將此原則應用于3個典型 LBA分析案例。在這3個生物藥的藥代動力學(PK)研究案例中,總共開發(fā)了3個分析方法,并觀察到3種不同形狀的校準曲線。其中,兩個分析方法(案例A和B)利用了電化學發(fā)光(ECL)平臺,而另一個分析方法(案例C)使用了比色ELISA平臺。
為了在方法開發(fā)過程中對濃度-測試信號的關系進行詳細研究,表1中描述了定量分析生物藥A、B和C濃度的3條校準曲線。在預期的定量范圍內(對數尺度上),校準點大致均勻分布。
表1. 3條PK校準曲線的特征總結
用于評估各自PK分析運行的校準曲線數據如圖2所示。在所有3個案例研究中都觀察到了典型的非線性的濃度-響應曲線。
圖2. 3個案例研究中的校準曲線:案例 A(a),案例 B(b) 和案例 C(c)。該圖展示了3條標準曲線的形狀,代表了在LBA測試中通常觀察到的典型非線性響應。X軸代表校準點濃度的對數,Y軸代表響應讀數:案例A和B是相對光單位(RLU),案例C是450 nM 光學密度(OD 450)。
圖3. 案例A(a)、案例B(b)和案例C(c)的異方差性概況。X軸代表校準點濃度的對數,Y軸代表實驗運行中測試信號的SD。
下面評估了表1中3條校準曲線上測試信號的標準偏差(SD),該SD是異方差性的直接指標。這3條校準曲線上測試信號的SD(變異性variability)不是恒定的,而是隨著校準點的濃度而改變化的(圖3)。
對于案例A,當藥物濃度超過 20 ng/mL時,其變異性急劇增加。在案例B中,SD大幅增加,直到48.3 ng/mL的濃度,并在 48.3和 250 ng/mL 之間出現下降趨勢。對于案例C ,SD 增加,一直到23.5 ng/mL的濃度,之后稍微降,直至79.3 ng/mL??傮w而言,濃度較高校準點的SD大于濃度較低校準點。校準曲線之間的非恒定 SD 模式代表示異方差性,在較高濃度下的高變異性表明需要使用加權擬合。圖1所示的決策樹指明了如何確定適當的權重因子和可以接受的擬合模型。
為了確定權重因子,首先需要從下面的線性回歸中得出斜率(k值):對數變換的測試信號SD vs 對數變的換測試信號平均值(圖4);然后,應用 1/Y2k 方程式來計算最終的權重函數。對于案例 A,B 和 C,線性回歸的斜率分別為 1.06、1.00 和 0.657。對于案例 A 和 B,由于斜率接近1.0,因此在4PL和5PL模型中使用了權重函數1/Y2 。對于 C 例,權重函數為 1/Y,由于斜率接近 0.5。在Waston LIMS中,只有 1/Y or 1/Y2這兩種權重函數可用。
圖4. 案例 A(a)、案例 B (b) 和案例 C (c)中k值的確定。案例 A、B 和 C 的斜率(k值)分別為 1.06、1.00 和 0.657。案例A、B和C的R2(確定系數coefficient of determination)分別為0.998、0.984和0.934。
為確定可以接受的曲線擬合模型,考察了如下參數:4PL和 5PL模型;權重函數:1/Y2(案例A),1/Y2(案例B)和 1/Y(案例C);比較參數:回算濃度的累積 %RE(圖5)和累積 %CV(圖6)。應當選擇在可接受的范圍內,具有較低的%CV和%RE校準點數量較多的回歸模型。如果兩者都是相當的,則應選取加權4PL作為最終的曲線擬合模型。在 Watson LIMS 中生成每次運行的回算濃度。所有情況的回算濃度的累積 %RE和 %CV計算(在曲線擬合模型確定章節(jié)的 B 部分)。圖5和圖6給出了加權4PL模型與加權5PL模型的累積 %RE和累積 %CV的比較。
如圖5所示,對于具有相應權重函數的4PL和5PL模型,所有校準點的 %RE分別:案例A, 低于4%和3%;案例 B,低于18%和16%;案例 C,低于7 和 6%。在所有案例研究中,加權4PL和加權5PL模型的準確度是相當的,對于案例 A、B 和 C,所有校準點都在可以接受的范圍內。根據準確度行為圖推斷的定量范圍(ROQ)分別為:0.317-178 ng/mL(案例A),0.602-250 ng/mL(案例B),和1.37-79.3 ng/mL(案例C)。
圖5. 準確度行為圖。對案例A(a)、案例B(b)和案例C(c)中校準曲線的加權(1/Y或者1/Y2)擬合模型進行了比較。比較模型:4PL vs 5PL;比較參數:回算濃度的累積相對誤差(%RE)。兩條虛線之間的區(qū)域是可接受范圍(± 20%)。(○)代表4PL加權擬合,(□)代表5PL加權擬合。
圖6顯示,對于加權4PL和加權5PL曲線擬合模型,所有校準點的累計%CV:案例A,低于3.0和2.9%;案例B,低于39.7%和26.3%;案例C,低于6.6%和10.8%。案例A和C對兩個擬合模型加權擬合后,所有校準點的 %CV變得相當了。對案例A和C,所有校準點的加權4PL和加權5PL的精密度也是相似的。根據精密度行為圖推斷的ROQ分別為0.317-178 ng/mL(案例A)和1.37-79.3 ng/mL(案例C)。使用加權4PL模型,與加權5PL模型相比,案例B可以接受的校準點數量從9增加到11,加權4PL模型的估算的ROQ 為 0.602-145 ng/mL,而加權5PL模型的檢測范圍較窄:0.602 - 48.3 ng/mL。根據接受標準,對于案例 A、B 和 C ,最終可以接受的曲線擬合模型都是4PL,權重函數分別為 1/Y2,1/Y2和1/Y。
圖6. 精密度行為圖:案例A(a),案例B(b)和案例C(c)比較模型:加權4PL vs 加權5PL;比較參數:回算濃度的 %CV。虛線和X軸之間的區(qū)域是可接受范圍(± 20%)。(○)代表 4PL 加權擬合,(□)代表 5PL 加權擬合。
圖7演示了對案例 A 應用上述方案后,校準曲線性能是如何改進的(此處不顯示案例B和C的圖表)。使用非加權4PL回歸模型回算濃度繪制的準確度行為圖(累積 %RE,圖7a)表明,與加權相比此模型表現出更窄的動態(tài)范圍,0.563-178 ng/mL;加權4PL模型:0.317-178 ng/mL。非加權 5PL回歸模型顯示更好的準確度:所有校準點低于20%。但是,在應用1/Y2的權重函數(在“異方差度評估”章節(jié)確定)后, 所有校準點的累積 %RE得到改善,都在±3%以內(圖7a)。
精密度行為圖(累積 %CV,圖7b)顯示,非加權4PL和5PL回歸模型的ROQ顯著狹窄:1.00-178 ng/mL;而在使用了1/Y2 的權重函數后,ROQ變?yōu)?.317-178 ng/mL。該校準曲線低端的效能的顯著改善顯示了加權擬合的力量,因其降低了高變異性的測試信號對曲線擬合的影響。案例A表明,使用適當的權重函數可以提高精密度和準確度(均低于4%)以及擴展定量范圍(0.317-178 ng/mL)。
圖7. 案例A標準曲線加權之前和之后,4PL和5PL模型的準確度和精密度行為圖。累積 %RE(圖 7a)和累計 %CV(圖7b)在模型之間的比較:4PL vs. 5PL(無權重);以及4PL vs. 5PL(權重因子:1/Y2)。
表2顯示,使用適當的權重函數可以擴展ROQ。對案例B,應用權重函數到4PL回歸模型后,ROQ得到顯著擴展;從未加權的1.04-48.3 ng/mL到 加權的0.602-145 ng/mL;加權5PL模型的ROQ,則從未加權1.04-145 ng/mL變?yōu)榧訖嗟?.602-48.3 ng/mL。對案例C,4PL模型的ROQ略有擴展:從未加權的2.06-79.3 ng/mL,到加權的1.37-79.3 ng/mL。對于5PL模型,使用權重函數后ROQ沒有增加。
本文為確定LBA定量分析方法中校準曲線的回歸模型及權重函數的選擇,提供了一個決策樹和相應的方法,目的是為了為減少異方差性(heteroscedasticity)的影響。本文的建議得到3個案例研究的支持。
由于LBA中平衡結合(equilibrium binding)的特性,實踐中經常觀察到測試響應的非恒定方差,稱為異方差性(heteroscedasticity)。本文發(fā)現線性回歸斜率方法(linear regression slope approach)是解決異方差性最實際的方法。
在方法開發(fā)過程中,可以繪制校準曲線的測試信號的標準方差(standard deviation,SD)與校準點濃度的對數的相關圖。一條校準曲線的非恒定SD趨勢表明存在異方差性,這意味著需要使用權重函數。所有的3個案例研究(A,B 和 C)都顯示,測試信號在較高藥物濃度下,具有更高的變異性,需要加權擬合校準曲線。一般而言,任何一個LBA定量分析方法,都會受益于使用權重函數。
需要注意的是,一旦確定需要權重因子,如何確定正確的權重因子則成為重中之重。本文推薦的方法是:首先,從測試信號(Y)的標準方差(對數變換后)與測試信號平均值(對數變換后)的線性回歸關系中,確定其斜率,又稱k值;然后,將斜率(k) 代入以下方程 1/Y2k 中,以確定權重因子(1/Y 或 1/Y2)。
在案例研究 A、B、C 中,線性回歸的斜率分別為 1.06,1.00 和 0.657; 因此,權重因子分別估計為2,2和1。在案例A和B中,權重因子為2; 因此,在校準曲線回歸模型(4PL或5PL)中,使用了權重函數1/Y2。對于案例C,權重系數為 1; 因此,權重函數為 1/Y。
為了確定可接受的曲線擬合模型,應評估擬合曲線的4PL與5PL模型(不加權和加權)回算濃度的累積 %RE和累積 %CV。應當選擇,在可接受的范圍內,具有較低的%CV和%RE,校準點數量較多的回歸模型。如果兩者都是相當的,則選擇加權4PL模型作為最終曲線擬合模型,進行方法驗證和樣本分析。根據 FDA 指南,應當選擇假設最少的模型,即選擇最簡單的模型。根據精密度和準確度數據,在所有3個案例中,4PL都是基于這些標準的最佳回歸模型。
為了驗證所選擇回歸模型和權重函數,可以做其他評估。例如,在使用權重函數之前和之后,可以比較4PL和5PL模型的準確度和精密度行為。本文給出了4PL與5PL(無加權和 1/Y2加權)的累積 %CV 和累積 %RE 的比較,累積 %RE的可接受范圍為± 20%,累積 %CV 的可接受范圍為≤20%。
案例A表明,使用適當的權重函數可以提高精密度和準確性(均低于10%)和擴展定量范圍(0.317-178 ng/mL)。在案例B和C中,校準曲線擬合也有改善。案例B在4PL回歸模型上加權后,ROQ得到顯著擴展:未加權時為1.04-48.3 ng/mL;加權后為 0.602-145 ng/mL;5PL模型,未加權1.04-145 ng/mL,加權后0.602-48.3 ng/mL。案例C4PL模型在加權后ROQ 略有擴展:未加權2.06-79.3 ng/mL;加權為1.37-79.3 ng/mL。
在定量 LBA 方法開發(fā)過程中,本文介紹了一個簡單、易于使用的決策樹,以確定校準曲線的最佳回歸模型和權重。所推薦的方法將選擇一個加權的曲線擬合模型。
1. 在方法開發(fā)過程中,至少需要使用3個獨立的測試運行對模型選擇進行初步評估; 但是,一般建議增加運行的數量,以便在研究前驗證時,驗證曲線擬合模型。由于對響應-誤差關系的估計存在局限性,因此不建議使用較小的數據集合;
2. 評估異方差性;
3. 如果存在異方差性,就通過斜率方法確k值(即斜率),然后計算權重因子(權重函數=1/Y2k);
4. 使用準確度(%RE)和精密度(%CV)行為來選擇和驗證更好的加權回歸模型;
5. 建議使用獨立制備的質量控制樣品(QC)來驗證分析方法的定量范圍。
本文如有疏漏和誤讀相關指南和數據的地方,請讀者評論和指正。所有引用的原始信息和資料均來自已經發(fā)表學術期刊, 官方網絡報道, 等公開渠道, 不涉及任何保密信息。參考文獻的選擇考慮到多樣化但也不可能完備。歡迎讀者提供有價值的文獻及其評估。