survivalパッケージのサンプルデータセットflchain (free light chain)は、The Olmsted County MGUS prevalence cohortに登録された米国の一般住民において血清遊離軽鎖レベルと全死亡の関連を報告した下記の論文で使用されたデータセットの一部です。

Dispenzieri A, et al. Use of Nonclonal Serum Immunoglobulin Free Light Chains to Predict Overall Survival in the General Population. Mayo Clin Proc. 2012; 87(6): 517–523.
https://doi.org/10.1016/j.mayocp.2012.03.009

Research Question

下記のresearch quetionをテーマにした研究論文を、EZRを利用してflchainデータセットから作成してみましょう。

  • 研究デザイン:コホート研究
  • 対象:The Olmsted County MGUS prevalence cohortの登録者の一部
  • 暴露因子&比較因子:free light chainの四分位 (flc4)
  • アウトカム:全死亡
  • 共変量(補正因子):年齢、性別、MGUS
  • 統計解析:多変量補正Cox比例ハザードモデル

flchainデータセットのEZRへの読み込みとflc4変数の作成方法については下記ページを参照して下さい。

追跡期間とアウトカム発症数を集計する

コホート研究では、患者背景の表に続いて、アウトカム関連情報の表を示します。

遊離軽鎖, mg/dL0.090-2.2102.212-2.7902.791-3.5603.560-43.00
追跡期間, 年12.5 (10.4-13.2)12.2 (9.3-13.1)11.7 (7.9-13.1)9.0 (4.4-12.5)
死亡数, 人(%)311 (15.7)369 (18.8)543 (27.5)946 (48.2)
非補正HR (95%信頼区間)1.00 (reference)1.25 (1.07, 1.45)*1.94 (1.69, 2.23)*4.25 (3.73, 4.82)*
補正HR (95%信頼区間)1.00 (reference)1.12 (0.97, 1.31)1.36 (1.18, 1.57)*2.01 (1.76, 2.30)*
*P <0.05; 中央値 (25%-75%)

遊離軽鎖4分位別の追跡期間の中央値(25%, 75%)を算出しましょう。追跡期間futimeの単位は日なので、年に変換した変数futime.yrを作成し、その分布を確認します。

EZRメニューのアクティブデータセット > 変数の操作 > 計算式を入力して新たな変数を作成する を選択します。

  1. 「新しい変数名」に”futime.yr”を入力します。
  2. 「計算式」に”futime/365.25″を入力します。
  3. OKボタンをクリックします。

遊離軽鎖4分位別のfutime.yrの中央値(25%, 75%)を集計しましょう。

EZRメニューの統計解析 > 連続変数の解析 > 連続変数の要約 を選択します。

  1. 「変数(1つ以上選択)」から”futime.yr”を選択します。
  2. 「平均」と「標準偏差」のチェックを外すと、出力結果が短くなります。
  3. 「層別して要約…」ボタンをクリックします。「層別変数(1つ選択)」から”flc4″を選択して、OKボタンをクリックします。
  4. OKボタンをクリックします。

遊離軽鎖4分位別の追跡期間(年)の中央値(25%, 75%)が算出できました。

           0%       25%       50%      75%     100%    n
1 0.002737851 10.387406 12.479124 13.24298 14.20123 1978
2 0.002737851  9.328542 12.156057 13.14168 14.14374 1962
3 0.002737851  7.854894 11.657769 13.06229 14.15743 1971
4 0.000000000  4.417522  8.982888 12.47502 14.27789 1963

続いて、遊離軽鎖4分位別の死亡数を集計します。

EZRメニューの統計解析 > 名義変数の解析 > 分割表の作成と群間の比率(Fisherの正確検定) を選択します。

  1. 「行の選択(1つ以上選択」から”death”を選択します。
  2. 「列の選択(1つ選択)」から”flc4″を選択します。
  3. OKボタンをクリックする。

遊離軽鎖4分位別の死亡数、死亡率が表示されます。

flc4
death    1    2    3    4
    0 1667 1593 1428 1017
    1  311  369  543  946

> colPercents(.Table) # 列のパーセント表示
       flc4
death        1      2      3      4
  0       84.3   81.2   72.5   51.8
  1       15.7   18.8   27.5   48.2
  Total  100.0  100.0  100.0  100.0
  Count 1978.0 1962.0 1971.0 1963.0

Cox比例ハザードモデルを作成する

Cox比例ハザードモデルを作成し、ハザード比(95%信頼区間)を算出します。

まずは共変量による補正をしない単変量Cox比例ハザードモデルを作成します。

EZRメニューの統計解析 > 生存期間の解析 > 生存期間に対する多変量解析(Cox比例ハザード回帰) を選択します。

  1. 時間に”futime”(”futime.yr”でもOK)を入力します。
  2. イベントに”death”を入力します。
  3. 説明変数に”flc4″を入力します。
  4. OKボタンをクリックします。

第1分位に対する第2-4分位の無補正ハザード比(95%信頼区間)が算出されます。

     Hazard ratio Lower 95%CI Upper 95%CI    p.value
flc4[T.2]        1.248       1.074       1.452  3.941e-03
flc4[T.3]        1.942       1.689       2.232  1.065e-20
flc4[T.4]        4.246       3.734       4.828 5.913e-108

今度は、年齢、性別、MGUSで補正した多変量Cox比例ハザードモデルを作成します。

  1. 時間に”futime”(”futime.yr”でもOK)を入力します。
  2. イベントに”death”を入力します。
  3. 説明変数に”flc4″、”age”、”sex”、”mgus”を入力します。
  4. OKボタンをクリックします。

多変量補正ハザード比(95%信頼区間)が算出されます。単変量モデルと比較して、多変量モデルではハザード比が大幅に低下しています。年齢、性別、MGUSによる交絡が強いことを示唆する結果です。

     ハザード比 95%信頼区間下限 95%信頼区間上限       P値
flc4[T.2]      1.124          0.9655           1.309 1.318e-01
flc4[T.3]      1.362          1.1820           1.569 2.016e-05
flc4[T.4]      2.009          1.7560           2.299 3.565e-24
age            1.109          1.1040           1.114 0.000e+00
sex[T.M]       1.389          1.2740           1.514 1.024e-13
mgus           1.033          0.6268           1.701 8.999e-01