StatModeling Memorandum

StatModeling Memorandum

StanとRとPythonでベイズ統計モデリングします. たまに書評.

統計モデリングで癌の5年生存率データから良い病院を探す

概要


2017891885



調



f:id:StatModeling:20201106161444p:plain




th0.5602.5II

=== 2018.2.6  ===

60II5602.5501.5


MCMC

f:id:StatModeling:20201106161448p:plain
best10

 best10


f:id:StatModeling:20201106161456p:plain
MCMC80%

4.C22

1

 best10


f:id:StatModeling:20201106161452p:plain


11

=== 2018.12.8  ===

調


f:id:StatModeling:20201106161441p:plain
80%_10Odds ratio0.510/0.5_0.10.1



f:id:StatModeling:20201106161437p:plain









worst10


  pdf580RRtabulizer使


188511

f:id:StatModeling:20201106161605p:plain
110-






: _100-91=9

: (100.0 - (%))*





: 508018(10,8), (9,9), (10,8)3StanR (Wonderful R)7.811II3



使


使95%100%5*1


5050


使

f:id:StatModeling:20201106161511p:plain
f:id:StatModeling:20201106161515p:plain
f:id:StatModeling:20201106161518p:plain
f:id:StatModeling:20201106161523p:plain
f:id:StatModeling:20201106161526p:plain
f:id:StatModeling:20201106161530p:plain
f:id:StatModeling:20201106161534p:plain
f:id:StatModeling:20201106161537p:plain
f:id:StatModeling:20201106161541p:plain
f:id:StatModeling:20201106161545p:plain
f:id:StatModeling:20201106161549p:plain
f:id:StatModeling:20201106161554p:plain
f:id:StatModeling:20201106161557p:plain
f:id:StatModeling:20201106161602p:plain
inv_logit


 t: tissue T T=5

 h: hospital H50 H=183

 Surv: 

 N: 

 Ope: 

 Age: 

 Stage: 

 Male: 

 SC: 

 Cutoff_{age}:  \mu_{age}0.5, 0.6, 0.7, 0.85 p_{age}

 Cutoff_{stage}:  \mu_{stage}0.2, 0.3, 0.44 p_{stage}


使

StanR


 p_{surv}: 

 p_{ope}: 

 q_{male}: 

 q_{SC}: 

 \mu_{age}:  t,  h*2

 \mu_{stage}:  t,  h*3

 p_{age}: 

 p_{stage}: 

 r_{surv}: 

 r_{ope}: 

 b,  a: 

 \sigma_{r_{surv}}: 

 \sigma_{r_{ope}}: 


 r_{surv} r_{ope}MCMC

80%

f:id:StatModeling:20201106161503p:plain
80%

f:id:StatModeling:20201106161508p:plain
80%

f:id:StatModeling:20201106161459p:plain
 t,  h


@Med_KU@happyningen





*1:打ち切りがある場合は5年後生存数を正確に得ることはできませんが、生存状況把握割合が非常に高いので、打ち切りに含まれる生存数を「打ち切り数*既知の生存数/対象数」で近似的に算出しました。

*2:本来は患者の年齢と生存か否かが結び付けれればさらに良い解析ができますが、現段階の情報ではこうやって多少強引に平均年齢を算出する他なさそうです。年代の人数は割と山型の分布なので、これで良さそうです。

*3:年代と同様です。しかし、癌種によっては「ステージIとIVは多いけどIIとIIIは少ない」ということがあり、進行度を要約するために平均+正規分布を使うのではなく、他の指標と分布を使った方がよいかもしれません。検討の余地があります。