So-net無料ブログ作成
Statistics ブログトップ
前の10件 | -

統計の本 [Statistics]

わかりやすい本、たいせつだ。
後輩さんに薦められた、わかりやすい本。

読んでみてはどうだろうか。
導入にも、知識の確認にもいいと思います。
コメント(0) 
共通テーマ:学問

複合エンドポイントその2 [Statistics]

で、昨日リンクはった文献ですけど、勉強になります。
死亡率をいれたエンドポイントかどうか、ここがポイント。

医学主要誌167報しらべ、
Primary endpointに有意差がなく、mortalityも有意差がない、は38%。
Primary endpointに有意差がなく、mortalityには有意差があった、といのが4%
Primary endpointに有意差があり、mortalityには有意差がない、は36%
Primary endpointに有意差があり、mortalityに有意差がある、はわずか11%
Primary がいくつも、というのは5%、その他6%。
だそうだ。
Primaryに有意差あり、でその複合エンドポイントにふくまれる死亡率に、
本当に有意差があるのはたった11%だったという。
んで、この調査対象の文献は、
ほとんどが心血管系なんだけど(これは理由がわかるが)、
なんと、Oncologyの文献も含まれている。
その文献みてみたいなぁー。と思いました。
コメント(0) 
共通テーマ:学問

複合エンドポイント [Statistics]

なんか難しいので整理。

複合エンドポイントは、いくつかのエンドポイントを組み合わせ、
1つのエンドポイントとして扱って、検定をするわけですね。
製薬会社にしてみれば、1つの試験で少ないサンプル数、短い期間で有意差をだす、
非常に魅力的な選択肢。
多重性もクリアできるなど、利点も多い。

でも3つ組み合わせたりしている試験をよくみるが、
これが難しい。
http://jama.ama-assn.org/cgi/content/abstract/289/19/2554
にあるように、死亡率+心筋梗塞+狭心症を組み合わせて、
介入により有意な改善をみとめたものの、
実際には死亡率1つでみると治療による影響はなかったとか。

要するに、エンドポイントが重要で、
かつ、その対象となっている疾患に対して、ある治療法をやるとして、
それが各々エンドポイントにどういった影響を与えるか、
よく理解しないといけないわけです。

複合エンドポイントの問題点はいろいろあるようで、勉強しつつ、ここに書いていきます。

コメント(0) 
共通テーマ:学問

Oncologyにおける統計の勉強 [Statistics]

昨日、研修医のためのセミナーで、統計がらみのことをやりました。
チューターとして参加させてもらい、その腕前はともかく、
研修医の先生から受けた質問として、
「これはみなさん独学で勉強されているんですか?」というのがありました。

勉強する機会があって、そこから継続性をもって勉強するのは非常に大切で、
お勧めしたのがやっぱりJSMOの教育セミナー
Medical Oncologistに必要な統計学など、非常に勉強になるため、
何度も繰り返し勉強したものです。
統計は非常に難しいと思うので、長い年月かけて、ゆっくり勉強でいいのかな、と思いますが、
確実に勉強しなくてはいけない領域でもあるのは確かだと思います。
コメント(0) 
共通テーマ:学問

盲検化 [Statistics]

randomizeとblind、よく大切だという話がありますが、
randomizeはよくわかる気がするが、blindってのは??というところ。
まぁ、けっこう非盲検な試験もみるわけで。

Double blindといえば、患者も医師もどの治療にわりあてられてるかわからない。
そう、randomizeを保つという意味では非常によいやり方。
Single blindは、患者のみどの治療なのか知らない。
Placebo controlは、Placeboで治療を受ける場合、全ての患者が、
Placeboの見分けがつかないように治療をうけること。
で、そりゃ、見た目とかが一緒のものを作るとなると大変だし、コストもかかるし。
そんなに簡単じゃなさそう。
RCTを読む時、Blindされているかをチェックしたりするようになっているけど、
BlindしないとRandomizeが保てないかどうか、考えてみなきゃいけないってことだ。

経口ででている分子標的薬は、だいたいBlindされている。
飲み薬だし、そりゃそーしないと、患者さんがPlaceboのんでるって、バイアス生じちゃうだろうし。
でも、S-1 vs. S-1/CDDPなんかは非盲検。
だって、現実的にBlindできるか??って。
でも、このBlind,しっかり問題点とか勉強しておかないとね。

以前は文献読む時、Blindされているかチェックしたが、
されてなくても、軽く流していたが、きちんとされていないことで問題ないか、考えて読むようにしないとね。
コメント(0) 
共通テーマ:学問

ハザード比 [Statistics]

癌の臨床試験で、Overall Survivalがプライマリーエンドポイントである場合、
その治療群間の差はハザード比で表示される。
これは、ある時点での、生存している患者の死亡率の比。
ある時点をtとすると、そのハザード比はR(t)と表現できる。
この群間でどの時点での死亡率も一緒であれば、
R(t)=1、ってことになるのか。
生存期間が異なってくれば、このRは0に近いか、1より全然大きい数になるはず。
第III層試験では、
帰無仮説はR=1、
対立仮説はR>1もしくはR≠1ということになる。

臨床試験でサンプルサイズが適切かをみなくてはいけないんだけど、
要するに有意水準(α)、検出力(1-β)、このハザード比がサンプルサイズ決定に大きく関わるということ。
ハザード比、つまりどれくらいの差が見込まれるか、っていうやつですね。

ちなみに検出力、SWOGは90%を推奨しているらしい。
コメント(0) 
共通テーマ:学問

ROC曲線 [Statistics]

感度・特異度・尤度の話をたまにしていて、
こないだProcalcitoninの話をしたときの論文にあった、ROC曲線。
Receiver Operator Characteristic Curve。

いくつかのカットオフ値を適当に選んで、そのときの感度・特異度を算出する。
縦軸に感度、横軸に偽陽性率(1-特異度)をとり、
各カットオフ値の感度・特異度をプロットするらしい。
縦軸、横軸ともに始点は0、最大値は1のグラフ。
理想的な検査は感度100%、特異度100%で、これをプロットすると
感度1を通り、1-特異度のいわゆるX軸と平行な直線を描くんだけど、
無意味な検査はX=Yの、左下から右上にのびる直線となり、
感度と偽陽性率が等しくなる。
ROC曲線下面積も、完全な検査なら1、無意味な検査なら0.5となる。

ROC曲線のなぞがとけたぜ。
コメント(0) 
共通テーマ:学問

臨床的有意差、統計的有意差 [Statistics]

OPTIMOX2ですが。
mFOLFOX7 x 6cyc > sLV5FU > until baseline progression > mFOLFOX7 reintroduction

mFOLFOX7 x 6cyc > chemotherapy free interval > until baseline progression> mFOLFOX7 reintroduction
の比較。
mFOLFOX7を6コースやったら、だらだら5FUやるか化学療法をしない期間をおくか。
これ、Overall Survivalを比較すると、26m vs 19mなんですが、
p値が0.055らしいんです。5FUだらだらいれておいたほうがいいってこと。
カップランマイヤーみたらわかるんですが、だーっと開いていて、差があるようにみえ、
しかし統計学的には有意差がないんですね。

さて。
臨床家はこれをみて、統計学的に有意差がないから.....と、いえますか??
そう、なかなか統計学的にこだわってられないわけです。
統計学的にはTrendとしてとらえるべき、でしょうが、
これは臨床的に有意差があるとして、だれしもがきっと捉えるのでは?
「有意差ないんでしょ?」という人は、統計を勉強すべきなんだろうなぁと。

そう、Evidenceを語る人が、結構、統計わかっていないと思う。
僕も含めて。
だから、まずは統計に興味をもって、好きになればいいんだね。かしこいね。
結構ブログにアクセスされるときの検索ワードが統計学的用語が多いので、
がんばって勉強して、わかりやすく伝えたいものだ。
コメント(0) 
共通テーマ:学問

中間解析その2 [Statistics]

中間解析は、Data and Safety Monitoring Committee、DSMCといって、
データモニタリング委員会のみが、いわゆる試験ののぞき見が可能。
これについても、たくさんいろいろあるんだが、おいておこう。

SWOGの本によれば、
2群比較試験で、2年目に中間解析、4年目に最終解析を行うことを想定し、
100回のシミュレーションを行ったという。
有意水準を5%として検定した結果、
5つの試験が最終解析で有意差ありと判定され、
5つの試験が中間解析で有意差ありと判定され、
さらにこれらの解析両方で有意差ありと判定された試験はなかったと。
つまりは、100回の検定で10回の試験で有意差ありと判定されたことになる。

type I errorが5%ではなく、10%ということになってしまう。

この問題を解決する統計法がきちんとあり、
中間解析を行っている文献を読むときは、
DSMCの設置、そして中間解析でどのような統計学的手法がかいてあるかみるべき、でしょう。

って文章をかいてみると、DSMCの問題点や、
この中間解析で用いられる統計学的手法も勉強してここで書いていかないと、だなと思いました。
コメント(0) 
共通テーマ:学問

αエラーとβエラーとP値 [Statistics]

臨床試験、統計やると、やっぱりエラーはつきもの。
そう、今日はαエラーとβエラー。

やってしまうエラーは二通り。
試験では、差があるのか、差がないのかを判定します。
1.本当は差が「ない」のに、差が「ある」としてしまう危険性。(おっちょこちょいだ)
2.本当は差が「ある」のに、差が「ない」としてしまう危険性。(ぼーっとしすぎだ)
この2つのエラーは偶然おこるものです。
偶然おこるからしょうがない、ってことは許されず、ある程度この偶然の差を減らさないと。

1.本当は差が「ない」のに、差が「ある」としてしまう危険性。(おっちょこちょいだ)
これを、αエラーといいます。あわてんぼうのアルファエラー。
日々の運動が血圧に与える影響についての試験で、α=0.05と設定したとします。
このαの読み方としては、本当は運動が血圧にあたえる影響は「ない」のに「ある」といってしまう確率を
5%まで許容した、ということになります。
まぁ、5%くらいはミスするっつーの、みたいなかんじです。

2.本当は差が「ある」のに、差が「ない」としてしまう危険性。(ぼーっとしすぎだ)
これをβエラーといいます。ぼーっとしてるベータエラー。
上記試験で、β=0.10としたとしたら、
運動は本当は血圧に与える影響が「ある」のに、「ない」といってしまう確率が10%、ってこと。
つまり、10%の確率で見逃すってことです。
逆に、1-βを統計学的パワー、検出力といいます。
90%の確率で、この運動と血圧の差を検出ことができる、というこですね。

だいたい、αは0.05、βは0.20の設定が多いですね。

さて、ここにきてよくみるP値。
仮説検定のお話。
差がないとする仮説を「帰無仮説」、それに対する仮説が「対立仮説」ですね。
差を検出するのが臨床試験です。帰無仮説を統計学的に否定できれば、対立仮説が正しい、となります。
P値は、帰無仮説が正しいとき、つまり本当は差が「ない」ときに、
偶然間違って差が「ある」としてしまう確率のことです。
このP値が、あらかじめ試験で規定しておいたα値よりも小さい時に、
その帰無仮説が否定され、対立仮説がただしい、つまり差がある!といわれます。

さて、もう一歩。

よくあるP値が規定されたαを若干こえてしまう場合。
「有意差ないんでしょ」
「そんな試験だめでしょ」
と言われてしまいます。
でも、そうじゃないわけで。
αを0.05と定めた試験で、P値が0.06だったら????
内容にもよるとは思いますが、
「関連はどうやらありそうだけど、統計学的には有意な差ではなかった」
と解釈するわけです。

うーん、どうだろう。わかりにくいかなぁー。
コメント(0) 
共通テーマ:学問
前の10件 | - Statistics ブログトップ
メッセージを送る

この広告は前回の更新から一定期間経過したブログに表示されています。更新すると自動で解除されます。

×

この広告は1年以上新しい記事の更新がないブログに表示されております。