はしくれエンジニアもどきのメモ

情報・Web系技術・Englishの勉強メモ・備忘録です。

Gijika.comの上級編「四分割表での比較」のレクチャーメモ

Gijika.comの上級編「四分割表での比較」のレクチャーメモ

前回は,応用編Cセット「RCT・DB・有意・お蔵入り・メタ分析」についてまとめた.

cartman0.hatenablog.com

今回でラスト. Gijika.com(https://gijika.com/rate/literacy.html)にある上級編「四分割表」の動画レクチャーを見たのでそのメモを残す.

Github: Gijikagaku/上級編_四分割比較.ipynb at master · Cartman0/Gijikagaku · GitHub

四分割比較1

https://www.youtube.com/watch?v=HhByrjb8JgI&feature=emb_logo

  • ある対象,薬やサプリメント.お守りなどに効果があるかどうかを調べたい場合, どのように検証すれば「科学的」といえるか.

  • 例えば,飲むとある症状が改善するサプリメントがあったとする.

  • このサプリメントに本当に効果があるかどうか,あなたならどのように調べるか?

  • そのサプリメントを何人かに飲ませて,効いた人と効かなかった人をカウントしてみる方法はどうか?

  • 100人渡して,効いた人が70人で,効かなかった人が30人だった場合だったら.効果があると言っていいか
  • 実は,こうした検証方法では真の効果はわからない
  • というのは,そのサプリメントを飲まなくて治った人がいる可能性が考えられるため.

  • 対象の効果やリスクを推定する場合,それを摂取した場合だけを考えてもあまり意味はなく,摂取していない場合との「比較」が重要である.

  • 科学的な探求では多くの場合,こうした「比較」によって対象の効果,リスクを推定する.

別の例

  • 別の事例で考える
  • タバコを吸うと肺がんになるかどうか調べるとする.
  • このとき,喫煙者の中で肺がんになった人/ならなかった人だけを調べても意味はない.
  • 同じように,タバコを吸っている100人のうち,肺がんになったのが80人で,肺がんにならなかった人が20人だったとしても,「たばこを吸っている人は4倍肺がんになりやすい」とはいえない.

  • なぜなら,タバコを吸わなくても肺がんになった人/ならなかった人もいるわけで,この要因を考慮しないと,本当にタバコが要因かどうかはわからない.

  • 仮に,タバコを吸ってない100人がみんな肺がんになった場合,タバコを吸う方がかえって肺がんになりにくいいえてしまう.

  • この項目では,科学的なデータを採る際に大変重要な,こうした考え方を学習する.

  • サプリメントを飲んだ人/飲まなかった人,効果があった/効果がなかったなどの,四分割表(2x2クロス表)に基づく比較を身につける.

四分割比較2

www.youtube.com

  • 前回で,サプリメントの効果を検証する際にそれを飲んだ人だけ調べてもほとんど意味がないことを認識した.
  • それを踏まえて今回は,四分割表で考えるというのはどういうことかを学習する.

あるサプリメントを「飲んだ/飲んでいない」と「調子がいい/悪い」における四分割表

\ 調子が良い 調子が悪い
サプリ飲んだ A B
サプリ飲んでいない C D
  • たとえば,サプリメントを飲んで調子がいい」場合にはAにカウントする. 逆に,サプリメントを飲んでいなくても調子が悪い」場合にはDにカウントする.

  • この四分割表をつかって,このサプリメントの効果を検証する.

  • 例えば,サプリを飲んで調子が良かった日Aが15日,サプリを飲んだのに調子が悪かった日Bが5日,サプリを飲んでいなくても調子が良かった日Cが10日,サプリを飲んでいなくて調子が悪かった日Dが10日だったとする.

\ 調子が良い 調子が悪い
サプリ飲んだ 15日 5日
サプリ飲んでいない 10日 10日
  • AとBの比A/Bから,サプリメントを飲んだ日には,調子がいいときが悪い時の3倍(=15/5)である.
  • 同様に,CとDの比C/Dから,サプリメントを飲まなかった日には,調子がいいときと悪い時は同じ日数であることがわかる(10/10=1).
  • AとBの比A/Bと,CとDの比C/Dを比べると,A/B:C/D=3:1となり,AとBの比のほうが大きい

  • こうした結果が得られれば,サプリメントを飲んだ場合には,飲まなかった場合と比べて調子が良かった,といえる.

  • ようやく,このサプリメントには効果がありそうだ,となる.

おさらい:別の例

  • 今度は,サプリを飲んで調子が良かった日Aが6日,サプリを飲んだのに調子が悪かった日Bが14日,サプリを飲んでいなくても調子が良かった日Cが10日,サプリを飲んでいなくて調子が悪かった日Dが10日だったとする.
\ 調子が良い 調子が悪い
サプリ飲んだ 6日 14日
サプリ飲んでいない 10日 10日
  • この場合,サプリを飲んだときに調子がいい割合A/Bは,6/14=0.43倍で, サプリメントを飲まなかった日に調子がいい割合C/Dは,10/10=1倍.

  • サプリを飲んで調子のいい日の割合は,飲まなくて調子のいい日の割合よりも小さいため,今度はサプリを飲まないほうがむしろ調子がいい. つまり.このサプリには効果がなさそうだ,となる.

  • このように,四分割表を使って考えることによって,そのサプリに本当に効果があるか検証できる.

  • ちなみに,実際に薬などの効果を測る場合には,被験者を複数用意して,「薬を飲む人たち」「薬を飲まない人たち」という2つのグループに分けた上で,その人達のうち,どのくらいの割合が回復したか調べる.

  • 今回の場合は,かなり単純化して考えたが,実際には,効果を正しく検証するために様々な工夫が凝らされている.

四分割表で比較する3

www.youtube.com

  • まず’,世界の総人口が400人であると仮定してみる.

  • また,その400人を対象に,喫煙と肺癌の関係を調べる.

  • タバコを吸っている人と吸っていない人で肺がんのリスクはどのくらいあるのかを調べる.

  • 調査から10年後に集計した,喫煙と肺癌の関係についての四分割表. 喫煙者の200人のうち,160人が肺がんをを患っていて,40人が患っていなかった. 同じように,非喫煙者200人のうち,肺がんを患っていたのは120人で,80人が患っていなかった.

\ 肺がん 肺がんなし
喫煙 160人 40人
非喫煙 120人 80人

この表から,タバコと肺がんについてどのようなことがいえるか.

  • 喫煙者うちの肺がん患者の割合と,非喫煙者農地の肺癌患者の割合を計算する.
    • 160 / 40 = 4
    • 120 / 80 = 1.5
  • 喫煙者と肺がんの関係ほうが少し強そうだと考えることができる.
  • ただ,具体的にどのくらいの大きさなのかといったリスクの程度は,このままではわかりにくい
\ 肺がん 肺がんなし 肺がん割合
喫煙 160人 40人 160/200=80%
非喫煙 120人 80人 120/200=60%
  • 喫煙者の肺がんの割当は80%で,非喫煙者の肺がんの割合は60%となった.
  • 続いて,いま出てきたこの数字,80を60で割る. 80/60 = 1.333倍

  • この数字をリスク比

  • リスク比は,「ある要因に曝露(ある疾患に罹患(りかん)する可能性のある要因にさらされる)することによって,曝露がない場合と比較して,リスクが何倍になるか」を示す指標である.
  • これまで学んできた四分割表をもとに,片方の集団にいることが,もう片方の集団にいることよりも危険が何倍になるかを算定できる.今回の場合,喫煙者の集団と非喫煙者の集団での比較になる.

非喫煙者に比べ喫煙者は1.3倍肺がんになりやすいと解釈する. ただし,この数字に統計的に意味があるかどうかは別途検証する必要がある.

  • ただし,リスク比はしっかりサンプルされた(標本が多い)データでないと算出できない.
  • 四分割して比較することが科学的な方法として物事を考えるだ一歩である.
  • 適切に比較し,いわゆる数字のトリックに惑わされないように,データの見方を磨く.