はしくれエンジニアもどきのメモ

情報系技術・哲学・デザインなどの勉強メモ・備忘録です。

Gijika.comの応用編Cセット「RCT・DB・有意・お蔵入り・メタ分析」のレクチャーメモ

Gijika.comの応用編Cセット「RCT・DB・有意・お蔵入り・メタ分析」のレクチャーメモ

前回は,応用編Bセット「バーナム効果自己成就予言,認知的不協和,学会/論文,説明責任,誤謬論」についてまとめた.

cartman0.hatenablog.com

今回は,Gijika.com(https://gijika.com/rate/literacy.html)にある応用編Cセット「RCT・DB(二重盲検法)・有意・お蔵入り・メタ分析」の動画レクチャーを見たのでそのメモを残す.

このセットは5つに分けられている.

  • RCT(無作為化比較対照試験)
  • DB(二重盲検法
  • 統計的に有意
  • お蔵入り効果
  • メタ分析

Github:Gijikagaku/応用編C(RCT・DB・有意・お蔵入り・メタ分析).ipynb at master · Cartman0/Gijikagaku · GitHub

RCT(無作為化比較対照試験)

www.youtube.com

  • 例えば,薬の試験では,その薬を飲んだら回復するが,飲まなかったら回復しないとわかれば効果が明らかになる.
  • ところが,実際には,何らかの理由で薬を飲まなくても回復する人, 飲んでも回復しない人がいる.そこで,そうした人々が,薬を飲む実験群や飲まない対照群に分けて効果を比較する.一方に集中していると,結果のデータが歪んでしまう.
  • そこで,大勢の実験参加者を無作為に2群に割り付けることで,隠れた条件の影響を取り除く. 隠れた条件を取り除くにはなるべく多くの人々をランダムに2つに分けるほうがよい.

  • 比較対照実験のうち,実験参加者などを実験群と対照群にくじ引きで無作為(ランダム)に割付けて行う試験のことをいう. ランダム(無作為)化比較試験,英語名(Randomized Controlled Trial)を省略してRCTと呼ばれることもある.

  • 人間や社会などの複雑な現象を究明するにあたっては,現象に影響するすべての条件を明確にして,実験群と対照群で同一条件にするのはかなり難しい作業である. そこで明確にできない条件を統計的に相殺する.

  • そして,注目する条件,例えば薬の成分の有無によって結果を比較する. 薬の効果ではプラシーボ効果を防ぐために,更に二重盲検法を導入することもある.

  • このように,人を対象とした研究領域では,無作為化比較対照試験が行われていることが1つの信頼性の指標となっている.

  • 例えば,医学研究では信頼性の目安としてエビデンスレベル」という概念が用いられるが,無作為化比較対照試験はその中でもエビデンスレベルⅡとして高く評価されている

RCT

二重盲検法(DB, ダブルブラインド)

www.youtube.com

  • 二重盲検法(ダブルブラインド)は,薬などの効果を正確に測定するための実験手法のⅠつである.

  • 今飲んでいる薬などの性質について,被験者(患者)にも実験者(医者)にも知らせないことでプラシーボ効果を排除する.

  • 人に対する効果を測定する科学的研究において,大変重要な考え方である.

具体例:

  • 例えば,水道水より天然水のほうが美味しく感じるかという官能テストをする.

  • その場合,「いま天然水を飲んでいる」と被験者本人が知っていることによって,気のせいで美味しく感じてしまう可能性がある.

  • そこで,被験者がどちらの水を飲んでいるかわからないようにしてテストする

  • ちなみに,この段階を一重(いちじゅう)盲検(シングルブラインド),単盲検などという.

  • 一方,立ち会っている実験者も「あの人は天然水を飲んでいる」と知ってしまうことがある.

  • すると,美味しく感じるはずだという期待が被験者に伝わってしまい,そのせいでおいしく感じるという可能性がある.

  • そのため.立ち会っている実験者にも,どちらの水かわからないようにしてテストすることで,その可能性を取り除く.

  • これを二重盲検法という.こうすることで,被験者や実験者の主観が介入することを抑えられる.

統計的に有意

www.youtube.com

  • 「統計的に有意」,この言葉を聞いたことはありますか?
  • 推測統計の分野では日常語のように使われているが,一般にはまだ馴染みにくい言葉かと思う.
  • この動画では,統計的に有意が意味する内容と,それによってどのようなことがわかるか,といった解釈について学習する.

例:サイコロの場合

  • 例えば,サイコロを3回降って出た目の合計はいくつくらいになるか? 出る目の平均に基づいて「14」と答える方が少なくないと思う.

    • ((1+6)*6/2)/6 * 4 = 3.5 * 4 = 14
  • しかし,現実に同じことをしてみると,10だったり15だったりと,その数字はバラツキが起きる.

  • 期待通りの結果がいつも出るわけではない

  • 統計学では,こうしたバラツキの範囲を推測する.

  • そして,ある一定の範囲よりも外の値が出た場合,「統計的に有意である」として,その意味をか考える.

  • 例えば,サイコロの合計の期待値が14で,その試行を100回行うとほとんどは,11-17の間に収まる場合に, いま出ている15という結果をどのように考えるべきか,といった意味を確率に基づいて考察する.

E[x] = (7*6/2) / 6 = 3.5

V[x] = (x-3.5)2 / 6

参考: http://www.ec.kansai-u.ac.jp/user/amatsuo/pdfstatecon/Sum3dices.pdf

  • 逆に,5回連続で1が出た場合,サイコロの出目はランダムではなく,イカサマサイコロの可能性も考えられる.

  • このように,現れた数字が偶然なのかどうかを判断し,偶然おは考えにくい低い確率が得られた場合,「統計的に有意」という表現を使う.

  • ちなみに,偶然なのかそうでないのかの判断は「有意水準」によって行う. 人間の行動を測定する場合の有意水準は5%が一般的で,これは20階に異界未満しか出ない少ない確率の現象が今みられている,という意味になる.

  • ですので,5%未満の場合,偶然以上の偏りがあるとし,「有意」と判断する.

  • ただし,たとえ「有意」であっても偶然の可能性も残るので,注意が必要.

お蔵入り効果(出版バイアス)

www.youtube.com

  • ある仮説を支持するデータを集めようと実験や調査を企画して実施したところ,肯定的なデータが得られなかった.

  • すると,研究者は実験に失敗したと思い,こうしたデータを引き出しにしまい込んでしまう傾向がある.

  • これを「お蔵入り効果」,あるいは英語を直訳して「引き出し効果」と呼んでいる.

  • 一方,肯定的なデータが得られると,研究者は成功したと思って,データを積極的に発表する.

  • そのため,実際には偶然変動で肯定的なデータが得られたり否定的なデータが得られたしていても,一見すると肯定的なデータの方が多いように「見えてしまう」

  • 「肯定的なデータのほうが公になりやすいこと」を指して「出版バイアス」と呼ぶ.

  • 肯定的な結果/否定的な結果に関わらずデータが発表されていれば,お蔵入り効果の度合いを推定することができる.

  • そのため,多くの追試の研究がなされていることが,真の効果を知る上で非常に大切である.

メタ分析

www.youtube.com

  • メタ分析とは,同一のテーマについて行われた複数の研究結果を,統計的な方法を用いて統合する研究手法である.

  • 人間や社会に関する現象は複雑で,「ある条件では効果が出るが,他の条件ではわからない」といったことがよくある.

  • 同じテーマの実験や調査をしているつもりでも,時と場合,また研究者によって,効果が得られたり得られなかったりする.

  • そのため,どのように優れた研究であっても,ある1つの研究だけで決定的な結論を導き出すことはできない

  • 特に,統計的な分析では対象となる集団から標本を抽出し,その分析によって元の母集団の性質を推測するため,抽出された標本のばらつきによる影響を受けざるを得ない.

  • こうした問題を克服するには複数の研究結果を統合し,バラツキの影響をへらすことが有効である.メタ分析はそのための手段で,より確実性の高い分析結果が期待できる.

  • 通常の統計学で用いる仮説検定の考え方に加え,メタ分析では,効果量(effect size)という概念を用いて分析を行う.

  • 効果量とは,「(ある実験によってみられた)現象の効果を推し量るための指標」のことで,効果の強さ,大きさ,関連性を表すことができる.

  • メタ分析において,異なる研究間の共通のものさしとして使われる.

例:

  • 例えば,ある治療薬(降圧薬)を飲んだ群と飲んでいない群を比較し,飲んだ群のほうが「統計的にに有意」に血圧が下がったとする.

  • しかし,これだけでは,どの程度血圧が下がったのかはわからない. そこで,具体的にどれくらいの数値が下がったのかを効果量によって表していく.

  • 効果量に該当する概念はいくつかあるが,「標準化した平均値の差」「オッズ比」「相関係数」が代表的である.

  • 近年,メタ分析あは研究者間で広く普及しつつある.

  • スライドの図は,1997-2016年までのメタ分析の出版数を調べた結果である(PubMed登録数).
  • 単純な数でいえば,まだそれほど多くないが,増加傾向は顕著である.

  • 加えて,ある病気に対する診療ガイドライン策定時にもメタ分析は重宝されている.

  • 研究方法の信頼度を推し量る目安として,「エビデンスレベル」という概念が導入されているが, 多くの場合,メタ分析はその最上位に位置づけられている.

  • 良質な結果を提供する研究デザインとみなされている.

  • ただし,複数の研究結果をまとめることを目的とするメタ分析に対して, 「本来異なるりんごとオレンジを区別しないで分析するのはおかしい」との比喩的な批判もある.

  • しかし,メタ分析の本分は「フルーツについてまとめること」なので,むしろ「りんごとオレンジを混ぜることに意味がある」ともいえる.

  • いずれにしても,そのメタ分析が何を目的にし,どのような水準で分析を実施しているのか十分に吟味した上で判断していく力が,市民に求められていると言える.