ロスマンの疫学~科学的思考への誘い~ 書評


「世の中には、疫学と言うものを、ただ統計学的手法を疾病発生や因果関係の問題に応用しただけだと思っている人がいるようです。」

本書は、こういう書き出しから始まる。アイタタタ、ソレッテボクノコトジャナイカ!?

 本書は、疫学の大家、Kenneth Rothmanが、「重要な概念に焦点を絞った簡潔な教科書を作ることを目指して(p.4)」著述したものである。原題こそ ”Epidemiology An Introduction”とあるものの、いささか難解で、あまりイントロダクションと呼べるような内容にはなっていない。
 本書を読むのは実は二回目なのだが、(前回は学部3年生のころで、途中で挫折した。)、今回も何とか読み終えた、という言い方が正しいであろう。すらすら読めたとはいえない。たとえば、ジョンズホプキンス大学のOpen Course Wareにある初学者向けの教材(たとえば、http://ocw.jhsph.edu/courses/FundEpi/ )と比べると、ずっと抽象的であって、初学者にはつかみにくいだろう。もちろん、疫学や統計学に対する知識をある程度持った人が、違う観点から勉強しなおしたり、知識の体系化を図ろうとするときには有効かもしれない。
 問題をきちんと解きながら、もう一度読む必要がありそうだ。ちなみに、問題の解答は、出版社のサイトから入手することが出来る。(英語のみ)

代表性と限定化
 今回、一番勉強になったのは、代表性と限定化に関する記述である。

代表性を求めることに価値があるという考え方は、標本調査研究の領域に由来する考え方で、それは全集団を調査する費用と手間を避けるために大集団から取った標本集団を調査しようというものである。そのような標本抽出のおかげで統計学的推論が可能となるが、それは疫学的な調査が目指す科学的な推論と単に表面が似ているだけである。科学的な推論において目指すところは、特定の標的集団に当てはまる結論を推論することではなく、むしろ特定の集団にとらわれない、抽象化された理論を推論することにある。交絡がなければ科学的な推論を行うことはより易しい。したがって限定化によって科学的推論を行う能力が高められるのである。実験動物で研究をしている人々はそのことを知っている。(p.142)

また他のページにも以下のような記述がある。

がんの原因についての科学的一般化の問題を考えるに当たっては、マウスの発ガンを研究している生物学者の視点から考えるのが役に立つ。大多数の研究者ががんを研究しているのは、それがマウスであれ、ラット、ウサギ、ハムスター、そしてヒトであれ、人間のがんの原因をよりよく知るためである。しかし科学的一般化が標本の統計学的な代表性に依存するなら、マウスを用いている研究者は人間のがんの理解にまったく貢献することにならない。彼らは、全然人間の代表的標本について研究していないし、マウスの代表的標本の研究すらしていない。(略)彼らは、均一に同じ遺伝子を持ち、おそらく特定の生物学的特性を持ったマウスを求める。(略)彼らが使っている動物の生物学的特性(そしてその意味において、代表性という点)が人間と同じかどうかは考慮していよう。この種の代表性は、もとの集団からの標本抽出による統計学的代表性ではなく、科学的知識に基づく〈生物学的代表性〉(biologic representativeness)である。実際、統計学的代表性がなくても、動物実験が人間の疾病について理解するために役立っていることを誰も深く疑いはしない。(p.35)

 私はこれまで、代表性があることに、無上の価値があると思っていたきらいがある。というのも、授業などで、代表性や一般化可能性に関するコメントや質問を、したり顔でする人を数多く見てきたからだ。
 ただ、この一節(特に動物実験のくだり)を読んで、それぞれの研究で何を成し遂げたいのか、そして、何を知見として得ようとしているのかをはっきりさせたときに、必ずしも、統計学的代表性や一般化可能性だけがいつも崇拝されるものではない、ということを理解した。

◇   ◇   ◇

 人類生態学において個人ベースでフィールド調査をするとき、「限定化」戦略をとることが一般的だ。たとえば中国を調査する際にだって、調査する省を無作為抽出するわけでもないし、海南省のなかでも、市を無作為抽出しているわけでもない。村レベルでも違う。そうすると標本調査で言うところの一般可能性はない。
 「限定化」戦略をとるのは、対象とする村落数を増やすことが出来なかったり、村によっては調査許可が出ない場合があるいう現実的な制約とともに、「限定化」戦略を取らなければ、見えてこないことがあると信じているからだ。
 それは言うまでもなく『人類生態学の方法』で、鈴木継美先生が「手作りのセンサス」と呼んだ、人類生態学の研究プロセスのことにほかならない。UNが出す推定値とは明らかに違ったレベルで得られたデータは、きわめて饒舌である。

 国際保健学専攻の修士論文の発表などを聞くと、人類生態学教室の発表に統計学的代表性がない、と否定的なコンテクストで話をする人がいる。しかし、これはそもそも私たちの目指しているところではないのだから、くみすることはない。むしろ、Rothmanが言うように限定化の意味をしっかりと反芻した上で、反駁することが出来ればいいのだろう。
 もちろん、私たちのの限定化するプロセスに少しでも工夫することが出来たら、標本調査を行う人にとってもより分かりやすい「意味」を持てるのかも知れない。たとえば、「道路がない村だからここに行ってみよう」ではなく、SaTScanで検出されたクラスターに含まれる村落において詳細な調査をおこなう、というのはひとつの方策であろう。

備忘録
▼第2章
因果のパイモデルの説明が不十分?(p.21)
生物学的原因(p.23)
寄与割合の合計の説明のところで指示語が多くて何を言っているか分からない。
帰納法は論理的力を持たない(p.29)
推測と反証の繰り返し(p.31)

▼第3章
リスク 発生率
リスク比と発生率比の関係(p.72)
発生率比は「瞬時におけるリスク比」

▼第4章
コホート研究と症例対象研究の比較(p.119)

▼第5章
疫学研究におけるバイアスの原因
(1)選択バイアス (2)情報バイアス (3)交絡

▼第7章
信頼区間の位置を主眼にするということ、つまり統計的有意さに重きを置くということは、結果の解釈をするうえで不適当であり誤った方向に結果を歪めてしまいかねないものである。(p.165)
統計的有意差検定をするよりも、むしろ推定に頼るほうがよい(p.176)

▼第8章
クロス集計(p.181)
層化分析が多変量分析を勝る主要な利点(p.207)

▼第9章
発生率差と発生率比の意味合い(p.213)
生物学的交互作用と統計学的交互作用(p.215)

▼第10章
ロジスティック変換は二つの変換からなる。
[1]最初にリスク指標Rを[0,1]の範囲ではなくて0から無限代の範囲を持つ尺度に変換する。=RをR/1-Rにする リスクオッズ
[2]リスクオッズを負の無限大から正の無限大までの範囲を持つ尺度に変換する。=自然対数をとる


コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください