マルチレベル分析(1)


3spineconcertina (cut 'n' folded from one A3 sheet, no waste) by elod beregszaszi
photo by elod beregszaszi on Flickr.

マルチレベル分析(Multi-level analysis)とは、階層性のあるサンプルを分析する手法である。専門領域ごとに名称は異なるが、Hierarchical linear models(HLM), nested models, mixed models, random-effects modelsは、どれもマルチレベル分析と同様の分析を示す。

■分析にふさわしいデータセットとは?

Clustered DataやLongitudinal Dataを分析する上で有用である。前者の例として、いくつかのクリニックに通院している患者に対して、ある特別な術式と病気の予後の関係を調べる研究を実施する場合を考えてみよう。その場合、患者をレベル1、クリニックをレベル2として階層性を持たせるようにデータセットを準備するのがClustered Dataだ。一方、特定の個人(レベル2)の複数の時点でのデータ(レベル1)を収集すれば、階層性のあるLongitudinal Dataということになる。

こうした構造をとったデータセットを分析する必要はどこにあるのか? Merlo et al. (2005)では冒頭に以下のように記述されている。

Person with similar characteristics may have different health experiences according to whether they live in the same neighbourhoods or in another, and people living in the same neighbourhoods tend to experience a similar health status.

(同じような属性を持っていたとしても、居住している空間が異なれば健康状態が異なるかもしれない。逆に居住している空間が同じであれば、人々は同じような健康状態になることがしばしばある。)

所属している集団によって人々の健康は影響を受ける可能性があるので、分析をする際にその可能性を考慮するべきだという考えだ。集団間で検証したい変数間の関係性が異なっていたら、まとめて分析することはふさわしくない。

特に私たちのように人類生態学を志す者にとっては、マルチレベル分析は絶対に(とくにこれからの若い世代は)押さえておかなければならない。人類生態学には生態学的健康観という考え方がある。それは、環境がそこに暮らす集団に固有の影響を与え、その結果として集団の健康状態が決定されるという考え方だ。そういう「哲学」が何十年も前からある中で、これまで(おそらく)誰もマルチレベル分析をしていないというのは勿体ない。その理由はおそらく調査対象とするコミュニティが「ひとつきり」だったからなのだと思うのだが、今後の展開を考えるとそうも言ってられない。マルチレベル分析を適用をして大規模サンプルから新しい科学的知見を見出すような努力もしていかないといけないと個人的には思っている。

■「Mixed Model(混合モデル)」という言葉の含意は?

何が混合しているのかと思うだろう。その答えは「Fixed EffectとRandom Effectが混合している」である。さらにRandom Effectをどのレベルで認めるかによってこのモデルの複雑さが変わってくる。

具体的に言えば、集団(例えばクリニック)ごとに、固有の「切片」「傾き」を認めるかどうかということである。下のURLに綺麗にまとまっている。このサイトはとても分かりやすく図解してある(しかし英語)。
e-Source Behavioual & Social Science Research 

(a)は普通の回帰分析。集団間のバリエーションを考慮していない。(b)は切片について集団間でバラつき(ランダム効果)を仮定している。(c)から(f)は切片とともに傾きについても集団間でのランダム効果を仮定している。

■参考文献・サイト




Centre for Multilevel Modelling, University of Bristol
ブリストル大学のセンターが開発したMLwiNというソフトウェアを公開している(有料)。
“A User’s Guide to MLwiN”という説明書がMultilevel Analysisを理解するうえでとても役立った。
Roux, AVD. A glossary for multilevel analysis. Journal of Epidemiology and Community Health 2002; 56: 588-94


コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください

前の記事

Tweets of the week