縦断データを使った構造方程式モデリング(SEM)に関するワークショップ


ワークショップについて

 CURRAN-BAUER ANALYTICSという会社が主催している5日間のLongitudinal SEMのセミナーに参加。Patrick CurranとDan BauerというUNC Chapel Hillの教授2名が夏休みの期間に集中的に開講している模様。二人はDevelopmental psychologyとClinical child psychologyで学位を取ったとのこと。ちなみに、Professional rateが1795ドル、Student rateは1295ドル。ポスドクはStudentかと聞いたら違うと言われた(そりゃ、そうか)。
 比較的高い値付けであるからか、かなり詳細で分厚いマニュアルが配布された。一冊は理論について説明した冊子、もう一冊はStataかMPlusのスクリプト(各自で選択)が書かれた資料であった。ちなみに、USBも配布されて印刷資料としてもらえなかった方のスクリプトも貰えた。
 ちなみに、この夏はLongitudinal SEMの他にも、Network Analysis、Multilevel Modeling、Latent Class/Cluster Analysis And Mixture Modeling、Structural Equation Modelingなどのコースが開講されてた。あと日本からわざわざ参加しに来た人がいてびっくりした。

講座の内容

Chapter 1: Introduction and Review of SEM
構造方程式モデリングの概要
Chapter 2: Longitudinal measurement models
縦断データを使ったモデル
Chapter 3: Autoregressive cross-lagged panel model
自己回帰交差遅延モデル
Chapter 4: The unconditional linear latent curve model
説明変数がない線形潜在曲線モデル
Chapter 5: Nonlinear and Conditional Latent Curve Models
非線形潜在曲線モデル、説明変数ありの潜在曲線モデル
Chapter 6: LCMs with Non-Normal and Discrete Outcomes
結果変数が非正規分布の場合、結果変数が離散変数の場合
Chapter 7: Multivariate Latent Curve Models
複数の結果変数を使った潜在曲線モデル 
Chapter 8: Latent Change Score Models
潜在変化得点モデル
Chapter 9: Modeling Population Heterogeneity: Part 1
集団の異質性をモデル化する(パート1)
Chapter 10: Modeling Population Heterogeneity: Part 2
集団の異質性をモデル化する(パート2)

感想

 内容は難しくて現時点の状態では、消化不良なのだけど、参加してよかった。自分の研究でもLongitudinal SEMをきちんと使っていきたいと思っている。例えば、変数間の双方向性が問題になるケース(例えばうつ症状があることで社会参加が減るのと、社会参加がないことでうつ症状が進む状況)にはAutoregressive cross-lagged panel modelを使えばいいし、データが3時点以上あれば、Latent curve modelを使えばいい。不健康行動が加齢に応じてどういう変化をするかというTrajectoryを特定して健康指標との関連を見るとかなら、Group-based trajectory modelがある。実はこういう分析の存在はワークシップ参加前から知って何度かやろうと思ったことのあるのだけど、自信をもってできないでいた。手元のハンドアウトを見直しながら、じっくりやっていこうと考えている。

 このワークシップを受ける前に、今年のSociety of Epidemiologic Researchに参加した芝君のtweetを見た。

芝君にはさらにTyler VanderWeeleの論文を紹介してもらった。

VanderWeele, T. J. (2012). Invited Commentary: Structural Equation Models and Epidemiologic Analysis. American Journal of Epidemiology, 176(7), 608–612. http://doi.org/10.1093/aje/kws213 [Link]

 Tylerの論文はInvited commentaryでAJEの同じVolumeに掲載されたSEM論文(Arlington et al., 2012)に対してのコメントペーパー。SEMはassumptionが厳しいなど書いてある。

 せっかくなので、Patrickに「Tylerの論文を読んだことがあるか?」「どう思うか?」と質問してみたのだが、答えは両方ともNoだった。その場でAbstractだけ読んでくれて、「中身を読めば自分がなるほどと思うことを書いているのかもしれないが…」と断ったうえで、Assumptionが厳しいというのはSEMの正しい理解に基づいていないと言っていた。他にも、

  • SEMに対する批判はたくさん受けてきたけど、ちゃんと理解していない人が批判していることが多い。
  • SEMを使っている論文で間違った使い方をしている論文があるのは事実だけど、それはSEMという方法論の問題ではない。
  • 例えばLinear regressionがSEMと違うものかのように書いているけど、我々にとってはLinear regressionはSEMのサブセット。
  • こういう批判に対して、SEMでどう解決できるか考えるといいトレーニングになると思う。
  • SEMerとBiostatisticianが共著で書いた論文を読むと理解が良く深まると思う。

などとコメントをもらった。

Linear regressionはSEMのSubsetだというのは、「両陣営」がSEMという言葉でそれぞれ意味していることがずいぶん違うことを示しているなと思ったし、Tylerの論文を改めて読んで、Arlington et al.に対する批判とSEMという方法論の限界がきっちりと分けて議論されていない部分も多いのではないかと感じた。また、両陣営ともにポジショントークをしている部分もあるだろう。とりあえずは、Tylerのコメントに対するSEMerのレスポンスを少し探してみたりしようかな。

でも、間違いなく現時点では、I am not running away from SEMs. だな。 そういや、Tylerたちはデータポイントが10個ある時とかはどうやって分析するのかな。また宿題が増えた。死ぬまでやることなくならないな。

参考リンク