統計学集中講座 多変量解析編1

7月17日・18日(午前) 基礎統計編(シミュレーションで学ぶ基礎統計の再入門コース)
7月18日(午後)・19日 多変量解析編(豊富な実例で学ぶ多変量要因分析のテクニックとノウハウ)

多変量解析編を受講される方へ

ノートパソコンをご用意下さい。
1. 多変量解析編は、統計処理の経験をある程度お持ちの方を対象としていますが、基礎統計の知識は必須ではありません。従って、「基礎統計編」をスキップして、「多変量解析編」だけを受講されても、大きなハンディはありません。
2. 調査研究(探索的研究)における多変量要因分析の必要性と、その基本的な考え方の学習を目的とされる場合には、2日目(18日午後)だけの受講(研究デザイン、重回帰分析)で十分です。もし時間的な余裕があれば、3日目午前の多重ロジスティック分析の部分も受講いただけると、多変量要因分析の理解が一段と深まりますので、その部分までの受講をお勧めします。一方、3日目午後の部分は、同じ多変量要因分析でも、いわゆる生存曲線の分析に相当し、コホート研究や臨床試験に直接関わっている、またはその種の研究に触れる機会が多い方を対象としていますので、その部分への参加の必要な方は少し限定されます。
3. 講義では、身近な約25の例題や応用問題を使い、全て演習形式で行います。ソフトウエアは、基礎統計編と同じく、StatFlexの講習会バージョンを使い、データ解析の全過程(データの取り込み、データの視覚化とその適正の解析、変数変換などの前処理、変数選択の実際、検定結果の解釈、各種予測値の計算、等々)を具体的な統計処理を通して体験的に学習できるようにしています。他の統計ソフトをご利用の方も、多変量解析活用のノウハウ、結果の解釈は全く同じですので、振るってご参加下さい。なお、データをエクセル形式で配布しますので、それを利用できるソフトウェアが必要です。
4. コンピュータの操作に不慣れな方も、講師も含め常時5〜6名の講師・スタッフが操作をサポートして講義を進めてゆきます。従って、制御可能な最大受講者数を65名に設定しています。定員に達し次第募集を締め切りますのでお早めにお申し込みください。
5. 講義用のスライドでは、あらゆる理論や数値情報をカラーで図式化したものを使用します。その内容を印刷したテキストは、演習問題集とともに当日配布します。

多変量解析編の到達目標

集中講座により、次の事項の理解・体得を目指しています。

・研究データの偏りに対する理解と対応法
・交絡現象と交互作用の意味と要因分析での制御法
・ダミー変数の作り方と解釈
・要因分析におけるデータの前処理で押さえるべき点
・要因分析における適切な変数選択のポイント
・要因分析では、変数選択を自動化できず、分析目的や事前情報に基づく選択が必要な理由
・ROC曲線による診断特性の分析法とその限界
・多重ロジスティック回帰式からの調整オッズ比とその信頼区間の計算法
・多重ロジスティック回帰式による多変量診断(判別)への応用
・カプランマイヤー方式の生存曲線の意味と限界
・Cox回帰を使った生存時間に関係する要因の分析法
・ Cox回帰の結果から調整相対リスクとその信頼区間の計算法

●講座内容

7月18日(日) 多変量解析編(第1日目)

13:30〜14:45

  • 1. 研究デザインと偏り
    • a) 研究デザインと偏り
      • 生命科学分野の研究を、大きく実験的研究と観察的研究に分けて整理します。
      • 前者は一般に確認段階の研究(臨床試験・比較実験)で、適切な対照を取って薬物や処置の効果が計画的に調べられます。この場合、単純な基本検定(単変量解析)を利用できます。これに対し、調査研究(コホート研究・患者対照研究・横断的研究・症例集積研究)では、綿密に計画しても様々な形で偏りが入り込み、単変量解析では何も言えません。このことを、多数の事例で解説します。
    • b) 交絡現象と交互作用の意味と層別化による解明
      • 「偏り」とは、注目している数値情報(疾病の有無による検査値の差異、治療の有無による生存率の変化、等々)が、注目していない他の事象(年齢、性別、重症度、等々)で歪められることを指します。統計処理上「偏り」は、「交絡現象」と「交互作用」に大別して扱うことになり、単純な場合はデータの層別化により対応できます。しかし、複雑な場合には、対応困難となることを図式的に示します。

15:00〜18:30

  • 2. 重回帰分析による偏りの補正
    • 偏り補正の代表的な手法である重回帰分析を取り上げ、その回帰係数の数理から、何故偏りを制御できるのかを平易な数値例から学びます。そして、交絡現象・交互作用を考慮した回帰モデル構築の実際を多数の事例を用いて解説します。また、従来の分散分析法や共分散分析法も、ダミー変数を作成すれば重回帰分析で処理でき、解釈も容易となることを示します。
  • 3.要因分析の理論とモデル構築のストラテジー
    • 要因分析のための主要な3つの多変量解析法(重回帰、多重ロジスティック回帰、Cox回帰)に共通した回帰モデル構築法(説明変数の組み合わせ方)を解説し、演習を行います。
  • a) 回帰分析の2つの目的
    • 回帰分析は、特定の変量の予測を目的としたもの(prediction goal)と、変量間相互関連の真偽の検証を目的としたもの(validity goal)に分かれます。前者では、コンピュータによるモデル構築の自動化が可能ですが、後者では「偏り」の補正という観点から説明変数の組み合わせ方を決める必要があります。
  • b) 回帰モデル構築の実際
    • ・データの前処理法(入力ミス、極端値への対応、変数変換)
    • ・質的(分類)情報に対するダミー変数の作り方
    • ・交互作用の調べ方
    • ・回帰適合度の読み方と変数の増減法
    • ・多重共線性(multi-colinearity)の意味と対処法
    • ・ データ数と取り込み可能な説明変数の数

7月19日(月・祝) 多変量解析編(第2日目)

9:30〜12:30

  • 4. 判別特性分析
    • ある計測値の大きさから、特定の状態の有無を判定(診断)する方法として、(1)判別効率を表す指標(感度・特異度・的中率)の求め方, (2) ROC曲線の作り方と曲線下面積の検定法, (3) 感度・特異度曲線を用いたカットオフ値の設定法を解説します。
  • 5.多重ロジスティック分析
    • 異なる2群に着目し、その違いに関係する要因が何であるかを多変量的に評価する分析法です。一般に、2値型の目的変数(疾患の有無、治療の成否、任意の事象の生起)と、各種属性や計測値(説明変数)との関連性を定量的に評価できる、応用範囲の広い方法となります。
  • a)ROC分析との対比
    • 2群の判別において、単変量の場合、ロジスティック分析とROC分析とは同一の判定となります。しかし、多変量の場合、ROCの複合分析では、偏った判定を生じる可能性があり、ロジスティック分析が必須となります。
  • b)多重ロジスティック分析の実際
    • 代表的な患者対照研究の事例を用いて、2群の判別に関わる要因の探索法を演習します。
  • c) 多重ロジスティック分析の応用(オッズ比の計算と多変量判別法)
    • 多重ロジスティック回帰の結果から、特定の説明変数の変化が、疾患の有無、治療の成否にどの程度関連しているかを、オッズ比の形で表す方法とその解釈を解説します。さらに、多重ロジスティック回帰式を使った多変量判別式の導き方を演習します。

10月22日(月)多変量解析編(午後)

13:20〜16:20

  • 6.Cox回帰と生存曲線・発症要因の解析
  • a)カプランマイヤー法による生存曲線の作成と有意差検定
    • さまざまな製品や生命の寿命が経時的にどのように変化するかを調べる代表的なグラフ表示法で、その計算・作図法を解説します。また生存曲線の差の検定法の実際を述べ、単変量解析であるため、その適用に限界のあることを示します。
  • b)Cox比例ハッザード回帰
    • 生存期間、発症までの期間や治療の効果に影響する因子が何であるかを多変量的に分析する手段です。代表的な臨床試験・コホート研究の事例を取り上げ、Cox回帰の実際を、常に生存曲線(単変量解析)と対比させながら解説します。また、分析結果から各要因の相対リスク(各要因の予後への寄与度)とその信頼区間の計算法を解説します。