morの解析ブログ

解析疫学、リスクにまつわるメモや計算

「推定」のまわりをさぐる.教科書では「解析はMHにより行う、因子が多ければ重回帰を用いる」という風で詳しい例は少ない.独自(のつもり)な思いつきで具体に試行.
 数理を用いるべきアセスメントにも切り込む.

小数gの率問題、BG補正から 抑制性算出


■ N=3のgでは、Y1からID1個が振れるだけで率33%が動く.少数例で率が振れるのは困る.対処法を考える.
 まず、曝露状況の違うgが示す率は、どうなっているか.扱うデータでは、Nが小さいgで、率が1か0に分かれている.  

     

 この値はそのまま解釈していいのか.小数例であるがために両極化しているだけなのではないか.超幾何関数を引っぱり出す.                  

       

    dhyper( x , 212 ,265-212 , max(x) ) による分布
                      x=2,4,6,8,10


 ある集団の真の率が8割ならば、そこから2~10個を取り出したとき、すべて当たりが出る確率は、n=4までは最も大で、6からはその0.8倍に漸近する.つまりn=4まではすべて当たりになりやすい.例えば、観察したgのうち、N=4までのものは率を0.8に固定し、同様に低率なgの率を0.2に固定してみるなど.この補正は率差に影響する、バックグラウンドの不均一さを均すことにも使える.


・[微加減調整]BGは一様になっていた方が好ましい.t以外の小Nの発生数を 0.5~1 動かして発生率を均す.さらに、確率1や0を避けるため上で考えたように僅かな数を加減する.その後、率差をみるとt、m、p、sでSEが狭まる.


 

        t        m        p         s
            元データと ”小Nの発生数補正” の率差


 m、pの平均は0近くあると期待しているが、飛びぬけてしまっていた小さなNを含むペアの値が、収まるかのようになる.t、mは、大Nなペアが因子の多面性を残すようだ.


[抑制因子の効果]
 上の方法は、BGを均し小Nの影響を減らした後の、より、ましな値を得ることができる.sの率差による抑制性は平均 -0.09 とわかる.

×

非ログインユーザーとして返信する