小数gの率問題、BG補正から 抑制性算出
■ N=3のgでは、Y1からID1個が振れるだけで率33%が動く.少数例で率が振れるのは困る.対処法を考える.
まず、曝露状況の違うgが示す率は、どうなっているか.扱うデータでは、Nが小さいgで、率が1か0に分かれている.
この値はそのまま解釈していいのか.小数例であるがために両極化しているだけなのではないか.超幾何関数を引っぱり出す.
dhyper( x , 212 ,265-212 , max(x) ) による分布
x=2,4,6,8,10
ある集団の真の率が8割ならば、そこから2~10個を取り出したとき、すべて当たりが出る確率は、n=4までは最も大で、6からはその0.8倍に漸近する.つまりn=4まではすべて当たりになりやすい.例えば、観察したgのうち、N=4までのものは率を0.8に固定し、同様に低率なgの率を0.2に固定してみるなど.この補正は率差に影響する、バックグラウンドの不均一さを均すことにも使える.
・[微加減調整]BGは一様になっていた方が好ましい.t以外の小Nの発生数を 0.5~1 動かして発生率を均す.さらに、確率1や0を避けるため上で考えたように僅かな数を加減する.その後、率差をみるとt、m、p、sでSEが狭まる.
t m p s
元データと ”小Nの発生数補正” の率差
m、pの平均は0近くあると期待しているが、飛びぬけてしまっていた小さなNを含むペアの値が、収まるかのようになる.t、mは、大Nなペアが因子の多面性を残すようだ.
[抑制因子の効果]
上の方法は、BGを均し小Nの影響を減らした後の、より、ましな値を得ることができる.sの率差による抑制性は平均 -0.09 とわかる.