Outward Influence and Cascade Size Estimation in Billion-scale Networks]]
-
Hung T. Nguyen, Tri P. Nguyen, Tam N. Vu, Thang N. Dinh
-
SIGMETRICS 2017 (会議)
-
Proceedings of the ACM on Measurement and Analysis of Computing Systems 2017 (ジャーナル)
概要
-
影響力推定の新しい指標outward influenceを作ったよ!…E[拡散サイズ]-|シードサイズ|
-
高速アルゴリズムを作ったよ
定義・性質・予備知識
-
outward influenceの定義:$$ I_{o}(S) = I(S)-|S| $$
-
常に$$X_i \leq b$$なら、$$ O(\frac{1}{\epsilon^2} \ln (\frac{2}{\delta}) \frac{b}{\mu_X}) $$回のサンプリングでいつもの近似を達成できる
-
outwardは$$ \mu_X \approx 0 $$な時があり、やばお
アルゴリズム
importance sampling
-
Sの出近傍 $$\ell$$ 頂点を(適当に)順序付け
-
$$A_i = ``v_1, \ldots, v_{i-1}までは失敗、v_iで成功 ''$$
-
$$A_i$$同士は互いに素
-
$$ A_{\ell+1} $$は全てが失敗
-
$$ A_1,\ldots,A_\ell $$で正規化して確率的に選ぶ
-
$$ v_{i+1},\ldots,v_{\ell} $$は改めてサンプリング
-
普通にサンプリング
更に効率化
-
$$\mathcal{AA}$$アルゴリズム [Dagum-Karp-Luby-Ross. SICOMP'00]を適用
-
"a technical error in its proof"とか言っているけどホントか?
-
サンプリング列が2つ必要らしい
-
最終的に計算時間が複雑だけど、$$ O(\frac{n \log(2/\delta)}{\epsilon^2}) $$らしい…
実験
-
比較手法:Monte-Carlo、KDD'15
-
辺確率:1/入次数、定数(0.1, 0.01, 0.001)
-
相対誤差の分布を見てみる(0で一致)
-
0でspikeしてかなりいい感じ
-
oO(outward influenceならまぁそうだなぁという感じ)
-
influence spreadも見てみる
まとめ
-
importance samplingはまぁ悪くない
-
$$\mathcal{AA}$$アルゴリズムの部分は謎
-
実際に追実験しないと何とも言えない…
SIGMETRICS 影響拡散 影響最大化
2017/10/01
最終更新:2017年10月01日 17:02