Preserving Personalized Pagerank in Subgraphs

「Preserving Personalized Pagerank in Subgraphs」の編集履歴(バックアップ)一覧はこちら

Preserving Personalized Pagerank in Subgraphs」(2016/12/12 (月) 19:22:33) の最新版変更点

追加された行は緑色になります。

削除された行は赤色になります。

* Preserving Personalized Pagerank in Subgraphs - Andrea Vattani, Deepayan Chakrabarti, Maxim Gurevich - ICML 2011 * 概要 - 既存のグラフサンプリングは、Sを計算して、G[S]を出力 -- 局所的な指標は良いけど、大域的な指標は駄目 -- S={u,v}だと、N(u)∩N(u)が大きくても、微妙になる - 辺を弄ってPPRを保持する問題 -- SINKを足すと上手く行く -- 密になるので疎化 * 問題定式化と提案手法 - 入力: $$ G=(V,w_G), S \subseteq V $$ - 出力: $$ H=(S,w_H) $$ - 目標: $$ \pi_i^H(j) = \pi_i^H(j) \forall i, j \in S $$ -- ※クラシカルにはH=G[S]で、PPRの値の差の最小化だが、これはNP-hard - 問題: (Gによっては)そんなHを作れないことがある - 解決法: SINKを作る - アルゴリズムNodeRemoval ++ V-Sの頂点zを(適当な順で)削除 ++ $$ x, y \in N(z) $$について ++ $$ w_H(x,y), w_H(x, \mathsc{sink}) $$を割り当てる - 利点: 厳密にPPRを保持する - 欠点: Sが小さい時に辺数がやばお - 解決法: 疎化 - Weighted: wH(u,v)<τなら、(u,v)を消して(u,SINK)に割り振る -- 理論的保証: 平均絶対誤差=O(τ)くらい - Unweighted: Weightedの結果の重みを無くす - グローバルPageRankの保持…SOURCEを作って頑張る(省略) * 実験 - 頂点部分集合Sの選択は[[Sampling from Large Graphs]]の5手法 - G[S]とUnweightedとWeightedを比較 -- NodeRemovalしただけの結果(疎化してない)は誤差=0なので無い - なんかいい感じらしいです? * まとめ - そこそこ良さそう? - 辺重みを自由に変えられるので自由度が高そう - 誤差がτなのは良いか分からん -- τ毎の辺数・誤差の実験結果が欲しいですぅ &tags() 2016/12/12
* Preserving Personalized Pagerank in Subgraphs - Andrea Vattani, Deepayan Chakrabarti, Maxim Gurevich - ICML 2011 * 概要 - 既存のグラフサンプリングは、Sを計算して、G[S]を出力 -- 局所的な指標は良いけど、大域的な指標は駄目 -- S={u,v}だと、N(u)∩N(u)が大きくても、微妙になる - 辺を弄ってPPRを保持する問題 -- SINKを足すと上手く行く -- 密になるので疎化 * 問題定式化と提案手法 - 入力: $$ G=(V,w_G), S \subseteq V $$ - 出力: $$ H=(S,w_H) $$ - 目標: $$ \pi_i^H(j) = \pi_i^H(j) \forall i, j \in S $$ -- ※クラシカルにはH=G[S]で、PPRの値の差の最小化だが、これはNP-hard - 問題: (Gによっては)そんなHを作れないことがある - 解決法: SINKを作る - アルゴリズムNodeRemoval ++ V-Sの頂点zを(適当な順で)削除 ++ $$ x, y \in N(z) $$について ++ $$ w_H(x,y), w_H(x, \mathrm{sink}) $$を割り当てる - 利点: 厳密にPPRを保持する - 欠点: Sが小さい時に辺数がやばお - 解決法: 疎化 - Weighted: wH(u,v)<τなら、(u,v)を消して(u,SINK)に割り振る -- 理論的保証: 平均絶対誤差=O(τ)くらい - Unweighted: Weightedの結果の重みを無くす - グローバルPageRankの保持…SOURCEを作って頑張る(省略) * 実験 - 頂点部分集合Sの選択は[[Sampling from Large Graphs]]の5手法 - G[S]とUnweightedとWeightedを比較 -- NodeRemovalしただけの結果(疎化してない)は誤差=0なので無い - なんかいい感じらしいです? * まとめ - そこそこ良さそう? - 辺重みを自由に変えられるので自由度が高そう - 誤差がτなのは良いか分からん -- τ毎の辺数・誤差の実験結果が欲しいですぅ &tags() 2016/12/12

表示オプション

横に並べて表示:
変化行の前後のみ表示: