ここ10年ちまちまロングテールをいじっていましたが、最近ニコ動の800万本の動画データを使って、ついに
再生数視点の規模別合計を作ることができました。
残るは究極の問い、どうしてそのような分布が発生するのかと言う問題。たとえば、このグラフ、事業所従業者数の順位分布は、
ほぼ完璧なべき乗則です。なぜこうなるのか。どういう作用が働けばこうなるのか。それが最初にして最大の問題でした。
一応こんな風にやってみようかというのはあるんですけど、具体的に書けていません。
そしたら、今までwikipedia+αなくらいしか知らなかった複雑ネットワークの話を改めて読んでみたら、まずはこっちでなにかできそうな感じがしました。
理想状態での複雑ネットワークを考える 事業所従業者数の順位分布みたいなのは、複雑ネットワークみたいに口コミとかとかあるわけではないですが、べき乗則を取っています。なにかいろんな力が働き続けた結果としての分布です。
複雑ネットワークでもそのような究極の状態があると仮定します。もし、ツイッターのような場で参加者全員が全てのユーザーを知ったとしても、全員をフォローするわけではありません。ある基準でフォローするかしないかを決めます。つまりフォローする人数は一部です。その状態でもたくさんフォローされる人されない人が出てくるはずです。そのフォローするしないの基準を決め、全員が全員を見てフォロしたりしなかったりすることで、「スケールフリー性」「スモールワールド性」「クラスター性」を有する複雑ネットワークが作れるかというのが、最初の課題です。
共感によるフォローの決定
そこで次のようなフォロー基準を考えます。
各参加者は、ニッチ度 c (正の整数)と、内部状態 i (正の整数)を持つ。参加者 s は、次の共感条件を満たすとき参加者 t をフォローする。
i_t mod c_t = i_s mod c_t
つまり、自分と相手の情報 i を相手のニッチ度 c で割った余りが一緒だったらフォローします。
今、参加者 n (n = 1 〜 N) がいるとします。各参加者のニッチ度 c_n は、
c_n = n + 1、
内部情報 i_n は、Nより充分大きな乱数とします。
この状態で、各参加者が全ての参加者との共感条件を調べ満たすものはフォローした飽和状態のネットワークを考えます。
まず、「スケールフリー性」は自明です。参加者 n は n+1のニッチ度を持ち、つまりおおむね N/(n+1)の人と余りが一致してフォローされます。したがって順位 r とフォロー数つまり次数 d との関係は、
d = 1/(r+1) ≒ 1/r
となり、これはべき乗則です。なお、c_n = n + 1 と +1 しているのは、参加者1のニッチ度を1にすると全員からフォローされてしまうため、参加者1のニッチ度は2とし、半分の人からフォローされるようにするためです。
「スモールワールド性」「クラスター性」ですが、計算で出せるか分からないので、とりあえずcytoscapeで解析しました。
ノード10個(エッジ数29)

ノード100個(エッジ数489)

ノード1000個(エッジ数7549)

ノード10000個(エッジ数97673)

characteristic path lenth はノードが10倍になるごとに1程度増えているので、スモールワールド性は満たしていていそうです。ちょっと値が大きい気がしますが、有向グラフなのでこんなもんでいいのでしょうか。
「クラスター性」はこれで充分大きいと言えるのか、小さすぎるのか良く分かりません。今後の課題です。
伝搬によるネットワーク形成
以上、共感を定義することで、理想の状態、つまり相手に共感するか全員が全員を見られる場合では複雑ネットワークができることを見てきました。
しかし、現実でそのようなことはできません。各参加者はなにかの機会によってごく限られた参加者のみと接触し、共感する相手にフォローをしていきます。
なにか、伝搬の仕組みを作ることで、やはり複雑ネットワークになるのか、検討しました。まず、参加者を一人参加させます。
そして伝搬には次の3つを考えました。
1. 近隣: 参加者番号の近い参加者同士は物理的に近くにいるとし、既にネットワークに加わっている参加者は近くにいる参加者に共感してくれるかをランダムに依頼します。
2. ランダム: ネットワークに加わっている参加者はランダムに参加者を選び共感してくれるかをランダムに依頼します。検索などで遭遇するような場面を想定しています。
3. リンク先のチェック: ネットワークに加わっている参加者は、自分がフォローしている参加者がフォローしている参加者について、共感するかをチェックします。
これらの伝搬を繰り返し、ネットワークが広がるかを調べました。
飽和ネットワークでこのような結果が出るエッジ数5817の系に対して(上記と違うのは、ニッチ度の生成関数などをいろいろ変えているためです)、


伝搬によってネットワークを生成したところ、エッジ数4819の次のようなネットワークができました。

飽和状態には到達していないものの、複雑ネットワークとしての性質を持つものができました。
ただし今のところランダムによる成長が主流で、それならできるのは当たり前の気がするので、ランダムに頼らない伝搬モデルがあるのかが気になるところです。
以上、共感条件を定義することで、複雑ネットワークが形成できること、また一つの起点から複雑ネットワークを成長させることができることを示しました。
posted by 産業創出ネットワーク at 22:29
|
記事
|

|