スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

エロゲー類似性ネットワークを複雑ネットワークで解析してみた

今回のネタは、前回作成したエロゲーどうしの類似性グラフに対して、複雑ネットワークの手法で解析してみようというもの。まあ、ぶっちゃけよくあるやつです。もしかすると誰かが既に同じことをやってるかもしれませんが、気にしない。

前回はこちら:エロゲーの類似性関係を可視化してみた
前回作ったネットワークの可視化画像はこれ。
eroge_graph090204.png

スケールフリーネットワーク

複雑ネットワークの解析の定石として、次数の分布を調べてみます。横軸に次数k、縦軸に次数分布P(k)(ある次数kを持つノードの数)をとり、両対数プロットしてみます。得られたのが次の図になります。
eroge_graph_digree_dist.png
プロットされた緑色の点は、(大きくばらついていますが)グラフ上で赤線で示した直線上に乗っています。両対数グラフ上で直線に乗るということは、
P(k)~k
のように、べき乗で表されることを意味しています。

このように、次数分布が次数のべき乗に比例するような振る舞いのことを、特徴的な次数の大きさの欠如ということに由来して「スケールフリー性」と呼ぶようです。自然界に存在するいろいろなネットワークではこのスケールフリー性が見つかっているようですが、エロゲーの類似性ネットワークにも(予想通り?)スケールフリー性が見出されました。

ここで、ネットワークを特徴づける量として、指数γに着目してみます。ふたたび上図に戻ると、赤線はk-2に比例した直線であることがわかります。すなわち、今回の結果では、γ~2となります。

参考文献1によれば、BarabasiとAlbertが最初に提案したモデルでは、γ=3という結果になったようです。このモデルは、新たに生まれたノードは、既存のノードと、その次数に比例した確率でエッジを形成するというものです。これをエロゲーの類似性グラフにあてはめると、「人気のあるゲームならどんなジャンルでもいいから構わず買う無節操な購買者」像が見えてきます。

もちろん、エロゲーのように極度に嗜好性の高い商品では、このようなことは無いでしょう。(姪少女とかが大好きな人が、お母さんは俺専用を嬉々として買うというのは、ちょっと考えにくいですよね)このように、エロゲーの嗜好性の高さは、特定のノードへのエッジの集中を緩和する働きがあると考えられます。その結果、次数分布はBarabasi-Albertが予言するものよりもなだらかになり、指数が3ではなく2となるのではないでしょうか。

むろん、参考文献1にはγ=2となるモデルも紹介されていますが、あえてもっとも単純なBarabasi-Albertモデルとの比較という形で議論しました。

スモールワールド
多くの複雑ネットワークが示す特徴の一つに、スモールワールド性というものがあります。これは、文字通り、ノードどうしの世界は小さい、ということです。もうちょっと厳密に言うと、
  • 大きいノード数のわりに短い「平均最短距離」
  • 大きいノード数のわりに大きい「クラスタリング係数」
という二つの要素から構成されています。

平均最短距離とは、あるノードと別のノードの最短距離を、すべてのノードについて平均したものです。このネットワークでは、平均最短距離は11.03でした。つまり、適当に二つのノードを選んだとき、平均11本のエッジを経由すれば、二つのノードを行き来できるということを意味しています。ノードが4000個もあるわりには、意外と短い距離で繋がっているというのが「スモールワールド」という言葉の含むところです。

クラスタリング係数というのは、友人関係のネットワークにおいて「私の友達AさんとBさんが、実は友達同士だった」確率のようなものです。友達と別の友達がこれまた友達同士だということは、それだけ自分のまわりの友人関係ががっちりとクラスターを形成していることを意味しています。今回のネットワークでは、クラスタリング係数の値は0.11でした。もしネットワークがランダムであれば、もっともっと小さい値になるはずです。


エロゲーの類似性関係ネットワークは、スモールワールド性も満たしていることがわかりました。すなわち、このネットワークは、複雑ネットワークと呼ばれる特性を満たしています。これは果たして意外なことでしょうか。いえ、そうではないでしょう。むしろ必然的に複雑ネットワークを形成していると言うべきでしょう。Barabasi-Albertの提唱したモデルは、
  1. 成長するネットワーク
  2. 新たなノードは次数の高いノードに対して優先的にエッジをはる
という二つの要素によって、ネットワークがスケールフリー性を獲得することを示しました。
エロゲー類似性ネットワークに対しては、次のような特徴があるでしょう。エロゲーは毎週発売されるので、その都度ネットワークに新たなノードが追加されます。さらに、次数の高いノードは暗にゲームの人気を示していますので、新たなノードは次数の高い≒人気の高いノードとエッジをつくる可能性が高いでしょう。これらは、BAモデルに類似したネットワークの成長機構と言えます。さらに、エロゲーの嗜好性の高さから、ノード同士のクラスタリング係数も高まるでしょう。

参考文献
  1. Albert, R., and A.-L. Barabási, 2002, Rev. Mod. Phys. 74, 47.
  2. 新ネットワーク思考—世界のしくみを読み解く
……なので、最新の動向は知りません。。

続きはこちら。
DVDの類似性関係を可視化して解析
平均最短距離・クラスタリング係数の大小を論ずるためには、ノード数以外に平均次数も必要です。これ以上書いても論文なぞってるだけで意味が無いので、参考文献1をご覧になってください。ちなみに今回の平均次数は6.58でした。

まあ、ネットワーク抽出の段階で、ウェブサービスの制限に起因する恣意性が入り込んでしまってるので、この結果は単なるアーティファクトに過ぎない、のかもしれません。。。。が、正直よくわかりません。

べき乗に関しては、たった1桁でべき乗気取りかよpgrってツッコミはスルーの方針で。。。

コメントの投稿

非公開コメント

プロフィール

null

Author:null
二次元眼鏡少女に蔑まれたいです。

最近の記事
最近のコメント
最近のトラックバック
タグ

考察 統計 ネット 複雑ネットワーク 自然科学 二次元 幼女 エロゲー ネタ アニメ 百合 時事ネタ 計算 igraph R 

月別アーカイブ
カテゴリー
あわせて読みたい
あわせて読みたいブログパーツ
ブログ内検索
カレンダー
05 | 2017/06 | 07
- - - - 1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 -
RSSフィード
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。