スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

DVDの類似性関係を可視化して解析

前回まで、アマゾンを利用してエロゲーの類似性関係を可視化し、ネットワークがスケールフリー性とスモールワールド性を満たすことを確認しました。それでは、別の商品カテゴリの関係はどのようになっているのでしょうか。まずは、アマゾンが取り扱っているDVDの商品群を調べてみましょう。

前回までのあらすじ

DVDカテゴリ以下にある、次の4つのジャンルに関して、前回同様の解析を行ってみます。
  1. アニメDVD:BrowseNodeId=562020
  2. 日本映画DVD:BrowseNodeId=562014
  3. 外国映画DVD:BrowseNodeId=562016
  4. お笑いDVD:BrowseNodeId=12842371

早速、結果を見ていきましょう。まずは、次数分布からです。

DVD_degree_distribution.png

どのジャンルも、高次数側でべき乗則が成り立っています。しかし、指数γは3から5までの異なった値をとるようです。アニメDVDのγが約5と最も高く、続いてお笑いDVDのγ~4、日本映画と外国映画のγ~3と続きます。実は、日本映画と外国映画の次数分布は、高次数側のγが一致するだけでなく、低次数側の挙動も一致します。

γの違いは何を表しているのでしょうか。これを知るためには可視化が役に立ちます。続いて、各ネットワークを可視化したものを見ていきましょう。可視化に用いたソフトウェアは以前と同じくCytoscape、レイアウトはこれも同様にSpring Embeddedを用いました。

外国映画DVD
foreignmoveiDVD_visualize.png

日本映画DVD
jpmovieDVD_visualize.png

お笑いDVD
owaraiDVD_visualize.png

アニメDVD
animeDVD_visualize.png

画像を見れば一目瞭然ですね。外国映画のネットワークでは、大多数のノードが最大の部分グラフ(毛玉みたいなの)に属しています。それに対して、小さな部分グラフの数はあまり多くありません。外国映画→日本映画→お笑い→アニメの順で、最大の部分グラフは次第に疎になり、かわりに細かい部分グラフの数が増加します。実は、この順番で、指数γも増加しています。

小さな部分グラフの数が大きいことと、γが大きい値を取ることには関連があります。部分グラフ内の次数はたかだか部分グラフのノード数にしかなりません。ネットワークが小さい部分グラフに分割されればされるほど、複数のクラスタ間にエッジをもつ次数の高いノードは姿を消し、エッジのやりとりを部分グラフの中だけで完結してしまう次数の低いノードが増えていきます。これはすなわち、ネットワークが分割されるほど、次数分布の曲線が急になり、指数γが増加するということを意味しています。

それでは、なぜアニメDVDやお笑いDVDは小さな部分グラフに分割されているのでしょうか。これも、可視化によりすぐわかります。各ノードのタイトルを見えるようにして、グラフを拡大してみましょう。

お笑いDVD
owaraiDVD_zoom.png
アニメDVD
animeDVD_zoom.png

小さなサブグラフは、同一タイトルのシリーズもので構成されていました。要するにこれは、DVDを買ったら全巻そろえる人が多い、というようなニュアンスを意味しているわけです。1巻完結ではなく、シリーズものだとこういう傾向が出るのでしょうね。実際、シリーズをそろえることに意味のあるジャンル、たとえば少年漫画などでも同様の傾向は確認できました。

コメントの投稿

非公開コメント

プロフィール

null

Author:null
二次元眼鏡少女に蔑まれたいです。

最近の記事
最近のコメント
最近のトラックバック
タグ

考察 統計 ネット 複雑ネットワーク 自然科学 二次元 幼女 エロゲー ネタ アニメ 百合 時事ネタ 計算 igraph R 

月別アーカイブ
カテゴリー
あわせて読みたい
あわせて読みたいブログパーツ
ブログ内検索
カレンダー
08 | 2017/09 | 10
- - - - - 1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
RSSフィード
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。