スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

ロリエロゲーヒロインの体格を分析する

百合アニメの夏もそろそろ終わりです。というわけで、そろそろ通常営業に戻ろうかと思います。
#かなめも感想は最終回後に一気に。しかしまあ……うーん。

今回はこういうタイトルのお話です。このタイトルに嫌悪感を抱く方、アグネスに賛同される方、そもそも何を言っているのかわからねえ、という方は、本記事に生理的嫌悪感を抱くかもしれません。速やかに別のサイトに移動されることをお勧めいたします。

ということで、ロリゲーヒロインの身長・体重データで遊んでみようと思います。創作物の登場人物の身体データなど、アイドルのそれと同程度の無意味さしか持ちません。しかし、ことロリえろげーに関してはそうではありません。なぜなら、身体スペックと、とある重要なパラメータに強い相関があるためです。よって、架空のキャラクターの身体スペックを論じることに意味が出てきます。

ヒロインのスペックデータは、以下のサイトに掲載されているデータを拝借しました。2005年までしかないのですけど、それ以降は商業ロリゲの弾数が著しく落ちていますので、気にしないことにします。このサイトから、ヒロインの身長・体重のデータを取得し、グラフにプロットします。
ロリータ総合スレッド 保管庫

さらに、以下のサイトから身長・体重のデータを取得し、これもプロットします。
平成20年度学校保健統計調査:文部科学省

以下のグラフをご覧ください。横軸に身長、縦軸に体重をとり、赤点でロリゲーヒロインのスペックをプロットしてあります。緑色のラインについては、お察しください。グラフに書き込まれた緑色の数字は、たぶん好きな数字だと思います。

背景のグラデーションは景気づけ程度のものでして、別に私のストライクゾーンとかそういう意味合いがあるわけではありません。たぶん。
lolichr.png
この図を見ると、色々なことがわかってきます。
まず、ばらけてはいますが、赤い点が緑のラインの周囲に集まっていることがわかります。これは、ヒロインのスペックがまったくの出鱈目に決められたわけではなく、実際のデータを参考にした上で決定されたことを示唆しています。

緑のラインにほぼ乗るような点もあります。たとえば、好きな数字5の近くにある点は、おやつのじかん(リンク先18禁)のプリンたん(リンク先18禁)です。プレイした当時は何とも思わなかったのですけれど、もしプリンたんのスペックが緑のラインを元に決められていたとしたら、スタッフは相当の変態ですね。

続いて、赤い点の多くは、緑色のラインの下側にあることがわかります。これは、ヒロインが、平均よりは痩せているということを意味しています。よもや、こういう解析をするプレイヤーがざらにいるとは思えませんから、これは製作スタッフが、ぽっちゃり型より痩せ型の幼女が好きだということを意味しているのではないでしょうか。

ロリゲーヒロインの痩せ太りをもう少し定量的に論じましょう。通常、この手の体格を論じるときには、BMIを用います。しかし、今回はBMIの適用は不適切です。BMIの代わりに、ローレル指数を用いることにします。なぜBMIでなくローレル指数かは、上記リンクをご覧いただければ。

ローレル指数は、
ローレル指数r=体重(kg)/(身長(cm))3×107
で定義され、130±15程度が標準体型、130±30を越えると、太りすぎあるいは痩せすぎであると言われます。これを用いて、ロリゲーヒロインの痩せ太りを調べてみましょう。

先ほどのデータに加えて、ローレル指数rが、160(太りすぎ),145(やや太り),130(標準体型),115(やや痩せ),110(痩せすぎ)の場合の曲線をプロットします。
rohrer.png
まずわかるのが、ローレル指数が130の場合、標準体型を示す曲線と、緑のお察し下さいな曲線が大まかに一致することです。つまり、ローレル指数が実在の体格をよく記述できているということになります。

ロリゲーヒロインのローレル指数がどの程度になるかを見てみます。多くのヒロインは、ローレル指数が115から145の間、標準体型とされる範囲に入っています。ほとんどのデータが痩せ側に入っているのは、まあご愛嬌です。続いて、ローレル指数が100から115の間、痩せすぎから痩せぎみの標準体型の間にも多くのヒロインがいます。すらりとしたスレンダーなヒロインが好きなのですね、私も大好きです。

ところが、驚くべきことに、ローレル指数が100以下、痩せすぎのヒロインはほとんどいません。肋骨が浮き出て見えるような、病的なまでに痩せたヒロインはほとんど存在しないということになると言えます。こういう属性持ちの人は少なからず存在します。メーカー側が、彼らへのアプローチを怠ったということなのでしょうか。今から思えば、どうにも納得しがたいことのように思えます。ヒロインの範囲を成年女性にまで広げれば、ガリガリのキャラもいるのかもしれません。……あ、エロゲーヒロインはみんな18歳以上ですけどね。

標準より太りぎみ、ローレル指数が130以上のヒロインに目を向けてみましょう。データをよく見てみると、ほとんどの太りぎみヒロインは、年r好きな数字が9以下であることがわかります。好きな数字一桁台のキャラは、ちょっとくらいふくよかなほうが可愛い、言い換えれば、ぷに萌え。ということでしょう。

図からわかったことをまとめると、以下の2点に尽きるでしょう。
  • 少女は、スレンダー。
  • 幼女は、ぷに。

これらは、当時の製作スタッフの嗜好であるかもしれません。しかし、このデータが商業エロゲーのヒロインのものであることを考えると、製作スタッフは、ロリゲーユーザーの嗜好をヒロインのスペックとして反映させたに過ぎないとも言えるでしょう。

結論はありきたりというか自明でした。しかし、データから垣間見えてくる2次ロリスキーたちの嗜好ということで、これはこれで趣きがあるような気がします。

続きを読む

スポンサーサイト

エロゲー類似性ネットワークを複雑ネットワークで解析してみた

今回のネタは、前回作成したエロゲーどうしの類似性グラフに対して、複雑ネットワークの手法で解析してみようというもの。まあ、ぶっちゃけよくあるやつです。もしかすると誰かが既に同じことをやってるかもしれませんが、気にしない。

前回はこちら:エロゲーの類似性関係を可視化してみた
前回作ったネットワークの可視化画像はこれ。
eroge_graph090204.png

スケールフリーネットワーク

複雑ネットワークの解析の定石として、次数の分布を調べてみます。横軸に次数k、縦軸に次数分布P(k)(ある次数kを持つノードの数)をとり、両対数プロットしてみます。得られたのが次の図になります。
eroge_graph_digree_dist.png
プロットされた緑色の点は、(大きくばらついていますが)グラフ上で赤線で示した直線上に乗っています。両対数グラフ上で直線に乗るということは、
P(k)~k
のように、べき乗で表されることを意味しています。

このように、次数分布が次数のべき乗に比例するような振る舞いのことを、特徴的な次数の大きさの欠如ということに由来して「スケールフリー性」と呼ぶようです。自然界に存在するいろいろなネットワークではこのスケールフリー性が見つかっているようですが、エロゲーの類似性ネットワークにも(予想通り?)スケールフリー性が見出されました。

ここで、ネットワークを特徴づける量として、指数γに着目してみます。ふたたび上図に戻ると、赤線はk-2に比例した直線であることがわかります。すなわち、今回の結果では、γ~2となります。

参考文献1によれば、BarabasiとAlbertが最初に提案したモデルでは、γ=3という結果になったようです。このモデルは、新たに生まれたノードは、既存のノードと、その次数に比例した確率でエッジを形成するというものです。これをエロゲーの類似性グラフにあてはめると、「人気のあるゲームならどんなジャンルでもいいから構わず買う無節操な購買者」像が見えてきます。

もちろん、エロゲーのように極度に嗜好性の高い商品では、このようなことは無いでしょう。(姪少女とかが大好きな人が、お母さんは俺専用を嬉々として買うというのは、ちょっと考えにくいですよね)このように、エロゲーの嗜好性の高さは、特定のノードへのエッジの集中を緩和する働きがあると考えられます。その結果、次数分布はBarabasi-Albertが予言するものよりもなだらかになり、指数が3ではなく2となるのではないでしょうか。

むろん、参考文献1にはγ=2となるモデルも紹介されていますが、あえてもっとも単純なBarabasi-Albertモデルとの比較という形で議論しました。

スモールワールド
多くの複雑ネットワークが示す特徴の一つに、スモールワールド性というものがあります。これは、文字通り、ノードどうしの世界は小さい、ということです。もうちょっと厳密に言うと、
  • 大きいノード数のわりに短い「平均最短距離」
  • 大きいノード数のわりに大きい「クラスタリング係数」
という二つの要素から構成されています。

平均最短距離とは、あるノードと別のノードの最短距離を、すべてのノードについて平均したものです。このネットワークでは、平均最短距離は11.03でした。つまり、適当に二つのノードを選んだとき、平均11本のエッジを経由すれば、二つのノードを行き来できるということを意味しています。ノードが4000個もあるわりには、意外と短い距離で繋がっているというのが「スモールワールド」という言葉の含むところです。

クラスタリング係数というのは、友人関係のネットワークにおいて「私の友達AさんとBさんが、実は友達同士だった」確率のようなものです。友達と別の友達がこれまた友達同士だということは、それだけ自分のまわりの友人関係ががっちりとクラスターを形成していることを意味しています。今回のネットワークでは、クラスタリング係数の値は0.11でした。もしネットワークがランダムであれば、もっともっと小さい値になるはずです。


エロゲーの類似性関係ネットワークは、スモールワールド性も満たしていることがわかりました。すなわち、このネットワークは、複雑ネットワークと呼ばれる特性を満たしています。これは果たして意外なことでしょうか。いえ、そうではないでしょう。むしろ必然的に複雑ネットワークを形成していると言うべきでしょう。Barabasi-Albertの提唱したモデルは、
  1. 成長するネットワーク
  2. 新たなノードは次数の高いノードに対して優先的にエッジをはる
という二つの要素によって、ネットワークがスケールフリー性を獲得することを示しました。
エロゲー類似性ネットワークに対しては、次のような特徴があるでしょう。エロゲーは毎週発売されるので、その都度ネットワークに新たなノードが追加されます。さらに、次数の高いノードは暗にゲームの人気を示していますので、新たなノードは次数の高い≒人気の高いノードとエッジをつくる可能性が高いでしょう。これらは、BAモデルに類似したネットワークの成長機構と言えます。さらに、エロゲーの嗜好性の高さから、ノード同士のクラスタリング係数も高まるでしょう。

参考文献
  1. Albert, R., and A.-L. Barabási, 2002, Rev. Mod. Phys. 74, 47.
  2. 新ネットワーク思考—世界のしくみを読み解く
……なので、最新の動向は知りません。。

続きはこちら。
DVDの類似性関係を可視化して解析

続きを読む

エロゲーの類似性関係を可視化してみた

eroge_graph090204.png

アマゾンでエロゲーの類似性関係を垣間見る
この商品を買った人はこんな商品も買っています

アマゾンで買い物をしていると、「この商品を買った人はこんな商品も買っています」というメッセージが表示されます。たとえば、名作百合ゲー「カタハネ:注:18禁」のページでは、以下のようになります。

ここで推薦されている作品は、みな百合ジャンルの作品です。ある百合作品を買う人は、他の百合作品も買っている、ということです。ということは、「この商品を~」リストに提示された商品は、もとの商品と類似性が強いということができるのではないでしょうか。

ある商品について、それに類似した商品、にさらに類似した商品、のこれまた類似した商品…というように、似たものどうしのネットワークをどんどん広げていくことができます。このネットワークを広げていくと、全商品の間の類似性の関係を知ることができます。今回のネタは、似た商品どうしのネットワークを俯瞰し、図示してみよう、というものです。

グラフ理論をつかってみる

商品どうしの類似性を記述するために、グラフ理論を使います。グラフ理論は、モノとその間の関係を記述するのに適した手法です。以下、用語についてちょっと説明。グラフ理論では、ノードとエッジという考え方でモノとモノの関係性を記述します。今回の例では、ノードは商品、エッジは商品どうしの関連性に該当します。
graph.png
たとえば、カタハネを買った人が百合姫Sを買った場合、カタハネノードから百合姫Sノードに矢印を引くことで、エッジを表現します。さらに、両者からflower*flowerにエッジが伸びています。
各ノードに入ってくるエッジの数(or 各ノードから出て行くエッジの数 or その両方)をノードの次数と言います。今回の解析では、ノードから出て行くエッジの数に意味は無いので、ノードに入ってくるエッジを次数とします。この例では、カタハネ、百合姫S、flower*flowerの次数はそれぞれ0,1,2です。

可視化してみる

さて、それでは、アマゾンのデータを使って、類似性をグラフ化・可視化します。すべての商品についてグラフ化ができればいいのですが、残念ながら私の技量では不可能です。ですので、ある限定したカテゴリの中での商品どうしの類似性を可視化します。手始めに、アダルトゲーム、要するにエロゲの関連性について見てみましょう。

可視化されたグラフを示します。ノードは青から赤まで色分けされた円で示されています。次数が大きいほど、円の大きさも大きくなるようになっています。エッジは水色の線で表されています。結果は、巨大な一つの大陸(毛玉?)と、細々とした小さな島の形であらわされました。ノード数3999、エッジ数13158でした。

エロゲー類似性グラフ

これだけだと、なんだこの毛玉は、だけで終わってしまうので、大陸のどこにどのようなジャンルが存在しているかを図示していきましょう。

まずは、右上に存在する島。これだけが他の大陸から孤立しているように見えます。これらは女性向けエロゲー(BL・乙女ゲー)が集まる島です。やはりというか、男性向けエロゲーからは距離が遠いようです(非連結になると思ってたのですが、リンクがあるというだけで驚きです)。また、よく見ると、島は二つあるように見えます。左が乙女ゲーの島、右がBLゲーの島のようです。

続いて、大陸の左側に目をやりますと、オレンジ色のノードが集中している箇所があります。ここには純愛ゲー・学園モノが集まっているようです。大陸の右側には、陵辱ゲームの集まる地域があります。この相対する二つのジャンルが大陸の正反対にあるということは、それぞれのジャンルの愛好者の重なりは少ないのでしょうか。

大陸の下側には、いわゆる抜きゲーが集まっているようです。若干驚いたのは、抜きゲー地域の右側には、どうも孕ませゲーが集まっている傾向があることです。孕ませ属性が、エロゲーの中で確固たる地位を獲得しているということでしょうか。

私にとって最大の驚きは、右下に熟女人妻(あと母親)モノが集合しており、なおかつ高い次数を持っているということでした。私はこれらの属性と全く無縁なので、驚きというか、正直、くらくらします。ちなみに、これらの属性と相対するロリえろげーの集まる地域はありませんでした。かの忌まわしき頭身規制に始まるロリゲーの凋落をまざまざと見せつけられたわけで、落ち込むことしきりです。

大陸の辺縁にある緑色の島は、低価格ゲームが集まる島のようです。大陸中央部には、アリスソフトのゲームや、シミュレーション・RPGが集まっているようでしたが、カテゴリ分けするには雑然としすぎていたので特に記入はしませんでした。

エロゲー類似性グラフ(注釈つき)


解析手法

グラフの構築
グラフを構築するためには、まずはAmazonから商品情報を取得しなければなりません。そのために、Amazon Associate Web Serviceを利用します。以下のようなURLにアクセスすると、商品情報を記載したXMLを取得できます。
http://ecs.amazonaws.jp/onca/xml?Service=AWSECommerceService&AWSAccessKeyId=[MY AWS KEY ID]&Operation=ItemSearch&BrowseNode=927712&SearchIndex=VideoGames&ResponseGroup=Large&Version=2008-08-19&ItemPage=1

これを用いて、以下の順で商品のIDとその関連商品のIDのリストを作成します。プログラムはperlを用いて書きました。
  1. エロゲーカテゴリー内で、AWSが許可している最大4000アイテムの商品情報を取得
  2. 商品ID(ASIN形式で指定されている)をノード、商品の類似性をエッジとして、作成されたリストからGML形式で有向グラフを書き出す
  3. 商品IDとその他関連情報(タイトル・ブランド・発売日etc、ノードの次数)をcsv形式で書き出す
ただし、関連商品に別カテゴリの商品が指定されていた場合(上の例で言えば、ゲームの関連商品が書籍だった場合)は、その関連商品を無視します。

可視化
可視化には、Cytoscapeを使用しました。Cytoscapeは、Javaベースのネットワーク可視化ソフトで、WinXPでもUbuntu Linuxでも問題なく動きます。さらに、今回のように高々4000ノード程度のネットワークなら苦もなく美しい画像を描画してくれます。また、開発者が日本人の方らしく、日本語対応も完璧です。もともと、バイオインフォマティクス用途のソフトであるようなので、私に縁のない単語が多用されていましたが、グラフを可視化する上での障害にはなりませんでした。

Cytoscapeの起動後、
  1. Import→Network(mulitple file types)でgmlファイルの読み込み
  2. Import→Attribute from Tableで、各ノードに属性を付加
  3. Layout→Cytoscape Layouts→Spring Embeddedでレイアウト
  4. VizMapperで、ノードのサイズをノードの次数に比例するように設定
の順に行い、可視化いっちょあがりです。Spring Embeddedは計算に時間がかかるので、最初はCircular Layoutとかのほうがいいかもです。

問題
AWSでは、最大4000アイテムしか取得することができません。これでは、全えろげーを網羅することができません。(どうも1万タイトル以上のえろげーがこの世には存在するようです)
また、さらに悲惨なことに、各アイテムに対して、最大5つの関連商品しか取得することができません。これでは、定量的な議論に耐えられるかどうかはなはだ不安です。
改善策はありますが、私のしょぼいプログラミング能力では実装に時間がかかりそうなので、しばらくは泣く泣くデータの取得をAWSのみに頼ろうと思います。

続きはこちら。
エロゲー類似性ネットワークを複雑ネットワークで解析してみた
プロフィール

null

Author:null
二次元眼鏡少女に蔑まれたいです。

最近の記事
最近のコメント
最近のトラックバック
タグ

考察 統計 ネット 複雑ネットワーク 自然科学 二次元 幼女 エロゲー ネタ アニメ 百合 時事ネタ 計算 igraph R 

月別アーカイブ
カテゴリー
あわせて読みたい
あわせて読みたいブログパーツ
ブログ内検索
カレンダー
06 | 2017/07 | 08
- - - - - - 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 - - - - -
RSSフィード
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。