スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

Google先生に聞く二次元属性の過去現在未来

二次元スキーな皆様は、誰しも心にお気に入りの属性を持っていることでしょう。心のおもむくままに自由に萌えていればいいのですけれど、ふと、自分の好きな属性はどれだけ人気があるのだろうか、と心配になることがあります。これがアニメだったりすると、例えば2chスレの進行度やpixivにアップロードされたCGの数を人気度の指標とすることが可能です。しかしながら、属性といった、なんだかふわふわしたものの人気を調べるにはどうすればいいでしょう。答えは、Big BrotherGoogle様にお伺いを立てればいいのです。というわけで今回は、Google insights for searchを使って、萌え系属性の人気の歴史を見てみようと思います。

#前回エントリで適当に流した話のブラッシュアップ版です。

調査方法

データの取得は、Google insights for searchを使用します。各検索ワードで検索をかけ、人気度の時系列をcsvファイルにて取得しました。調査は、以下の13項目について行いました。基本的に、各項目名を検索ワードとしてデータを取得しています。得られた数値は相対値になります。ですので、各項目毎での数値の絶対値を比較することは無意味です。また同様に、各属性の人気の絶対値を調べるつもりもありません。あくまで、各属性の人気の相対的な増減にのみ着目します。Google insights for searchでは、週単位でのデータを取得できますが、そのままでは若干ノイジーですので、5週の移動平均をとったものをプロットしました。

検索ワードをパラレルに設定することで、各ワード間のスケールを調べることは可能です。しかし、そういった市場調査的なー今何が人気なのかーといったことは、専門の人がもっとちゃんとした方法で調べているでしょうし、興味もないので割愛します。今回の私の興味は、あくまでも「眼鏡っ娘」「幼女」「百合」の属性の来し方行く末にのみあります。


服装・装飾編
  • メイド
  • ネコミミ
  • 巫女
  • ニーソ
  • スク水
  • 眼鏡っ娘

関係・シチュエーション編
  • 幼馴染み
  • ツンデレ
  • ヤンデレ
  • 男の娘
  • 寝取られ

調査困難だったけれどなんとか搦手から攻めてみた項目
  • 幼女
  • 百合


関係・シチュエーションに、妹とか姉とか後輩とか先輩とか(略)が入ってない理由は、これらの単語はあまりに一般的で、二次元に関係ない通常の用法まで引っ張ってきてしまい、今回の調査に対して意味のあるデータを返さないためです。検索ワードの工夫による分離が可能なのかもしれませんが、早々に諦めました。

同様に、幼女・百合も二次元と非二次元の分離が困難でした。しかし、これらの属性の行く末は私に取って死活問題でありますので、なんとか属性自体の人気を推定してみました。

調査結果:服装・装飾編
まずは、メイドからです。一頃は、ヲタといえばメイドという感じで、まさに二次元の象徴でした。今でも秋葉原ではメイドコスのお姉さんがチラシ配ってたりしますが。z軸がある時点でだめですけどね。ところが、データを見てみると、2005年中頃をピークに、メイドの人気度は減少傾向にあります。やっぱり、さすがに飽きられたのでしょうか。
gifs_maid.png
続いては、ネコミミです。これも、昔は大はやりで、メイドコスにネコミミカチューシャは定番でした(何の)。これも実際にデータを見てみますと、2004年10月頃に極めて大きなピークを持つものの(内挿図)、その後の人気度は減少し続け、ここ数年では横ばいです。2004年10月のピークはネコミミモードなんじゃないかと思いますがよくわかりません。ここでは、減少し続ける落ち目の属性であっても、完全に消え去るのではなく、ある一定の人気度に落ち着くケースとして解釈しておくことにします。
gifs_nkmm.png


次は、巫女を見てみましょう。ちょっと前のえろげには、やたらと巫女コスのヒロインが出てきたような気がしますが、最近はどうなのでしょうか。これも、人気度はひたすら低下の一方です。ネコミミのように、人気が減るところまで減ってサチるのか、それとも盛り返しがあるのか。さすがに消え去ることはないでしょう。
gifs_miko.png

さて、お次は、比較的最近勃興した属性であるところのニーソックスです。ただし、二次元萌え的には、略称のニーソのほうがよく使われている気がしますので、ニーソで検索してみました。2009年中頃までは、文句なしにその人気が上昇していきます。まあ、流行ってましたしね。アレとか。ここ半年ほどは若干減少傾向が見られますが、これが一過性のもので、再び上昇or現状維持になるのか、それともバブルが弾けて萎んでいくのか。目が離せないような気もします。
gifs_niso.png

続いては、スクール水着です。これも、二次元と親和性の高い略称「スク水」を用いています。周期的な変動があるものの、概ね一定、若干増加傾向にあります。やっぱり、お好きなんですねえ、って感じです。
gifs_skmz.png

さて、服装・装飾編のラストとして、メガネっ子を調べてみます。こればっかりは外せませんね。表記揺れの吸収のため、メガネっ娘+眼鏡っ娘で調べています。単独でも結果は同様でした。さて、結果はといいますと、惚れ惚れするくらいの減少傾向にあります。なんてこった。まあ、嫌いな人は嫌いでしょうし、人気があるとは思っていませんでしたが、人気度が減少傾向にあるとは……。衝撃を隠せません。ハトプリでつぼみがメガネを外しちゃったのもむべなるかなですか……orz。
gifs_mgnk.png


調査結果:関係・シチュエーション編
さて、続いては、人間関係やシチュエーションを示すワードについて見ていきましょう。まず最初に、鉄板属性「幼なじみ」です。これも、表記揺れの問題を避けるために、幼馴染+幼なじみで検索しました。結果は、さすがに人気属性だけあります。ところどころ、突発的な人気の上昇がありますが、それ以外は非常に安定した人気度です。若干の増加すらみられます。
gifs_osana.png

続いては、ツンデレいってみましょう。これはもともとネットスラングから出てきた言葉であると記憶しています。前回エントリでも少し触れましたが、非常に面白い挙動が見られます。まったく人気度が無かった状態から徐々に上昇し、2005年8月頃に急上昇します。ところが、続く2005年9月にバブルが弾け、一気に減少に転じます。2006年4月に謎のピークがあるものの、その後は減少の一途をたどっています。そろそろサチるのか、もしくはさらに減少を続けるのか。このあたりも非常に目が離せない状況となっています。

2006年4月のピークを除き、口コミで人気が広まり、ブレイクし、その後萎んでいくという過程が非常に綺麗なデータとなっていますので、ガチで真面目な研究が行われていてもいいような気もします。が、私はその辺よく知りません。
Google Scholarで検索しても見当たらないので無いのかなあ……。
gifs_tndr.png

次は、ツンデレから派生したヤンデレです。この挙動はツンデレのそれとよく似ています。2007年8月ころに急上昇した後、バブルが弾けて減少に転じています。ただし、突発的なピークがいくつかあるので、まったく同じ曲線を描いているわけではありませんが。ツンデレの例をそのまま適用するに、ヤンデレも、このまま徐々に人気が落ちていくことと思われます。消滅するのか、どこかで一定になるのかはわかりませんが。
gifs_yndr.png

続いても、言葉自体が新しい例を二つ見ていきましょう。まずは、寝取られです。「寝取られ」なら昔からある言葉ですが、エロゲー界隈から出てきた(2chか?)新語NTRは二次元を色濃く宿した言葉ですので、これを見てみることにします。データは急上昇しています。これも、ツンデレのようにそのうち上昇が止まることと思っております。
gifs_ntr.png
同様の言葉で、「男の娘」を見てみます。これも、近年急上昇しています。まあ、正直このあたりはよくわかりません。
gifs_otokonoko.png

萌え
ちょっと一休み。「萌え」をみてみます。これは、2005年から2006年をピークに、最近では急速に減少しています。メディアに露出することも多くなり、言葉自体を知っている人間の総数は確実に多くなっているはずですが……。手垢がつきすぎて使いたくなくなったのか、あるいは飽きただけなのか。私の個人的な解釈だと、前者のような気がしていますが、はてさて。
gifs_moe.png


調査結果:幼女
さて、幼女を見てみたいと思います。しかし、これには、二次元と3次元の分離の困難が伴います。たとえば、ロリで検索し、ニュースのヘッドラインを見てみます。これ、全て3次元の話です。まあ、合法的な話ならまだいいのですが、関連する検索クエリを見てみると、どうも、リアルな児童ポルノ(創作物に対する児童ポルノとかいう世迷い言でない、リアルな大問題のほうです)を求めて検索しているようなクエリが多いのです。さすがに、それは、むり。

ですので、幼女属性そのものの人気の推移を調べるのは諦め、二次元幼女に特化した商品の人気度を調べることにします。そのような都合のよい商品があります。ロリ漫画雑誌Comic LOです。これなら、関連ワードに3次元臭がするものは混じりません。

結果は、極めて安定した人気度を持続しています。少なくともLO自体の人気は、心配する必要がなさそうです。まあこの件に関しては、むしろ規制による壊滅的打撃が心配です。

gifs_LO.png

調査結果:百合
こちらも、幼女と同様の問題がつきまといます。別に、新百合ヶ丘の情報なんて知りたくありませんよ、って感じです。
今回は、2種類の方法で回避を試みます。まずは、同種の言葉である「ガールズラブ」を使います。これが百合と1対1対応しているかというと疑問ですが、まあ指標にはなりますし、今までも検索ワードの精査なんてしてないのでこれでいきます。(略称のGLはぎんつぶるぐらんだう以外に認めません)
また、幼女の場合と同様に、こちらにも専門の雑誌コミック百合姫が存在しますので、この雑誌名でデータを取得します。


ガールズラブの結果は以下のようになりました。ちゃんとしたデータが出るのが2007年以降なので、長期的なトレンドはよくわかりませんが、それなりの値を保持しているように見えます。
gifs_GL.png
続いては百合姫です。こちらは、非常に残念ですがゆるやかな減少傾向です。芳文社のつぼみに客を奪われた……というだけならまだいいのですが。ジャンル自体の衰退でないことを切に祈ります。
gifs_yurihime.png
両方のデータを見て思うのは、百合ブームって、本当に実在したのかという疑問です。どちらのデータも、ブームと呼べるほどの人気度の上昇は見られません。(唯一、百合姫の結果で、2007年10月頃に若干ピークがありますが……)実感としても、確かに去年は百合アニメが多くてウハウハでしたけど、ブームって感じでは無かったような気がします。


というわけで、強引にまとめます。
「眼鏡っ娘」属性の人気は凋落の一途です。「幼女」属性は、人気自体は頑健ですが、下手をすると真っ先に規制されるであろうジャンルなので、全く安心できません。「百合」属性は、それなりに安定しているようにも見えますが、決してブームなどは起こっておらず、むしろ今後の弱体化が心配です。
結論として、私の二次元ライフの未来には暗雲が立ちこめています。orz
スポンサーサイト

Google Insights for Searchが面白すぎる

Google Insights for Search

面白すぎる。Googleトレンドと同様に、googleで検索されたワードの人気度を時系列で見せてくれる。だけでなく、地域別人気度は取得できるわ、何より、アカウントにログインすれば数値データを取ってこれるわで、ネタ心をくすぐりすぎる。百聞は一見に如かず。

アニメ作品の人気を比べてみます。
ハルヒvsらきすたvsけいおん。チョイスに他意はなし。
まあ当たり前ですけどアニメ放映直後の立ち上がりがすごいですね。その後どれだけ人気を維持できるか、ですが。ハルヒ2期は1期ほどの集客力はなかったようですね(google的に)。エンドレスなんとかのせいでしょうか。ハルヒはアニメ終了後も人気が乱高下しているのに対して、らきすたはアニメ終了後徐々に落ち込みつつも一定の人気を維持していますね。このあたり、何か違いがあるようです。けいおんはどうなることやら。まあ2話で切ったことに後悔はしていないorz



若干真面目な話にスイッチ。
グラフェンvsカーボンナノチューブvsフラーレン。へんてこ炭素3兄弟。順に、2次元シート、1次元チューブ、0次元サッカーボール。ちょっと前までちやほやされてたナノチューブとフラーレンがじわじわと落ち込んでる。そしてグラフェンの台頭すげえ。やっぱりみんな2次元が好きってことですね!



同じデータで気になるのが以下のリンクから飛べる地域別人気度。
Google Insights for Search - ウェブ検索の人気度: graphene, carbon nanotube, fullerene - すべての国, 2004 年 - 現在
なんと英語が母国語じゃないはずの韓国がダントツトップ。日本は屁。日本もこのへんの研究してるはずなんだけどなー(CNT見つけたのは日本の研究者だし)、どうしたことやら。そのあたりはgoogleがどうやってデータを料理しているかわからない状態でぐだぐだ言っても仕方がないので、次にいこう。


真面目な話をするととてもとても疲れるので。
幼女。(日本のみ)
2004年と2005年の12月に鋭いピークがあるのですが、何かありましたっけ。クリスマスプレゼントに可愛い幼女をください!みたいなものとも思えんし。面白いのは、人気度がほぼ定数になっていることですね。幼女の魅力はいつになっても色あせること無し、といったところでしょう。これを、以下に続く検索ワードと比較してみると面白いです。


県別データだってとれちゃう。
Google Insights for Search - ウェブ検索の人気度: 幼女 - 日本, 2004 年 - 現在
秋田、佐賀、栃木あたりの人たちが幼女を検索しているようです。

ツンデレ。2005年9月を境にトレンドが一変しているのが美しいほどであります。2006年4月の特異なピークは、なんだろう。ゼロ魔は7月からだったので、ハルヒですかねえ。


それでは最後に。
めがねっこ。
ヴぁあああああああ明らかな下降トレンドでございます。これはいったいどうしたことだ。眼鏡っ子の人気凋落がgoogle的にも証明されてしまったのか。ツンデレのトレンドが下降気味なのはまあ、新しい言葉ですし単にサチっていく段階と思えます。が、眼鏡っ子は古来より伝わる由緒正しき萌え属性のはず。しかもこの傾向は昨日今日に始まったわけではなく、既に2005年半ばから始まっているようです。最悪、眼鏡っ子属性そのものが自然消滅、とまではいかないまでも、商業作品への登場率がきわめて減少する、なんてことになってしまいそうです。(今でもそうじゃねーかというツッコミはおいといて。)危機感を新たにする必要がありそうです。



で、まあ、どうでもいいネタを連ねていきましたが、googleトレンドとの最大の違いは、数値データを取得できることでしょう。googleの中でどう料理されたかわからない得体の知れないデータではありますが、少なくともお遊びに使うことはできるかな。

#……って今回のネタ、googleトレンドだけでも事足りたような……。まあ気にしない。

眼鏡っ子の多い都道府県を統計を使って調べてみた

私は眼鏡っ子が大好きです。二次元では言うに及ばず、リアルワールドの女の子にすら、眼鏡をかけているだけでちょっとときめいてしまいます。可愛い子がかけるとものすごおく可愛くなるし、それなりの子がかけるととても可愛くなる、魔法の可愛さ底上げアイテム、眼鏡。ステキですよね。

さて、こんな世知辛い世の中、どうせなら、眼鏡っ子がたくさん住んでいる地域に住みたいですよね。というわけで、今回は、眼鏡っ子の多い都道府県を、公開されている統計資料から推測してみることにしましょう。

方針
とはいったものの、眼鏡女子率の統計調査なんてあるはずありません。しかしながら、次の量は、眼鏡女子率の推定値を与えるはずです。すなわち、
(眼鏡女子率の概算値)=(眼の悪い女の子の割合)×(視力矯正に関わる支出のうち、眼鏡が占める割合)
まず、眼鏡をかける子は目が悪いという大前提がありますので、第1項に「眼の悪い女の子の割合」をもってくるのは妥当でしょう。伊達眼鏡?何それ。
続いて、視力矯正のために眼鏡を用いる確率が必要となります。あの忌まわしきコンタクトレンズをしている可能性を除外するためです。さすがにこんな統計はありませんので、代用品として、視力矯正に関する支出のうち、眼鏡が占める割合をもってきます。

#……この時点で、眼鏡女子率ではなく、眼鏡女子率の増加関数になっているような気がしなくもない何らかのよくわからない量を計算することになるのですが、別にいいですよね。


都道府県毎のこれらの量を、個別に調べていくことからはじめましょう。
まず、「眼の悪い女の子の割合」は、文科省の学校保健統計調査から「年齢別 都市階級別 設置者別 疾病・異常被患率等 」の表を参照します。この表に、視力が1.0未満の女子の比率が記載されています。

続いて、「視力矯正に関わる支出のうち、眼鏡が占める割合」は、統計局の家計調査を参考にします。このうち、都市階級・地方・都道府県庁所在市別(総世帯)の表に、各都道府県県庁所在地での、1世帯あたり眼鏡とコンタクトレンズの支出額が記載されています。


結果
まずは、各県ごとの、視力1.0未満の女子の比率を示しましょう。

……ちなみに、10歳女子です。これ以上年齢が上がると、データのある県の数が著しく減るので、今回の目的に合わないのです。別に10歳がジャストミートとかそういうことではありません。まあ、高校生になったら年増との格言もありますし、今回は10歳女子だけを議論します。また、神奈川・岩手はデータがありません。全データ揃ってるのだと8歳になってしまいます。8歳でも可愛いと思うんですけど、眼鏡に関してはもう少し育った方が似合う気がするので以下略

眼の悪い女子率が多い順に、北海道、秋田、青森、石川、東京となっています。目が悪いのは喜ばしいことでもないのでこのあたりは反応に困るところではありますが。
逆にワーストは、徳島、三重、岡山、熊本、鹿児島となっています。目がいいのは健康的で喜ばしいはずなのですがやはりこのサイト的には残念であります。神奈川・岩手はデータがありません。

10saisiryoku.png

続いて、視力矯正に関わる支出のうち、眼鏡が占める割合をみてみましょう。
眼鏡の支出/(眼鏡の支出+コンタクトの支出)を計算しています。
視力矯正に眼鏡を用いる場合の多い優良県のトップ5は、山梨、沖縄、愛媛、北海道、福井です。福井県には鯖江市がありますのでなんとなく眼鏡とこじつけられそうです。他の県で眼鏡の支出率が多い理由はわかりません。
続いて、視力矯正にコンタクトレンズを使う割合の多いくそったれ県トップ5は、山形、秋田、千葉、島根、福島となっています。このあたりの県民は猛省して、今すぐコンタクトレンズを投げ捨てて眼鏡を買いに走るべきです。
また、関東地方のみを抜き出すと、眼鏡支出率の多い順に、群馬、埼玉、栃木、茨城、東京、神奈川、千葉となっています。どうも、眼鏡支出率の高さと、県イメージの野暮ったさがリンクしている気がするのは気のせいでしょうか。ああ、やっぱり気のせいでした、千葉が(略

meganesishutu.png

最後に、上記の量の積です。とりあえず、この量が、各県の眼鏡女子の多さを示す指標になっているはずです。
トップ5は、北海道、沖縄、福井、山梨、奈良です。眼鏡っ子のいる日々を過ごしたいのなら、このあたりの県に移住するのが吉、と結論します。

meganeritu.png

最後に
穴だらけというか穴しかない考察でしたが、一つだけ。
眼鏡支出率は、実に筋の悪い量です。眼鏡美少女による寄与だけでなく、眼鏡のおにいさんおっさんおばさんおじいさんおばあさんまで全てひっくるめているのですから……。

今回の考察はダメダメでしたが、真面目な話、行政側が、眼鏡っ子の多い街○○のような感じでもっとプッシュすればいいのにとか思います。きっと一人や二人、つられて移住しちゃいますよ。

パレートの法則は金持ち専用の法則です。貧乏人には適用されません。

パレートの法則、という言葉があります。俗に80:20の法則などとも呼ばれ、構成要素のごく一部が、全体に対して大きい影響を持つことを言い表すのに使われるようです。さらにぐぐってみると、元々は、所得の分布がべき分布になるという主張だった、というような記述も見つかります。

こんなことが書いてあるものだから、所得の分布が全領域でべき分布になると、思い込んだりしていませんか?複雑系スキスキーな人、ひっかかっていませんか?恥ずかしながら、私は今の今まで、所得の分布イコールべき分布だと無批判に思い込んでおりました。しかし実際には、事態はそう単純ではないようです。

確かに、所得の分布に関してパレートの法則(以降、べき分布を指すのにこの単語を用います)は成り立ちます。しかしそれは、高所得者層に限っての話なのです。低所得者層には、パレートの法則に代わる別の自然法則が適用されるのです。金持ちと貧乏人の間には、量的なだけでなく、質的な違いがあるのです。

……というような話を、以下の元ネタ論文をつまみにぐだぐだ述べていこうかと思います。
#与太話はどうでもいい、という方は、是非論文をご覧ください。保存則と時間反転対称性と統計力学を武器に、所得のボルツマン分布を解き明かしていく(?)ステキ論文です。

さて、所得の分布が実際にはどうなっているのか調べたいとき、どうすればいいでしょう。と、問うまでもない問題で、実際にデータを取得してみればいいのです。今回は都合よくデータがあったようで、論文の著者らは、米国国税庁(IRS)が公表しているデータに着目しました。実際に所得の調査を行うのではなく、ある所得階級に属する納税申告書の数を使うことで、所得の分布に代用しようというのです。どうしてこんな搦め手から攻めるような作戦を取ったのかよくわかりませんが。

#追記。そりゃサンプル数をきわめて多く取れるからに決まってますな。。。

分布のグラフを論文から引用してもよいのですが、論文のデータが最新で2001年と若干古いということもあり、せっかくですので公開されているデータを使って、自前でグラフを描いてみます。データは、このページの、Table1.4に記載されているものを用います。最新データは2007年ですので、これを使います。所得の累積度数分布を作成し、グラフにしたのが以下の図です。

IRS2007.png

横軸に所得、縦軸に累積分布(%)をとってあります。いつものように、両対数プロットです。もし所得の分布がパレートの法則に従うのなら、このグラフ上で直線になるはずです。確かに、高所得側ではそのようになっています(青い線)。しかし、所得10万ドル付近を境に、低所得側はべき分布になっていません。

低所得側を説明するのが、緑の線で示した関数です。これは、Boltzmann-Gibbs(ボルツマン-ギブス)分布というご大層な名前がつけられていますが、実態はたんなる指数関数です。内挿図は、縦軸のみを対数プロットにしたものです。このようなプロットでは、指数関数は直線となって表示されます。確かに低所得側では、所得の分布は指数関数に乗っているようです。

#たんなる指数関数に、統計力学の巨人二人の名前がついている理由は、この指数関数が統計力学的なアプローチで予見されたためです。というか、統計力学で出てくるボルツマン分布そのものと言っていいはず。詳細は論文読んでくらさい。

以上、眠い眼をこすりながらさくっと作ったグラフでした。ちゃんとしたのは論文見てください。

話をここで終わらせてしまうと、単なる論文の丸パクリ記事となってしまいます。しかもアメリカの話だけ。ということで、日本の所得分布についても見てみることにしましょう。統計データは、統計局が公表しているものにありそうなのですが、探す気力が無かったのでパス。元ネタ論文のように、国税庁のサイトを調べてみたらすんなり見つかりました。平成19年の全データ、65ページの表、「区分」と「申告納税者数」のデータを使います。グラフは次のようになります。

kokuzei2007.png

グラフはアメリカのものとほとんど同じとなりました。高所得側ではパレートの法則が成り立っています。所得1000万円程度を境に、低所得側では指数関数となります。(とはいえ、内挿図に示したように、指数関数からのばらつきが、アメリカの場合より若干多いようにも見えます。これが何を示しているのかはわかりません)

結論。
所得に関するパレートの法則は、所得1000万円以上のお金持ちに対してのみ適用されます。貧乏人の所得は、指数関数に従い、どうも両者には質的な違いすらあるように見えます。
まあ、経済の人には常識なのかもしれませんが、私は知りませんでした。

もうちょっと教訓めいたものを引き出すなら、以下の二点でしょうか。
ひとつめは、○○の法則と名のつくものがあれば、必ずその適用範囲をチェックしなければいけない、ということ。これは、数学や自然科学を勉強すれば、必ず身につけているべきプロセスです。この記事の最初に「恥ずかしながら」と書いたのはそういうことです。初等的な解説では、混乱を避けるためにあえて法則の適用範囲に関する議論を省くことがあります。しかし、○○の法則を使うためには、そこで満足していてはいけない、ということなのでしょう。
もうひとつは、○○の法則を、実際の測定値を見て確認しないといけない、ということ。これも、初等的な解説ではなかなか難しいわけですが、○○の法則が現実世界にリンクするものである以上、やらなきゃいけないプロセスではあります。

最近、男性に対する評価に関して極めて普遍的に成立する適用条件が発見されたことですし、法則うんぬん関係なく、適用範囲のチェックはしなければいけません、ということでしょうね。いやはや生き辛い世界だ('A`)

はてブで遊ぶ(3) -ホットエントリの総獲得ブックマーク数を予想できるか?-

またしてもはてブであれやこれやです。

前々回のエントリで、ホットエントリー入りした記事の分類を行いました。すると、ほとんどのエントリが、ホットエントリ入りしたときに爆発的にブックマークを稼ぎ、その後はじわじわとブックマークを増やしていく、ということがわかりました。

さて、ホットエントリ入りした瞬間の爆発的なブックマークの伸び(以下「初期速度」と呼ぶ)と、その後のじわじわとしたブックマークの増加(以下「長期成長速度」と呼ぶ)の間には、何か関係があるのでしょうか。単純に考えれば、初期速度が大きいエントリは、長期成長速度も大きいように思えます。そして、もしこの両者の間に関係があるとすれば、ホットエントリ入りした瞬間に、その記事がどのくらいブックマークを稼げるか、わかってしまいます。本当でしょうか。調べてみましょう。

次の図は、典型的なブックマークの時系列と、その関数によるフィッティングです。図中に示してあるように、時系列を、指数関数と一次関数の和で表します。指数関数が、開始直後のブックマークの伸びを示し、一次関数がその後のじわじわとした成長を表します。この関数を微分すると(しなくても)、初期速度と長期成長速度がわかります。これも、図中に示してあります。このようにして、時系列のフィッティングを行い、フィッティングパラメータから、初期速度と長期成長速度を計算します。

hatebuts.png

次の図が、横軸に初期速度、縦軸に長期成長速度をプロットした図です。なお、データは、2008年9月にホットエントリ入りしたデータを用いました。

えー、見事に何も関係がないように見えます。図中に両対数プロットも添えてみましたが、やっぱりバラバラ極まりない感じです。ちょっとだけ面白いのは、初期速度と長期速度は、だいたい3ケタくらい違うということです。ホットエントリの集客力を、ブックマークの速度の面から見ることができました。

bookmark_speed.png

このままだとあんまり面白くないので、今度は、初期速度と総ブックマーク数の関係を示します。ここでの総ブックマーク数とは、2008年の9月から2009年の10月まで、ほぼ1年の間に稼いだブックマークの数ということになります。

横軸に初期速度、縦軸に総ブックマーク数をプロットしてあります。やっぱりというかなんというか、初期速度が大きければ総ブックマーク数も大きいです。しかし、点は非常にばらついていて、初期速度から総ブックマーク数を精度よく予言するのは無理そうです。

bookmarks_vs_initialspeed.png

というわけで、目の付け所が悪かったのか、あまり面白くない結果となりました。もう少し範囲を限定する、たとえば、記事をジャンルごとに分けるなどすれば、何か意味のある結果が出るかもしれません。が、面倒なのでやりません。


関連エントリ

プロフィール

null

Author:null
二次元眼鏡少女に蔑まれたいです。

最近の記事
最近のコメント
最近のトラックバック
タグ

考察 統計 ネット 複雑ネットワーク 自然科学 二次元 幼女 エロゲー ネタ アニメ 百合 時事ネタ 計算 igraph R 

月別アーカイブ
カテゴリー
あわせて読みたい
あわせて読みたいブログパーツ
ブログ内検索
カレンダー
06 | 2017/07 | 08
- - - - - - 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 - - - - -
RSSフィード
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。