スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

眼鏡っ子の多い都道府県を統計を使って調べてみた

私は眼鏡っ子が大好きです。二次元では言うに及ばず、リアルワールドの女の子にすら、眼鏡をかけているだけでちょっとときめいてしまいます。可愛い子がかけるとものすごおく可愛くなるし、それなりの子がかけるととても可愛くなる、魔法の可愛さ底上げアイテム、眼鏡。ステキですよね。

さて、こんな世知辛い世の中、どうせなら、眼鏡っ子がたくさん住んでいる地域に住みたいですよね。というわけで、今回は、眼鏡っ子の多い都道府県を、公開されている統計資料から推測してみることにしましょう。

方針
とはいったものの、眼鏡女子率の統計調査なんてあるはずありません。しかしながら、次の量は、眼鏡女子率の推定値を与えるはずです。すなわち、
(眼鏡女子率の概算値)=(眼の悪い女の子の割合)×(視力矯正に関わる支出のうち、眼鏡が占める割合)
まず、眼鏡をかける子は目が悪いという大前提がありますので、第1項に「眼の悪い女の子の割合」をもってくるのは妥当でしょう。伊達眼鏡?何それ。
続いて、視力矯正のために眼鏡を用いる確率が必要となります。あの忌まわしきコンタクトレンズをしている可能性を除外するためです。さすがにこんな統計はありませんので、代用品として、視力矯正に関する支出のうち、眼鏡が占める割合をもってきます。

#……この時点で、眼鏡女子率ではなく、眼鏡女子率の増加関数になっているような気がしなくもない何らかのよくわからない量を計算することになるのですが、別にいいですよね。


都道府県毎のこれらの量を、個別に調べていくことからはじめましょう。
まず、「眼の悪い女の子の割合」は、文科省の学校保健統計調査から「年齢別 都市階級別 設置者別 疾病・異常被患率等 」の表を参照します。この表に、視力が1.0未満の女子の比率が記載されています。

続いて、「視力矯正に関わる支出のうち、眼鏡が占める割合」は、統計局の家計調査を参考にします。このうち、都市階級・地方・都道府県庁所在市別(総世帯)の表に、各都道府県県庁所在地での、1世帯あたり眼鏡とコンタクトレンズの支出額が記載されています。


結果
まずは、各県ごとの、視力1.0未満の女子の比率を示しましょう。

……ちなみに、10歳女子です。これ以上年齢が上がると、データのある県の数が著しく減るので、今回の目的に合わないのです。別に10歳がジャストミートとかそういうことではありません。まあ、高校生になったら年増との格言もありますし、今回は10歳女子だけを議論します。また、神奈川・岩手はデータがありません。全データ揃ってるのだと8歳になってしまいます。8歳でも可愛いと思うんですけど、眼鏡に関してはもう少し育った方が似合う気がするので以下略

眼の悪い女子率が多い順に、北海道、秋田、青森、石川、東京となっています。目が悪いのは喜ばしいことでもないのでこのあたりは反応に困るところではありますが。
逆にワーストは、徳島、三重、岡山、熊本、鹿児島となっています。目がいいのは健康的で喜ばしいはずなのですがやはりこのサイト的には残念であります。神奈川・岩手はデータがありません。

10saisiryoku.png

続いて、視力矯正に関わる支出のうち、眼鏡が占める割合をみてみましょう。
眼鏡の支出/(眼鏡の支出+コンタクトの支出)を計算しています。
視力矯正に眼鏡を用いる場合の多い優良県のトップ5は、山梨、沖縄、愛媛、北海道、福井です。福井県には鯖江市がありますのでなんとなく眼鏡とこじつけられそうです。他の県で眼鏡の支出率が多い理由はわかりません。
続いて、視力矯正にコンタクトレンズを使う割合の多いくそったれ県トップ5は、山形、秋田、千葉、島根、福島となっています。このあたりの県民は猛省して、今すぐコンタクトレンズを投げ捨てて眼鏡を買いに走るべきです。
また、関東地方のみを抜き出すと、眼鏡支出率の多い順に、群馬、埼玉、栃木、茨城、東京、神奈川、千葉となっています。どうも、眼鏡支出率の高さと、県イメージの野暮ったさがリンクしている気がするのは気のせいでしょうか。ああ、やっぱり気のせいでした、千葉が(略

meganesishutu.png

最後に、上記の量の積です。とりあえず、この量が、各県の眼鏡女子の多さを示す指標になっているはずです。
トップ5は、北海道、沖縄、福井、山梨、奈良です。眼鏡っ子のいる日々を過ごしたいのなら、このあたりの県に移住するのが吉、と結論します。

meganeritu.png

最後に
穴だらけというか穴しかない考察でしたが、一つだけ。
眼鏡支出率は、実に筋の悪い量です。眼鏡美少女による寄与だけでなく、眼鏡のおにいさんおっさんおばさんおじいさんおばあさんまで全てひっくるめているのですから……。

今回の考察はダメダメでしたが、真面目な話、行政側が、眼鏡っ子の多い街○○のような感じでもっとプッシュすればいいのにとか思います。きっと一人や二人、つられて移住しちゃいますよ。

水たまりパンチラの幾何光学

あけましておめでとうございます(遅)
当変態ブログ2010年最初の記事は、科学技術ブログとしての原点に立ち戻り、光学の話題から始めることにしましょう。

中学生マインドをお持ちの皆様の中には、水たまりパンチラに萌える方もいらっしゃることと思います。これはすなわち、水たまりのそばに佇むスカートを穿いた女の子、水面に目をやると、そこには水面に反射したスカートの中身がくっきりと、というようなバカシチュです。空を飛ぶパンツで有名なバカアニメ「そらのおとしもの」でも、該当するシーンがあったと記憶しています(正確にははいてない状態でしたが。。)。今回の記事では、水たまりパンチラの発生条件を、幾何光学を使って考察していきます。

#ずっと昔にあった、階段でぱんちらを拝むための幾何学を丸パクリしたやつです。フレネル方程式に言及してちょっとだけ中学数学以上のことをやるので、ご勘弁願います。



水たまりパンチラの幾何光学

まず最初に、水たまりパンチラが発生する条件について考察していきましょう。
水たまりにぱんつが映るというのは、すなわち、ぱんつから出た光が水面に反射し、観測者の目で捕らえられるということを意味しています。これを説明したのが次の図です。絵心がないのは仕様です。

まず、女の子と観測者が十分近づいている場合の光の経路を、青い線で示します。光はスカートをかわして水たまりで反射され、観測されます。つまり、女の子に十分接近すれば、水たまりぱんちらを拝むことができます。女の子と観測者の距離が遠い場合はどうでしょうか。この場合の光の経路を、赤い線で示してあります。ご覧のように、ぱんつから出た光はスカートに阻まれ、観測者に届くことはありません。女の子からの距離が遠いと、ぱんちらは拝めません。

それでは、パンチラが見える・見えないの境界線はどこにあるでしょうか。それは、ぱんつから出た光が、ギリギリスカートをかすめて観測者に届く場合です。この状態を、便宜的に「臨界パンチラ状態」と呼ぶことにしましょう。臨界パンチラ状態での光の経路を、緑の線で示しました。臨界パンチラ状態についての考察を行いましょう。

pantiraoptics1.png

幾何学的な配置を、次の図で示します。以下の4パラメータを与えられたものとします。地面からぱんつの下端までの距離を、ぱんつ高pと呼びます。同様に、地面からスカートの下端までの距離を、スカート高sと呼びます。また、ぱんつの中心から地面に降ろした垂線と、スカート下端までの距離を、スカート幅wと呼びます。そして、観測者の目の高さを、視点高eと呼ぶことにしましょう。

続いて、求めるべき量にうつります。まずは、女の子と観測者の間の距離Dです。特に今回、臨界パンチラ状態での女の子・観測者間の距離のことを、「臨界パンチラ視認距離」と名付け、D0と呼びましょう。また、このときの光の入射角・反射角を「臨界パンチラ角」と名付け、θ0と呼ぶことにしましょう。

問題設定が整いました。下図のような条件で、p,s,w,eを用いて、D00を書き下します。
pantiraoptics2.png

とは言ったものの、これを解くのは極めて簡単で、中学で習う幾何学の知識があれば一発です。
D0=w(p+e)/(p-s)
tanθ0=w/(p-s)
となります。
適当にそれっぽい数値として、p=70(cm),w=15(cm),s=40(cm),e=160(cm)を代入すると、D0は115cm、θ0は27度程度となります。つまり、女の子と1メートル以上接近すれば、水たまりパンチラを拝める、とそういうわけです。遠くからぱんつを眺めるのは無理そうですが、どうにか接近する手段を手に入れれば、水たまりぱんちらを拝みほうだいです。やりました!次の雨上がりの日は、全国の水たまりという水たまりに変態さんが群がりますね!

……果たして、本当でしょうか。光線の軌道に関する考察は、これでOKです。しかし、ぬか喜びする前に、光が水面で反射するという事実を、もう少しまじめに考える必要があるのです。


無情なる光の物理学-フレネル方程式-

水面に入射した光は、一部が反射すると同時に、一部は水中に透過します。今回の問題設定では、透過した光は地面に吸収されて消えてしまうでしょう。ですので、入射した光のうち、どの程度の量が反射されて、観測者の目に届くのかを知る必要があります。光の反射量が少なければ、いかにステキな位置にスタンバイしていても、パンチラ映像が暗くてよくわからない、ということになってしまうのです。

実は、反射率は入射角に応じて変化することが知られています。反射率を、入射角の関数として記述したものが、フレネル方程式と呼ばれている数式です。リンク先を見るとわかりますが、反射率は、入射角と媒質の屈折率によって決定されます。しかし、フレネル方程式の形はちょっとややこしいので、数式は出さずに、グラフを描いてしまうことにしましょう。パラメータとして、空気の屈折率を1、水の屈折率を1.33としました。

#ぱんつに反射した光は自然光である(偏光していない)と考えられます。日本語版Wikipediaでは、自然光の反射率に関する記述が乏しいので、Wikipedia英語版のフレネル方程式に関するページを参考にしました。

fresnel.png

これを見ると、入射角が90度近い、つまり水面スレスレに入射する光の反射率は高くなっています。一方、入射角が0度、つまり水面に垂直に入ってくる光の反射率は非常に低いことがわかります。0度での反射率は0.02程度です。水面に対して垂直に入射する光はほとんど反射せずに、水中に透過してしまうのです。

それでは、先ほど求めた、臨界パンチラ角での反射率はどうでしょうか。27度に対する反射率は0.021程度、垂直入射の場合とほとんど変わりません。つまり、せっかくパンチラを拝めるポジションをキープしても、水面に映るぱんつは暗くて見えない、ということになりかねないのです。スカートを避けるために女の子に近づけば近づくほど、ぱんつの映像は暗く見えなくなってしまうのです。人間のぱんつに向けた飽くなき探求心も、冷徹無情な物理法則の前では白旗を降らざるを得ないのです。

#まあ、もしかすると、人間の眼がハイスペックにものを言わせてなんとかぱんつを認識してしまうかもしれませんが。

それでは、まとめましょう。
水たまりパンチラを拝むためには、スカートの鉄壁防御をかい潜るために、ある程度女の子に近づく必要があります。女の子との距離は、典型的な値では1メートル程度です。
ところが、女の子に近づくと、ぱんつから出た光は、水面に対して垂直に近い角度で入射します。このとき、光はほとんど反射しません。そのため、せっかくのパンチラが暗くて見えない可能性が高いです。

もしかすると、パンツとスカートの幾何学と、マクスウェル方程式に支配される鉄壁の反射法則の間に、どうにかぱんちらを拝める領域が存在するのかもしれません。しかし、その探求は後進の賢者に譲ることとしましょう。

……などと長々と書いてきましたが、そういえば私はぱんつには全然興味なくてむしろ中身が重要であるということを今思いだしました。まあ、パンチラとかどうでもいいですよね。

パレートの法則は金持ち専用の法則です。貧乏人には適用されません。

パレートの法則、という言葉があります。俗に80:20の法則などとも呼ばれ、構成要素のごく一部が、全体に対して大きい影響を持つことを言い表すのに使われるようです。さらにぐぐってみると、元々は、所得の分布がべき分布になるという主張だった、というような記述も見つかります。

こんなことが書いてあるものだから、所得の分布が全領域でべき分布になると、思い込んだりしていませんか?複雑系スキスキーな人、ひっかかっていませんか?恥ずかしながら、私は今の今まで、所得の分布イコールべき分布だと無批判に思い込んでおりました。しかし実際には、事態はそう単純ではないようです。

確かに、所得の分布に関してパレートの法則(以降、べき分布を指すのにこの単語を用います)は成り立ちます。しかしそれは、高所得者層に限っての話なのです。低所得者層には、パレートの法則に代わる別の自然法則が適用されるのです。金持ちと貧乏人の間には、量的なだけでなく、質的な違いがあるのです。

……というような話を、以下の元ネタ論文をつまみにぐだぐだ述べていこうかと思います。
#与太話はどうでもいい、という方は、是非論文をご覧ください。保存則と時間反転対称性と統計力学を武器に、所得のボルツマン分布を解き明かしていく(?)ステキ論文です。

さて、所得の分布が実際にはどうなっているのか調べたいとき、どうすればいいでしょう。と、問うまでもない問題で、実際にデータを取得してみればいいのです。今回は都合よくデータがあったようで、論文の著者らは、米国国税庁(IRS)が公表しているデータに着目しました。実際に所得の調査を行うのではなく、ある所得階級に属する納税申告書の数を使うことで、所得の分布に代用しようというのです。どうしてこんな搦め手から攻めるような作戦を取ったのかよくわかりませんが。

#追記。そりゃサンプル数をきわめて多く取れるからに決まってますな。。。

分布のグラフを論文から引用してもよいのですが、論文のデータが最新で2001年と若干古いということもあり、せっかくですので公開されているデータを使って、自前でグラフを描いてみます。データは、このページの、Table1.4に記載されているものを用います。最新データは2007年ですので、これを使います。所得の累積度数分布を作成し、グラフにしたのが以下の図です。

IRS2007.png

横軸に所得、縦軸に累積分布(%)をとってあります。いつものように、両対数プロットです。もし所得の分布がパレートの法則に従うのなら、このグラフ上で直線になるはずです。確かに、高所得側ではそのようになっています(青い線)。しかし、所得10万ドル付近を境に、低所得側はべき分布になっていません。

低所得側を説明するのが、緑の線で示した関数です。これは、Boltzmann-Gibbs(ボルツマン-ギブス)分布というご大層な名前がつけられていますが、実態はたんなる指数関数です。内挿図は、縦軸のみを対数プロットにしたものです。このようなプロットでは、指数関数は直線となって表示されます。確かに低所得側では、所得の分布は指数関数に乗っているようです。

#たんなる指数関数に、統計力学の巨人二人の名前がついている理由は、この指数関数が統計力学的なアプローチで予見されたためです。というか、統計力学で出てくるボルツマン分布そのものと言っていいはず。詳細は論文読んでくらさい。

以上、眠い眼をこすりながらさくっと作ったグラフでした。ちゃんとしたのは論文見てください。

話をここで終わらせてしまうと、単なる論文の丸パクリ記事となってしまいます。しかもアメリカの話だけ。ということで、日本の所得分布についても見てみることにしましょう。統計データは、統計局が公表しているものにありそうなのですが、探す気力が無かったのでパス。元ネタ論文のように、国税庁のサイトを調べてみたらすんなり見つかりました。平成19年の全データ、65ページの表、「区分」と「申告納税者数」のデータを使います。グラフは次のようになります。

kokuzei2007.png

グラフはアメリカのものとほとんど同じとなりました。高所得側ではパレートの法則が成り立っています。所得1000万円程度を境に、低所得側では指数関数となります。(とはいえ、内挿図に示したように、指数関数からのばらつきが、アメリカの場合より若干多いようにも見えます。これが何を示しているのかはわかりません)

結論。
所得に関するパレートの法則は、所得1000万円以上のお金持ちに対してのみ適用されます。貧乏人の所得は、指数関数に従い、どうも両者には質的な違いすらあるように見えます。
まあ、経済の人には常識なのかもしれませんが、私は知りませんでした。

もうちょっと教訓めいたものを引き出すなら、以下の二点でしょうか。
ひとつめは、○○の法則と名のつくものがあれば、必ずその適用範囲をチェックしなければいけない、ということ。これは、数学や自然科学を勉強すれば、必ず身につけているべきプロセスです。この記事の最初に「恥ずかしながら」と書いたのはそういうことです。初等的な解説では、混乱を避けるためにあえて法則の適用範囲に関する議論を省くことがあります。しかし、○○の法則を使うためには、そこで満足していてはいけない、ということなのでしょう。
もうひとつは、○○の法則を、実際の測定値を見て確認しないといけない、ということ。これも、初等的な解説ではなかなか難しいわけですが、○○の法則が現実世界にリンクするものである以上、やらなきゃいけないプロセスではあります。

最近、男性に対する評価に関して極めて普遍的に成立する適用条件が発見されたことですし、法則うんぬん関係なく、適用範囲のチェックはしなければいけません、ということでしょうね。いやはや生き辛い世界だ('A`)

はてブで遊ぶ(3) -ホットエントリの総獲得ブックマーク数を予想できるか?-

またしてもはてブであれやこれやです。

前々回のエントリで、ホットエントリー入りした記事の分類を行いました。すると、ほとんどのエントリが、ホットエントリ入りしたときに爆発的にブックマークを稼ぎ、その後はじわじわとブックマークを増やしていく、ということがわかりました。

さて、ホットエントリ入りした瞬間の爆発的なブックマークの伸び(以下「初期速度」と呼ぶ)と、その後のじわじわとしたブックマークの増加(以下「長期成長速度」と呼ぶ)の間には、何か関係があるのでしょうか。単純に考えれば、初期速度が大きいエントリは、長期成長速度も大きいように思えます。そして、もしこの両者の間に関係があるとすれば、ホットエントリ入りした瞬間に、その記事がどのくらいブックマークを稼げるか、わかってしまいます。本当でしょうか。調べてみましょう。

次の図は、典型的なブックマークの時系列と、その関数によるフィッティングです。図中に示してあるように、時系列を、指数関数と一次関数の和で表します。指数関数が、開始直後のブックマークの伸びを示し、一次関数がその後のじわじわとした成長を表します。この関数を微分すると(しなくても)、初期速度と長期成長速度がわかります。これも、図中に示してあります。このようにして、時系列のフィッティングを行い、フィッティングパラメータから、初期速度と長期成長速度を計算します。

hatebuts.png

次の図が、横軸に初期速度、縦軸に長期成長速度をプロットした図です。なお、データは、2008年9月にホットエントリ入りしたデータを用いました。

えー、見事に何も関係がないように見えます。図中に両対数プロットも添えてみましたが、やっぱりバラバラ極まりない感じです。ちょっとだけ面白いのは、初期速度と長期速度は、だいたい3ケタくらい違うということです。ホットエントリの集客力を、ブックマークの速度の面から見ることができました。

bookmark_speed.png

このままだとあんまり面白くないので、今度は、初期速度と総ブックマーク数の関係を示します。ここでの総ブックマーク数とは、2008年の9月から2009年の10月まで、ほぼ1年の間に稼いだブックマークの数ということになります。

横軸に初期速度、縦軸に総ブックマーク数をプロットしてあります。やっぱりというかなんというか、初期速度が大きければ総ブックマーク数も大きいです。しかし、点は非常にばらついていて、初期速度から総ブックマーク数を精度よく予言するのは無理そうです。

bookmarks_vs_initialspeed.png

というわけで、目の付け所が悪かったのか、あまり面白くない結果となりました。もう少し範囲を限定する、たとえば、記事をジャンルごとに分けるなどすれば、何か意味のある結果が出るかもしれません。が、面倒なのでやりません。


関連エントリ

はてブで遊ぶ(2) -ブックマーク数の統計をとってみる-

前回に引き続き、はてブのあれやこれやを調べてみます。

今回は、ブックマーク数の頻度を調べます。すなわち、あるブックマーク数を稼いでいるエントリが何個あるかを調べます。ブックマークされるページのうち、ホットエントリ入りするなどしてブックマークを稼ぐページはほんの一握りで、大多数のページはブックマークをほとんど獲得できていないと予想されます。その分布の様子がどうなっているか、実際に見てみようという目論見です。

ブックマークされている全ページから、20000ページをランダムに選択し、ブックマーク数とその頻度を調べてみました。結果が次のグラフです。横軸にブックマーク数、縦軸に頻度(というか、記事の個数)をプロットしました。なお、両対数プロットにしてあります。

random20000.png

すると、どうやら、記事の頻度はブックマーク数の-2乗に比例するようです。少なくとも、ブックマーク数30以下の記事に対しては、それがあてはまるようです。またべき乗か、このべき乗脳が!とか自分に言いたくなりますが、やっぱりそれなりにべき乗となっているように見えるのです。

一つ気になるのは、高ブックマーク側で、データがべき乗から大きくずれているように見えることです。単純に考えると、数百以上の莫大なブックマークを稼ぐ超人気エントリは、べき乗則が予想するよりも高確率で生成される、ということになります。もしかすると、ホットエントリー入りしたエントリーが、爆発的にブックマークを稼ぐ効果が見えているのかもしれません。

これが本当だったら面白いのですが、さすがにこのばらつきではそこまで言いきれない気がします。またこの結果は、ブックマーカーの母集団の変動を全く考えていません。そのあたりの効果もちゃんと補正しないと意味のあることは言えないでしょう。

解析手法
今回のミソは、ブックマークされたすべてのページの中から、ランダムにページを選ぶやりかたです。
実は、はてブに掲載された記事には、それぞれeidと呼ばれるIDが振られています。例えば、eidが398のページのブクマコメントは、次のURLで取得できます。
http://b.hatena.ne.jp/entry/398
最新の記事では、eidが16000000台です。そこからランダムに20000個の数字を選び、上記のようなURLにアクセスしてブックマーク数の情報を調べています。

関連記事

続きを読む

プロフィール

null

Author:null
二次元眼鏡少女に蔑まれたいです。

最近の記事
最近のコメント
最近のトラックバック
タグ

考察 統計 ネット 複雑ネットワーク 自然科学 二次元 幼女 エロゲー ネタ アニメ 百合 時事ネタ 計算 igraph R 

月別アーカイブ
カテゴリー
あわせて読みたい
あわせて読みたいブログパーツ
ブログ内検索
カレンダー
05 | 2017/06 | 07
- - - - 1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 -
RSSフィード
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。