2014年01月14日

ロングテールを調べるのに便利な「規模別合計」の数学的解説


 ブロマガの方で、ロングテールの話題を扱う中で「規模別合計」という集計値を使っていますが、改めて数学的な説明をここで補足しておきます。

ちりを集めて集計してみる


 例としてべき乗則を考えます。

 

ここで、xは順位、f(x) は対象となる統計値です。たとえば、ニコニコ動画の再生数などです。kを100万とすると、
 1位は100万回再生、
 2位は50万回再生、
 3位は33万回再生、
 ...
 10位は10万回再生、
 ...
 100位は1万回再生、
 ...
 1万位は100回再生
となっているような分布です。

 このとき、10位ごとに区切って再生数を合計すると、
 1-10位の合計  300万回弱
 11-20位の合計 約67万回
 21-30位の合計  40万回弱
 ...
 101-110位の合計 10万回弱
と、当然上位10位の合計は他を圧倒します。

 しかし、もし、1位の再生数と、2位からは集計する幅をどんどん広くしたものを比べると肩を並べます。

 1位の再生数           100万回
 2-10位の再生数の合計     約190万回
 11-100位の再生数の合計    約230万回
 101-1000位の再生数の合計   約230万回
 10001-10000位の再生数の合計 約230万回

と肩を並べますし、さらに約230万回で一定になります。

「規模別合計」


 この様子は、近似的に連続関数上で集計してやるとわかります。通常の等幅の集計は、ある幅 Δx について、[ x, x + Δx ] という区間で行いますが、どんどん幅を広くするというのを一般的に書くと、ある比 Δx について、[ x, x (1 + Δx) ]という区間で集計することにします。すると、上記べき乗則では、




 
と定数になっており、実際の合計値も一定数に近づきます。

 この操作を「規模別合計」と呼んでいます。なぜかというと、今行った集計の区切りの順位での再生数を見ると、
 1位の再生数  100万回
 10位の再生数  10万回
 100位の再生数   1万回
 1000位の再生数 1000回
 10000位の再生数 100回
となっていて、つまり、たとえば 2 - 10位の合計というのは、再生数が10万回以上100万回未満、つまり、再生数が6ケタのものを合計しているからです。
 同様に11 - 100位の合計とは再生数が5ケタのものの合計になっていますし、再生数が3ケタしかなくても、それは、1001位から10000位と約9000個もあり、それらを合計すると1位の再生数を超えるのです。まさにちりも積もれば山となる、です。

 つまり、上記のように幅をどんどん広くしながら合計するという操作をべき乗則のようなロングテールの分布に行うと、再生数が何ケタかというような規模ごとに集計していることになるので、「規模別合計」と呼んでいるのです。

 この、小さいものが無数にあって、合算すると大きいものと同じくらいの大きさであることが、ある分布がロングテールであるかどうかの重要なポイントであり、それは「規模別合計」をチェックすることでできるのです。
 例えば市区町村の人口を調べると人口の多い上位の方はべき乗則のように振る舞いますが、たとえば1000人以下の自治体に住む人口の合計は全人口の0.01%、1000人から1万人の自治体に住む人は全人口の2%しかいなくて、尻切れとんぼなロングテールとはいえない分布をしています。

(註:詳しくは
ロングテールの、ほとんど知られていない、しかしもっとも重要な性質(その2)〜ロングじゃないテールの例〜
にあります)

「規模別合計」は簡単に計算できる


 さらにこの「規模別合計」の大変便利なところは、f(x)という分布に対して、 x f(x) という簡単な計算でその姿が分かることです。上記の例はわざわざエクセルで集計していますが、それなりの手間です。一方べき乗則 1/x について、 x f(x) は 1 と定数になることは一瞬で分かります。
 また実際に集計しようとするとデータがたくさんないとまともな集計になりません。しかし、 x f(x) で計算した場合はデータの点が10個程でも充分その姿を捉えることができます。

 なぜ x f(x) で「規模別合計」が分かるのか、以下に簡潔に示しておきます。ある等比係数Δxに対し「規模別合計」を次のように定義します。


 
 これをxについて微分してみます。





 ここで、Δxを0に近づけると



となり、これはと同じです。従って両者は定数分を除いて等しくなります。

 以上ロングテールの様子を調べるのに便利な「規模別合計」について数学的な解説でした。きっと同じ議論はよそでもされているとは思うのですが、「規模別合計」に対応する学術用語が分からず、いまだに見つけられていません。「それはなんとかのことだよ」とか分かる人いましたら是非教えてください。
posted by 産業創出ネットワーク at 12:00 | 記事 | このブログの読者になる | 更新情報をチェックする

2014年01月08日

「右脳バランス」PDF+EPUB版公開

 ニコニコ動画のブロマガ「未来の普通」で、昨年二ヶ月以上に渡ってお届けした「右脳バランス編」を、まとめました。

 ニコニコ動画のサイトでEPUB版をダウンロードできるようにしたのですが、PDF版が欲しいとか、普段ニコニコ動画使わないので購入が面倒とか、お声を頂きました。

 ということで、Gumroad を利用してダウンロード出来るようにしました。

 発想もめきめき20代からの右脳バランス(PDF+EPUB版)

 購入すればPDF版、EPUB版どちらもダウンロードできます。ぜひお楽しみください!

posted by 産業創出ネットワーク at 17:56 | 記事 | このブログの読者になる | 更新情報をチェックする

ロボットがリーダーになれるかなあ

 おもしろい論文発見

 集団と集合状態との曖昧な境界 : 早朝の公園で見出される多様なアイデンティティ

CiNii。ラジオ体操に集まるゆる〜い集団についての考察。

 楽しく読んだけど、ふとここで出てくるリーダーはロボットにもできそうだということ。毎日同じ時間にラジオ持って現れて、同じ時間にラジオのスイッチを入れ、体操しながら周りに声をかける。ロボットにさせればかなりいい感じの集団が形成されるのではないだろうか。

 たとえば、

 デレク・シヴァーズ 「社会運動はどうやって起こすか」

 に倣って、そのロボットに合わせて体操する人が一人いれば、他の人始めやすいし。合わせて体操する人は、同じ人である必要もないし、毎日でなくてもいいかもしれないし、とにかく負担は少ない。リーダーはロボットに任せて、人間はデレクの言う「最初のフォロワー」を担う。

 介護施設でロボットがファシリテータとかしてるみたいだけど、実際の運用は良く知らないけど、無理にみんな集まれーと強制しなくても、ロボットとさくら(?)一人いればだんだん集まるのかもしれない。

 こういうリーダーは人間よりむしろロボットのが得意と認知される頃には、すでに人間とロボットの共生が普通に受け入れられているのかも。


posted by 産業創出ネットワーク at 14:19 | 記事 | このブログの読者になる | 更新情報をチェックする

2013年12月13日

DMMの3Dプリントサービスと女優の3Dデータ

 先日 dmm が 3Dプリントサービス始めて、それ自身はエロじゃないんだけど、なんかエロの隣で需要あるよねと思っていたら、AV女優の3Dデータが公開されました。着衣で。

 これも直接エロじゃないんだけど、エロの隣。そのサイトでは他の工房を推薦しているので、dmmとつるんでいるわけではなさそうで、みんなその辺に目をつけてるということですよね。

 dmm は艦これという直接エロじゃないけど、エロの隣で爆発的なヒットを作ったり、なんか目の付けどころがするどいと思う。

 3Dプリントサービスどう発展するか楽しみです。

 なお、ここの更新止めて代わりにアネックス作ったけど、滅多に更新できてないので、もうこっちでいいかなと思っています。
posted by 産業創出ネットワーク at 22:14 | 記事 | このブログの読者になる | 更新情報をチェックする

2013年07月05日

高校男子は父を嫌わなくていいのか〜自律性を育むには〜

1011cf511b03733fbe2b7c13fe31756d46c2479e

 前回教育は無償化するのか。3つのポイントの中で、今、子どもに何を教育するかが難しいことに触れました。たとえば企業は新卒社員に「主体性」「規律性」「好奇心・チャレンジ精神」といったものを求めていますが、じゃあそれを鍛えておけば、将来安定した高給の職業につけるのか、誰も保証してくれません。

 いったい何を育むべきなのか、二児の父としてとても悩ましいことです。

「親ラブ族」

 さて、そんな中、このあいだテレビで面白い話題を知りました。「親ラブ族」です。父親が好きな女子高生が増えているとのこと。詳しくはたとえばこのまとめ。

 娘がパパに萌え萌え!親ラブ族の女子高生たち - NAVER まとめ

 昔は、女性は血のつながった父の匂いを嫌悪するように定められてみたいなもっともらしい科学的根拠もあったような気がしますが、ダウトがかかっているわけです。夫婦の仲がいいことが関連したり、今の父親はバブル世代を通して、女性を楽しませることを知っているからではないかという説明があるそうです。

 さて、私に娘はいませんから、このことはよく分かりませんが、では息子はどうなんでしょう。父と息子といえば、あるときから強いライバル関係になったり仲が悪くなったりするイメージがあります。やはり中学生から高校生くらいの頃でしょうか。が、それは当たり前の事、あるいは必要な通過儀礼なんでしょうか。父娘の関係が変わってきていますから、父息子についてもダウトをかけられそうです。

親が子に教えられること

 この変化の激しい社会、今日の常識は明日の非常識、はっきりいって、親から子にこれをしておけば大丈夫、この能力を伸ばしておけなんて自信をもって薦められることなどありません。

 しかし、ならばはっきりと言えることがあります。

自分を助けられるのは自分だけ

 この間の獣電戦隊キョウリュウジャーに出てきたセリフです。いや〜、子ども達が大好きな番組でいいこと言ってくれた、これから使わしてもらいます。

 この言葉一言では自律性と言っています。上に出てきた主体性にもつながる言葉です。

自律性を育むには

 さて、自律性を育てたいと思うところまではいいのですが、自律性を育てるとはなかなか難しいというか、そんなの直接育てられる気がしません。「さあ、ここは自律的に選んでみよう」なんて言った時点で、自律性さようならです。

 私たちにできることと言えば、なるべく子どもの邪魔をしないこと、大人から見ると「え〜」と思うようなことでも、なるべくなにも言わずに我慢する。必要なら見て見ぬ振りをするくらいが精一杯です。なにかもっといい方法があるのでしょうか。

 今社会が求めている能力はこういった直接育てられないものが多いのではないでしょうか。子ども達の内から出てくる力です。たとえば「チャレンジ精神」もそんな気がします。「好奇心」に至っては、子どもはもともと好奇心の塊ですから、むしろ大人や社会が好奇心を奪っているようにみえます。

 大学も直接育てられない能力に注目し、ギャップイヤーなど支援を始めています

自律を助けるテクニック

 閑話休題。自律性は本人に任せて見守ることしかできないとして、親としては、自律的に行動するために必要な具体的な二つのテクニックを教えています。なにかしたいと考えても、それを実現するにはやる気や気合いだけでは限界があります。

 ・やりたいことを途中で止めること
 ジョン・デューイの経験と教育 という本に
教育の理想的な目的は、自制力の創造にある。
という言葉があります。そのときそのときの衝動を抑制する力です。
 
 親としては、「遊ぶの止めて(やるべきことである)宿題をしなさい」という文脈で使いたくなりがちですが、そちらは強調せず、本人の欲望を満たすために大事だと教えています。たとえば大好きなスキーに行くには朝早く起きなければなりません。ですから前の晩、なにかの遊びに熱中していても諦めて、早く寝なければなりません。より大きな欲望・目標のために、今目の前の衝動を抑制する力です。

 それ自身は小さい子でも場面によって自然にできたりします。眠いけど、獣電戦隊キョウリュウジャーの時間になれば、がんばって起きるとか。それを自発に任せるのでなく意図的に起こす力が役に立つのです。

 これについては、このニコニコ技術部の動画に大変お世話になりました。

 車から変形するものすげえロボットで、子ども達も「すげーーー!」と大絶賛なのですが、この動画を見ると2002年の1号機から2012年の7.2号機まで10年かかってることもわかります。「こんなにすごいの作るには10年かかる」と知るわけです。彼らは工作が好きなので、熱中していると延々やろうとしますが、「やりたいのはわかるけど、本当にすごいもの作りたかったら、今は止めてまた明日やり」と諭すことができるようになりました。ためになるニコ動。

 自律するからには、自分のしたいことをやり遂げたくもなるでしょう。自制力を鍛えておくことで、より大きな目標に挑戦することができるのではないかと願っています。

 ・毎日やる
 自律的に目標を立てるとき、目標が大きくなるほど達成は困難になります。「今がんばらねば」と自制力だけ頼るのもしんどくなりがちです。そのために一番てっとり早いテクニックは「毎日やる」ことです。毎日の習慣にしてしまえば、普段は自制力に頼らなくても、歯磨きをするように、目標に向かって進んでいけます。

 そのために、長男(小3)から公文をさせてます。毎日。そりゃもう大変で毎回「公文辞める」とわめく時期もありますし、「公文は自分でやりたいといったわけではない」と理論武装されるときもあります。
 それでもとにかく続けさせてます。一見自律性と矛盾するのですが、「将来何か大きな目標ができたときには、毎日のように取り組まないといけないが、それは公文がそうであるように、とても大変なことで、小さい頃から訓練が必要だ」と説得しています。やはり、10年かかった変形ロボットの話も出しながら。
 本人かなりきつい時期もあったようで、これに固執していいのかはかなり悩ましかったですが、最近転機が訪れました。

自律の芽生え

 いくら将来のためにと思いつつも、毎日長男のモチベーションを維持させるのは本当に困難です。たまに溜まりに溜まった公文の紙を見せて「こんなにやったんやで、がんばったなー」とか(それでもどんどん捨てているのですが)、古い、つまり今となっては簡単なのを見せて「ほら、これ簡単やろ。随分かしこくなったなあ」とか褒めたりしたのですが、あんまり効きません。
 ところが先日3ヶ月ごとに来る個人成績表みたいなので、前回から順位があがったのを指摘したら、なんか言葉はないけど、感慨深い顔をして、つまりなにか手応えを感じていたようでした。これが効くとはちょっとびっくりしました。

 なので、「もうペース落としていいよ。でもやったらやっただけ順位あがるから、行けるだけ行ってみれば」と言うようにしました。すると、最近算数に時間がかかりすぎていたのですが、自分で先生に相談して、やるところを少し戻してました。さぼりたいとかではなく、冷静に自分の力と相談したのでしょう。それからは今のところ調子良くやっています。

 これを象徴に、最近はああ自律的に行動するようになったなあと日々感じます。
 子どもは好奇心の塊なので、幼くても放っておけば好きなこと始めて、面白い成果をあげてくれます。でもそれだけでは自律的だという実感はありませんでした。次男(5歳)はまだその段階です。
 でも、最近の長男は、それが生活全体に行き渡ってきたような感じです。親が今までしつけとして無理矢理しこんで来たこと、たとえば歯磨きなどにしても、自分なりに意味を理解し、できるようになってきたのです。もちろん大人と同じように面倒くさくて仕方ない時もありますが「やらなくちゃ」という意識そのものは安定してきているのです。

 ぜひこれからはその自律性を発揮して、今まで仕込んだ2つのテクニックを使って、どんどんやりたいことに挑戦して欲しいものです。

高校男子は父を敵視しなくていいのか

 そして、今後、もしこのまま自律的な行動を尊重していたら、ここで漸く最初の話題に戻るのですが、父と息子は別にライバルや敵になるプロセスは必要はないのではないか、そう仮説を立てました。

 もちろん、今後もしつけなければならないことはしつけるし、いくら自律的にやりたいことがあっても、家や親の都合で我慢してもらわなくてはいけないこともあります。でもそれ以外はやりたいようにやってもらったり、さらに一緒になにかするときは子どもの意見も取り入れながらやれると思うのです。

 実はロールモデルもあって、親戚の高校男子とか父親と仲いいですし、立派な子だし、「男子たるもの父親に反抗してこそ」なんてこと絶対ないと信じるに足ります。時期が来たらいろいろアドバイスもらおうと思っています。

ようやく自律性を尊重できる時代になり、親ラブ族も生まれた

 しかし昔はなかなかそんなわけにはいかなかったでしょう。社会には「かくあるべき」という行動規範が細かく決まっており、そもそも親がそれに従う必要がありましたし、子どもも親を通して「かくあるべき」を強制されました。もちろん子どもにとってそれは苦痛ですから、反抗しなければなりません。それを通して、でも大抵は自らも社会の細かい行動規範に従う大人に変化してしまうのです。

 でも、だんだん社会は変化しています。社会の細かい行動規範に従うだけで誰にでもできることしかできなければ仕事がなくなる時代です。多様性を確保し、多様な人材と共創していく力が必要です。

 親ラブ族は、そんな時代を背景に、親と子それぞれがそれぞれらしさを認めあって、つまり、子の自律性も認めて、親子で共創を始めたのではないか、そんな風に感じています。

 であれば、父・息子でも同じようなことが起こることでしょう。きっとニコ動でもニコニコ学会でも、私は知りませんが、親子でこんなロボット作りましたみたいなのが出てきてて、そのうち、頻繁に見るようにもなるのではないでしょうか。
 
 それにしても、父親大好き女子高生が増えるとか、ホントに昨日の常識は今日の非常識。世の中なにが起こるか本当に分かりませんね。

 最後ですが長男の話は現在進行形で、つまり、明日には「自律性が芽生えたと感じたの幻想だった」と大反省するかもしれません。「公文辞める!!!」もまたあることでしょう。そしたらすんません。

・併せてどうぞ
【馬】すでに今の普通「ギャップイヤー」の先 大学も直接育てられない能力に注目し、支援を始めました。

posted by 産業創出ネットワーク at 10:45 | 記事 | このブログの読者になる | 更新情報をチェックする
×

この広告は180日以上新しい記事の投稿がないブログに表示されております。