こんにちは、ほけきよです!
私はそれほど実績がないので、ブログ論を語ることは出来ません。でも、データに語ってもらうことは出来ます。
良くある「ブログは継続が難しいし、大事だ」といいますね。 そりゃそうなんですが、どのくらい難しいのか、また、どのくらい大事なのか というのはあんまりわかんないですよね。
なので、今回は、はてなブログをぶっこ抜いて、軽く分析してみました!!
ブロガーの生存率はどのくらいか
今回は結論からいきましょう!
下のグラフは何ヶ月ブログが続いているかです。縦軸がブログ数、横軸が継続期間、綺麗な曲線を描き、だんだんと下がっていっているのがわかります。
また、次のグラフは、何ヶ月続けたらブロガー全体の何%に入るかというグラフです。
大体
- 3ヶ月続くブログは70%
- 1年間続くブログは30%
- 2年間続くブログは10%
くらいとなってます。しかもこの条件、3ヶ月に一回書けばとりあえず継続とみなすという激アマ条件ですからね。 いかに継続だけでも困難かが分かります。
継続は力なり?継続期間と読者数の相関
読者数のヒストグラム
次に、読者数もグラフにしてみましょう。
はい、ドン!
実は読者10人に満たないブログがほとんどなんですね。
また、計算をすると、
- 100人以上 : 15%
- 200人以上 : 5.6%
- 300人以上 : 3%
- 1000人以上 : 0.4%
となりました。ナルホドナルホド…自分がどのくらいの位置にいるか気になる方は、是非調べてみてください。
継続期間と読者数
最後に、「継続は力なり」を可視化していきます。
下のグラフは、継続期間と平均読者数をプロットしたものです。 縦軸が継続期間、横軸が平均読者数です。
どうです?きれいな直線になっていることがわかりますね。
赤の線が、継続期間30ヶ月までで線形回帰をした直線になっています。*1係数を調べると、
となっています。つまり、コツコツと続けると、平均的に3.5人読者が伸びていくことを示しています。まさに「継続は力なり」ですね!
どうやって調べたのか
調べ方が気になる方もいると思います。 その方々のために、どういう方法で調べたかを簡単に書いておきます。
ブログリストを作る
分析にあたり、まずはたくさんのブログをかき集める必要があります。 らくからちゃさん(id:lacucaracha)のコチラの記事に載っているアルゴリズムを参考にしました。
超ざっくり言うとこんな取り方をしてる。詳しくはgithubに乗せておくので、どうぞ。(get_hatena_blogger.py
)
完全に全てのブログを網羅できるわけではありませんが、傾向を分析したいので、今回は2万件程度にしておきます。
デフォルトでは1000件のブログデータが集まるようになっていますが、増やすことも可。使い方が分からない人は適当に聞いてください。
色々と必要なデータを取る
さっきの集めたリストを使って、いろんなデータをとって行きましょう。(ΦωΦ)フフフ…
ここで取ったデータは、
- メインブログURL
- ブログ開始時期
- 記事の数
- ブログ継続期間
- 読者数
です。今回は生存率に一番関わってくる、継続期間をどうやって出したのか、抽出アルゴリズムを簡単に説明します。
継続期間を抽出する
ブロガーの状態を4つの状態に分けています。
Yet
まだ始める前の状態。ブロガーになる前Active
ブログを頑張っている状態Pause
活動休止中。まだ間に合うDead
死亡。
アルゴリズムはコチラ
生き続ける最低条件は3ヶ月に一回は書くということです。 皆さんは生きられていますか?
分析する
集めたデータをpandas
を使って分析します。
詳しくはGith(略)
まとめ
いかがでしたか? やっぱり続けるのって難しいし、続けていくことで成果は着実にでることがデータからわかりましたね。
またなんか面白いネタ思いついたら記事にします!