こんにちは!ほけきよです。
自分できちんとした(?)文章を書くのは久しぶりです。
それまで何をしていたかというと自動記事生成のためのプログラム書いたり、泥臭いHTMLの調整したりしていました。 ある程度まとめて仕上げたくてね。それもだいぶ落ち着いてミニサイト風にすることができたと思います。
今回は、自動生成記事を作ってみての気づきをまとめておこうと思います。
ウェブ上の自動販売機にしたかった
もともとのモチベーションは、新鮮で有益な情報を自動で集め、更新する記事をいくつか作ることでした。 フォーカスしたのがセール情報。客観的な情報というのは誰が見てもそうである情報なので、自分の感情を入れる必要がないのです。 そしてそれは機械がもっとも得意とするところでしょう。
機械でできるところは機械でさせたい! と思い、チャレンジしました。
そのときの様子などは前に記事にしたので、ご覧ください。
テンプレート+自動情報収集のススメ
時間を割く箇所が変わる
商品紹介などを多くこなす人などは、構成をテンプレート化している人も多いと思います。 情報を入れる箱を用意しておいて、その箱に情報をはめ込むことで、効率的に記事を作ることができます
基本的には、テンプレートはあらかじめ用意して、情報の質を上げていく。という方向で記事を書くのではないでしょうか。 しかし、情報が自動収集できるのであれば、その方向性は逆転します。 テンプレートの質向上に時間を費やすことができるのです。
見せられる情報にするまでの泥臭さ
ある人がコメントで「こんなの簡単だろwだれでもできるわww」と言っていました。 技術的にはその通りで、そんなに難しいことをしていません。実際1時間もあれば情報を抜き取るスクリプトを組むことはできます。
けど、 抜き取った情報を人様に見られるようにするためには、また別次元で時間がかかります。しかもとても泥臭い。
できそうと思うひとは一度チャレンジしてみるといいと思います。実はものすごーーーーく細かな、ものすごーーーーく泥臭い作業のオンパレードですよ。
たとえば、
「カッコ"("が全角の場合と半角の場合がある...」
とか。もうそういうのばっかり。
自動情報収集により、UIに全振りできる
見せ方、情報へのアクセスのしやすさなどの、いわゆる定量化しづらい部分は、やっぱりセンスが必要です。けれど、読者にとってはとても大事。 ウェブ力の足りない私、「これなら、まあ見やすいかな」の妥協点に達するまでに、かなりの時間がかかりました。
逆に言うと、情報を簡単に収集できるようになったからこそ、UIやSEOに意識を全振りさせることが可能になりました。 入れる情報は一緒だからこそ、見せ方や文言を変えるとGoogleや読者はどういう評価をしてくれるのか、その箱の試行錯誤に集中できるようになりました。
機械にできるところは機械に任せ、人が行わなければならないところだけ注力する。 それができるようになっただけでも、自動化記事導入のメリットがありました。
Googleのスパム判定...
一個だけ、注意点というか、実際起こったことなので書き残しておきます。 このKindleセール情報の記事は、多くの読者に読んでいただき、また公開してからの数日、このページからたくさんの商品を購入していただけました。 普段ひと月で10000円いくか行かないかの当ブログ、この記事公開後の三日間だけで10000円分の報酬となりました。ゆきち、とてもうれしい。
またブックマークもたくさんいただけました。いい記事になったと自負しています。
公開後の3-4日で、
「Kindle セール」で検索順位が8-12位くらいをうろうろしていました。
しかし、公開1週間後くらいから、様子がおかしくなります。 いくら探しても、自分の記事が検索に引っかからなくなりました。
調べてみると、どうやらリンクが多すぎて、文章量が少なすぎると、Googleが自動的にスパム判定をするらしい。 (参考 : Googleペナルティの原因と確認・解除方法)
見やすさを重視して文章をなるべく削ぎに削いだ結果がスパム判定。残念すぎる。 2週間くらい我慢してみても戻ることはありませんでした。
結局、本来別記事に分けるはずだったKindleについてのQ&Aをむりやりページ後部につけることで、文章を水増し。 すると、検索順位が翌日から12-20位くらいまで戻りました。なんか前時代的なナニカと自分の欲望に負けた感があって悔しいけれど、まだGoogleのbot自体はUI等をきちんと評価できるものではないのでしょう。人によって違いますしね。
検索順位監視中
現在Amazon関連のミニサイトをつくり、いろいろと順位を監視したりしています。 「Amazon セール hoge」のワードで1ページ目に載せられればいいのですが、まだ2ページ目が多いですね。 公開1ヶ月ということも関係あるのかもしれませんが、内部リンクや、際と設計、ワーディングなども関係しているのでしょう。
今後Amazon関係のサイトに関しては、上位取れるよう、勉強しながら試行錯誤していきたいと思ってます!内容は自動収集の分、そういうところに注力できるのがありがたい!
使った技術
「どのようなことを勉強すればこういうことができるようになるの?」
という意見をいただいたので、本当に簡単に、使った技術に関して「こういうワードをググればいいよ」程度の列挙を。わからなければ聞いてください。
- スクレイピング/クローリング : Web上の情報収集テクニック
- Amazon API : Amazonが提供する、スクレイピングを簡単に行えるAPI
- Python : 上記を実現するための言語。別に何でもよいが、周りに聞ける言語がいい。
- HTML/CSS : 記事の体裁を整えるために知っておくといい。外注してもいいと思う。お金があったら外注したい。
- Bootstrap : 記事のスタイルを簡単に調整できる。ちょっと読み込みおそくなるのかな?最近バージョンアップ(bootstrap4)したが、3系の記事が多いので注意。
まとめ
いかがでしたか。機械ができる部分と人間がしなければならない部分を明確に切り分けることによって、 本来すべき作業にだけ注力できる。これがもっとも大きなメリットですね。 あと副次的な効果として、HTMLやCSSに対するアレルギーが消えました。はてな記法みたいにプラットフォーム依存の言語を書くくらいなら、HTML直書きのほうが、ちょっと学習コスト高いけどあとあと楽かなと思いました。