basyura's blog

あしたになったらほんきだす。

HatebuRate - 自分でタイトルに重みを付けてはてブのタイトルを一覧表示する

f:id:basyura:20130923221312p:plain

はてブのタイトル一覧から自分が読みたい記事をリストアップする web サービスを作ってみた。ただし、利用者は自分だけ (ログイン機能とかなんもない)。

Gnosy を使ってみてたのだけど自分にあった記事が見つかるかって言うと・・・?
開くと興味なくても興味あると判定されて関連したものがピックアップされるし、そもそもネタ元がはてブだから「それ見たし」という記事ばかりでなかなかうまく行かないなぁと。
今は改善されてるのかもしれないけど。

自分でこれは興味あった無かったを判定して、自分で興味ある記事をピックアップしたいよと思ったのでチマチマ作ってみた。

使ったもの

  • Rails4
  • sqlite3
  • twiter bootstrap
  • instapaper
  • mecab
  • さくらVPS

どんなふうに

  • 記事の元ネタは、はてブから (http://b.hatena.ne.jp/entrylist?sort=hot&threshold=3&mode=rss)
  • cron で rails の task をキックして記事一覧を取得
  • はてブを見るときほ、ほぼタイトルしか見ないからタイトルだけで判定
  • いい感じに解析したいけど知識がないので、mecab で単語に分割 (してみただけ・・・)
  • 面白かったら ↑ そうじゃなかったら ↓ でタイトルの単語に点数をつける
  • 点数が高いタイトルを優先的に表示し、しきい値をつけてページにリストされるタイトルを制限する
  • 点数が高い記事は instapaper の api を叩いて登録
  • 毎朝 instapaper から kindle に配信

どうなったか

  • 見たくない記事が表示されなくなった
  • ↓ は多いが、↑ はなかなかない
  • 見たい記事がリストアップされたかというと??

まとめ

ログイン機能が無いのでこっそり運用しているけど、自分で作ったものを使うのが面白いからいいかな。
まとまってない。