ちょっと思うところがあって、このブログの記事を全文検索エンジンである Hyper Estraier のインデックスに放り込んで、キーワード抽出してみたり、関連記事検索をしてみたり、という実験をごそごそやっています。
Hyper Estraier には、ファイルシステム上のテキストや HTML などのファイルを一括でインデックスに登録するツールは付属しているのですが、ご存じの通りここで使っているブログシステムの Nucleus は、記事データをファイルではなく MySQL などのデータベース上に保存しているので、付属のツールは使えません。
Web を検索してみたら、Livedoor の中の人が同じようなことを行ったメモ(Hyper Estraier で検索)を公開してくれていて、それをほんのちょっとだけ書き換えたら簡単にできちゃいましたので、そのコードをお裾分け。
» 続きを読む……