get_meta_tags 練習した
ということで、何か使いたくなったので自分専用ブックマークでも勢いで作ってみた。なんかいろいろ抜けてそうだけど自分専用だからいいや。ブックマークしたいページのURLを入れるとリンク付きタイトル、author情報、description情報、keyword情報を保存、表示。こんな感じ(↓)しゃきーん。
なんかいろんなサイト登録して試してみたりしたんだけどauthor情報入ってるところに遭遇しなかった・・・。私自身入れてないしなぁ。
PHPでtitleの中身取り出す方法
PHPでtitleの中身取り出す方法が分からなくてググってみたらfile_get_contents関数を使ってソースを取り出して正規表現でtitleタグを取り出す方法が判明。こちらのソースを丸々使わせて頂きました。
PHPでWEBページのタイトルを抜き出すサンプル ::: creazy photograph
titleタグを取り出すためだけにfile_get_contentsで全部htmlソース取得するとか普通のことなのかどうか分からん。なんか体力使いすぎてる気がするけど何か他に方法ないんかな・・・。こういうものなのかな。
日本語扱うの、文字コードの部分難しいな。文字コードが違うサイトを登録した時最初タイトル部分が文字化けして一瞬頭の中こんがらがっちゃった。
<< get_meta_tags とか便利すぎる! | htmlSQL すごかった。感動した。 >>
トラックバック
このエントリーのトラックバックURL:
http://redline.hippy.jp/cgi/mt/mt-tb.cgi/229
コメント (2)
いつもブログを興味深く読んでます。
HTMLの情報を取得する方法ですが、
htmlSQLというモジュールが便利です。
こちらの記事が参考になりますよ。
http://www.ideaxidea.com/archives/2007/11/htmlsqlphphtmlsql.html
ご参考までに。
投稿者: jar2 | 2009年02月17日 15:35
>jar2さん
コメントありがとうございます!
これはめっちゃすごい!と思ってブクマしようとしたら「2007年11月12日に登録済み」とかになってました><
過去に見たときにもこれはすごい!って自分で思ったんでしょうけど・・・やっぱ必要な時にタイムリーじゃないと見たことある記憶すら飛んでますね(汗
さっそく試してみたいと思いますー!
ありがとうございました(n' ω 'n)
投稿者: Red | 2009年02月17日 21:47