RedLine Magazine : get_meta

get_meta_tags 練習した

ということで、何か使いたくなったので自分専用ブックマークでも勢いで作ってみた。なんかいろいろ抜けてそうだけど自分専用だからいいや。ブックマークしたいページのURLを入れるとリンク付きタイトル、author情報、description情報、keyword情報を保存、表示。こんな感じ（↓）しゃきーん。

キャプチャ・私専用ブックマーク

<?php
//error_reporting(E_ALL);
//ログ用データファイル
$data_file = "data.dat";
$self = $_SERVER["PHP_SELF"];

print <<< FROM_END
<form method="post" action="$self">
<p>URL　<input type="text" name="url" size="100" />　<input type="submit" name="submit" value="登録する" /></p>
</form>
FROM_END;

$url = isset($_POST["url"]) ? $_POST["url"] : NULL;
$url = htmlspecialchars($url, ENT_QUOTES);

if(@$_POST["submit"]){
	$error = "";
	if(!$url){$error = "<p class=\"error\">URLが入ってません。</p>\n";}
if($error){
	echo $error;
}else{
	$title = getPageTitle( "$url" );
	$tags = get_meta_tags("$url");
	$author = isset($tags['author']) ? $tags['author'] : "author情報なし";
	$description = isset($tags['description']) ? $tags['description'] : "description情報なし";
	$keywords = isset($tags['keywords']) ? $tags['keywords'] : "keyword情報なし";
	$keywords = str_replace(","," / ",$keywords);
	$bookmarks = "{$title}\t{$url}\t{$author}\t{$description}\t{$keywords}";

file_put_contents($data_file , $bookmarks . "\n" , FILE_APPEND | LOCK_EX);
}
}

$bm_list = file($data_file);
$bm_list = array_reverse($bm_list);
$num = count($bm_list);

echo "<dl>";
for($i = 0; $i < $num; $i++){
	list($title2,$url2,$author2,$description2,$keywords2) = explode("\t",$bm_list[$i]);
	echo "<dt><a href=\"$url2\" target=\"_blank\">$title2</a></dt>";
	echo "<dd>$author2</dd>";
	echo "<dd>$description2</dd>";
	echo "<dd class=\"keyword\">$keywords2</dd>";
}
echo "</dl>";

//PHPでWEBページのタイトルを抜き出すサンプル ::: creazy photograph
//http://creazy.net/2008/05/php_get_page_title_sample.html
function getPageTitle( $url ) {
    $html = file_get_contents($url);
    //$html = mb_convert_encoding($html, mb_internal_encoding(), "auto" );
	$html = mb_convert_encoding($html, "UTF-8", "auto" );
    if ( preg_match( "/<title>(.*?)<\/title>/i", $html, $matches) ) {
        return $matches[1];
    } else {
        return false;
    }
}
?>

なんかいろんなサイト登録して試してみたりしたんだけどauthor情報入ってるところに遭遇しなかった･･･。私自身入れてないしなぁ。

PHPでtitleの中身取り出す方法

PHPでtitleの中身取り出す方法が分からなくてググってみたらfile_get_contents関数を使ってソースを取り出して正規表現でtitleタグを取り出す方法が判明。こちらのソースを丸々使わせて頂きました。

PHPでWEBページのタイトルを抜き出すサンプル ::: creazy photograph

titleタグを取り出すためだけにfile_get_contentsで全部htmlソース取得するとか普通のことなのかどうか分からん。なんか体力使いすぎてる気がするけど何か他に方法ないんかな･･･。こういうものなのかな。

日本語扱うの、文字コードの部分難しいな。文字コードが違うサイトを登録した時最初タイトル部分が文字化けして一瞬頭の中こんがらがっちゃった。

2009年02月17日 13:37 | Red | パーマリンク

<< get_meta_tags とか便利すぎる！ | htmlSQL すごかった。感動した。 >>

トラックバック

このエントリーのトラックバックURL:
http://redline.hippy.jp/cgi/mt/mt-tb.cgi/229

コメント (2)

いつもブログを興味深く読んでます。

HTMLの情報を取得する方法ですが、
htmlSQLというモジュールが便利です。

こちらの記事が参考になりますよ。
http://www.ideaxidea.com/archives/2007/11/htmlsqlphphtmlsql.html

ご参考までに。

投稿者: jar2 | 2009年02月17日 15:35

>jar2さん
コメントありがとうございます！
これはめっちゃすごい！と思ってブクマしようとしたら「2007年11月12日に登録済み」とかになってました＞＜
過去に見たときにもこれはすごい！って自分で思ったんでしょうけど・・・やっぱ必要な時にタイムリーじゃないと見たことある記憶すら飛んでますね（汗
さっそく試してみたいと思いますー！
ありがとうございました(n' ω 'n)

投稿者: Red | 2009年02月17日 21:47

名前：

メールアドレス：

URL：

この情報を登録しますか?

コメント： ※コメント欄に「<」「>」等を含むソースを記載する場合は実体参照に変換してください。

このページの一番上へ

REDLINE MAGAZINE | get_meta_tags 練習した

最近のエントリ

カテゴリー別アーカイブ

実験ネタカテゴリ一覧

本・ツール・webサービス等のレビュー一覧

リンク集一覧

スペシャルコンテンツ

このサイトに関する情報

get_meta_tags 練習した

PHPでtitleの中身取り出す方法

トラックバック

コメント (2)

その他の情報など

最近のコメント

PHP オブジェクト指向の勉強

Fireworks トリミング画像を一括書出 CS4編

jQueryでボックスを上下左右中央に簡単配置

overflow を使用したボックス背景のこと

IE6 → 透過PNG+overflow=混ぜるな危険（追記有）

よく検索されている記事

メッセージを送る