TwitterAPIの罠

[`evernote` not found]

TwitterAPIで、特定のhashで検索したデータのなかで、さらに特定のワードをつかっているかで振り分ける作業をしました。
まず#hogehogeでハッシュタグのデータを収集。
それのなかで【ほげほげ】というワードが含まれているのを抽出するために

	if(preg_match("/ほげほげ/",$value)){
		振り分け処理;
	}

で、うまく抽出できない。あれ？
調べると日本語でマッチさせるために語尾にuを付ける必要があるらしい。（UTF8前提ですが）
というわけで

	if(preg_match("/ほげほげ/u",$value)){
		振り分け処理;
	}

・・・うまくいかない？？？
あれーと思いここでしばらくつまりました。
苦し紛れに出力されたソースをみるとなんじゃこりゃ。対象の数字が。
TwitterAPIから渡された数字は数値文字参照で書かれてたのでした。表示は通常どおり表示されてたので全然気がつかなかった。
というわけで一文追加。

	$value = html_entity_decode($value,ENT_QUOTES,"UTF-8");
	if(preg_match("/ほげほげ/",$value)){
		振り分け処理;
	}

無事マッチさせることができました！！

This entry was posted by admin on 2010年12月20日 at 4:45 PM, and is filed under php, 小ネタ. Follow any responses to this post through RSS 2.0. You can leave a response or trackback from your own site.

コメントを残すコメントをキャンセル

Go to Top

TwitterAPIの罠

コメントを残すコメントをキャンセル

アーカイブ

カテゴリー

Google+

TwitterAPIの罠

コメントを残す コメントをキャンセル

アーカイブ

カテゴリー

タグ

Google+

コメントを残すコメントをキャンセル