タグ「検索」が付けられているエントリー

PHPでTwitterのプロフィール検索してリストを作る方法(OAuth対応版)

| PHPでTwitterのプロフィール検索してリストを作る方法(OAuth対応版)

Twitterのリスト機能って便利ですよね.例えば,イベントなどでその関係者のつぶやきを一覧したい,でもフォローするのはアレだしって時に使えます.同様に,ある共通の趣味を持っている人を集めるとか,ある特定の病気と闘っている人を集めるとか,色々と応用ができます.そんなこんなで,最近はリストを作って喜んでます.

そんなこんなで,今日はTwitter標準のAPIではできないことをサードパーティ製APIで実現しまくる方法を紹介します!具体的には,プロフィールに特定のキーワードが含まれているユーザを抽出して,リストを作る方法です.実装はいつも通りにPHPでOAuth対応です.書き忘れていますが,ソースは当然の如くUTF-8で保存してくださいね.

tps.lefthandle.netのAPIを用いる場合
Twitterのプロフィール検索を提供しているサードパーティは,ざっくり調べた感じでは2カ所あります.そのうちの1カ所がtps.lefthandle.netです.主な仕様としては,GETリクエストに対してJSONで返事します.結果は最大100件で,ユーザー登録順,follower数順,最近のつぶやき順が選べます.というかドキュメント読んで下さい

このAPIを使ってプロフィール検索をして,引っかかった人をリストに追加するコードはこんな感じです.

<?php
$ids = 'yourscreenname';
$listname = 'listname';
$url = "http://api.twitter.com/1/$ids/$listname/members.json";
$q = urlencode('キーワード');
$sortmode = 'recent';//
register, follower
//search APIのURL
$c = curl_init("http://tps.lefthandle.net/rest/?s=$q&sort=$sortmode");
curl_setopt($c, CURLOPT_RETURNTRANSFER, true);
$response = curl_exec($c);
curl_close($c);
$json = json_decode($response);
//リストに追加する
foreach ($json as $u) {
$param = array('id' => $u->screen_name);
$res = twitter_api($url, OAUTH_HTTP_METHOD_POST, $param);
}

//twitter api
function twitter_api($url, $method=OAUTH_HTTP_METHOD_GET, $param=null) {
$consumerKey = '
consumerKey';
$consumerSecret = '
consumerSecret';
$oauthToken = '
oauthToken';
$oauthTokenSecret = '
oauthTokenSecret';

try {
$oauth = new OAuth($consumerKey, $consumerSecret,
OAUTH_SIG_METHOD_HMACSHA1, OAUTH_AUTH_TYPE_URI);
$oauth->setToken($oauthToken, $oauthTokenSecret);
$oauth->fetch($url, $param, $method);
$response = $oauth->getLastResponse();
return $response;
} catch (OAuthException $e) {
return $e;
}
}
?>

ベリーイージーね.前提として,リストは作っておいて下さい.空でも空じゃなくても構いません.もちろん,エラー処理がいい加減なんで,適当に修正して下さい.OAuthのトークンは適当な方法で取得して下さい.この方法だと,検索に引っかかった人を無差別に登録するので,既登録の人を再度登録しようとしたりして無駄が多いので,既登録者リストとの差分を取るとかの工夫をしたら良いんじゃないかと思います.

twpro.jpのAPIを用いる場合
もいっこの方がtwpro.jpです.主な仕様としては,GETリクエストにJSONで返事します.IPアドレス毎に1000回/時のAPIコールが可能です.また,検索結果が最大300件となっています.また,JSONPのコールバックが使えます.使わないけど.まぁ,ドキュメント読んでね.

このAPIを使ってプロフィール検索をして,引っかかった人をリストに追加するコードはこんな感じです.

<?php
$ids = 'yourscreenname';
$listname = 'listname';
$url = "http://api.twitter.com/1/$ids/$listname/members.xml";
$q = urlencode('キーワード');

//search APIのURL
$c = curl_init("http://api.twpro.jp/1/search?q=$q&num=300");
curl_setopt($c, CURLOPT_RETURNTRANSFER, true);
$response = curl_exec($c);
curl_close($c);
$json = json_decode($response);
//リストに追加する
foreach ($json->users as $u) {
$param = array('id' => $u->screen_name);
$res = twitter_api($url, OAUTH_HTTP_METHOD_POST, $param);
}

//twitter api
function twitter_api($url, $method=OAUTH_HTTP_METHOD_GET, $param=null) {
$consumerKey = 'consumerKey';
$consumerSecret = '
consumerSecret';
$oauthToken = '
oauthToken';
$oauthTokenSecret = '
oauthTokenSecret';

try {
$oauth = new OAuth($consumerKey, $consumerSecret,
OAUTH_SIG_METHOD_HMACSHA1, OAUTH_AUTH_TYPE_URI);
$oauth->setToken($oauthToken, $oauthTokenSecret);
$oauth->fetch($url, $param, $method);
$response = $oauth->getLastResponse();
return $response;
} catch (OAuthException $e) {
return $e;
}
}
?>

こんな感じかな?いいんじゃないかな?どっちのAPIも良くできているよ.

GazoPa Bloom

| GazoPa Bloom

超絶速報!類似画像検索で有名なGazoPaが「この花なに?」検索を可能にするGazoPa Bloomを開始した.

GazoPa Bloom is a flower community site that enables users to search, discover and share flower information. GazoPa's similar image search technology is integrated in this site, and users can search for flowers by uploading flower photos that are unfamiliar to them. Utilizing similar image search technology, users can find candidate flowers and can also ask other users to help them identify these flowers.

すごいぞ!すごいぞ!簡単な説明についてはYoutubeをご覧あれ.

ということで,いつも通り,試用してみます.まずは,写りが悪い桜をターゲットにしてみます.対象画像はこれ.

IMG_1357.JPG

で.結果はこちら.

100323_gazopa01.jpg

赤枠で示したものがサクラです.類似度も91.91%で申し分ありません!ただ,残念なことに,このアイテムは分類されていませんでした.

100323_gazopa02.jpg

そのため,Winter Roseではないかと表示されてしまっています.もったいない!Go KojimaさんはGazoPaの中の人だった気がします.是非とも,Classifyしてください!

次はflickrのから拝借したヒマワリで試してみます!

100323_gazopa03.jpg

ヒマワリは英語でsunflowerなので,どんぴしゃです!すばらしい!すごいぞGazoPa!いけいけGazoPa!

まとめ:
「この花なに?」検索がついに実現しました!これでにわかカメラマン歓喜です!ただ,類似度の判定が厳しいのか,特徴量の抽出がいまひとつなのか,誤った判断をすることがしばしば見受けられます.しかしながら,これは多くのユーザが利用して,フィードバックすることで改善されるでしょう.いざ,今こそ,プライベートベータに!

関連:
類似画像を見つけてくれる日本発画像検索エンジンGazopaを試してみた - 4403 is written
GazoPaの新機能flowを試してみた - 4403 is written
[超速報]GazoPaがやりやがった! - 4403 is written

KDDIは1日、カメラ付き携帯電話で撮影した建物の名称や周辺情報を瞬時に検索できる新技術を開発したことを明らかにした。実用化すれば、地図を携帯して外出先で調べる煩わしさから解放され、営業マンや観光客らにとって利便性が高まりそうだ。

建物名を1秒で検索=携帯で撮影・送信するだけ-KDDI(時事通信) - Yahoo!ニュース

KDDIが新しいタイプの検索技術を開発したらしい.建物を撮影して送ると,建物の名称や周辺情報を瞬時に検索できるらしい.よく分からない.建物の画像だけから判断するのだろうか?位置情報は使わないのだろうか.

「地図を携帯して外出先で調べる煩わしさ」といっているが,今時のガラケーならGPSで周辺地図を取得することくらい造作もないことだと思うのだが,それでは取得できないような建物名でも取得できるのだろうか?iPhoneならマップかAroundMeで解決できそうな気がする.

個人的には,写真を送ると,それがどこで撮られた写真なのかを返して欲しい.Web上で見かけた「あーこの写真の風景綺麗だなー.どこで撮られたんだろう?」を見つけたい.GPSを搭載していないデジカメで撮った写真でも,GPS情報というかジオタグを付けて,ライフログりたい.ライフログ的な意味で.そういう技術が出てこないかなぁ・・・.

関連:
たった1枚の写真から撮影場所を特定する技術 - 4403 is written
IM2GPS: estimating geographic information from a single image

200908032010追記:
プレスリリースを発見.GPS必須か.

Similar Images allows you to search for images using pictures rather than words. Click the "Similar images" link under an image to find other images that look like it. Try a search of your own or click on an example below.

Google Similar Images

帰宅後にGazoPaと比較します.

200904241745追記:
帰宅後どころか,後日になってますが,レビューします.Googleのサービスだけあって,今更オレがレビュることもないような気がしますが・・・.

じゃぁ,対戦させましょう.今日のお題は,WRCからCitroen C4で行きましょう.

Google Similar Images

090424_gsi01.png

GazoPa

090424_gazopa01.png

どうしたGazoPa!?Google Similar Imagesに負けているではないか.この結果はmoderate1だが,moderate2でもshapeでもfaceでもcolorでも,C4がでてきませんが・・・.あっれー?

その後,いろいろと試したんですが,GazoPaの結果は芳しくないです.おかしいなぁ・・・.昔はもっと良かった気がしたんだけど・・・.

まとめ:
Google Similar Imagesが便利で仕方がないようです.もうちょっといろいろと試してみたいと思います.

GazoPa for iPhone
GazoPa for iPhone app is available at iTunes App Store, now you can use GazoPa at PC and iPhone as well. Uploading any photo captured with camera on iPhone, similar images on the web can be searched.

ついにやりやがった.前々から注目していたGazoPaだが,ついにやりやがった.

最早,動画を見てもらえば,分かる通りだ.iPhoneで撮影した「なんだかわからない何か」をGazoPaに問い合わせることで,それっぽいものを探してきてくれる.なんということだ!まさに,シチュエーション2ではないかっ!これはすごい!すぐに試さねば!

090406_gazopa01.jpg

く,屈辱だ.なんたる屈辱・・・. スパボ一括で買ってこいってことか?というわけで,試したいのに試せない状態になっています.悔しい・・・.

これで後は,ネット上に転がっている画像がタギングされていると・・・.「これなに?」検索が可能になるわけですねっ!わかります.きっと,GazoPaならそこまでやってくれると信じている.

関連:
類似画像を見つけてくれる日本発画像検索エンジンGazopaを試してみた - 4403 is written
続々と実現される世界 - 4403 is written
GazoPaの新機能flowを試してみた - 4403 is written
たった1枚の写真から撮影場所を特定する技術 - 4403 is written
ヘタレ系DのBlog(終了しました): どうやって見つけるか?

CEATEC JAPAN 2008のレポートでちょっと書いた情報大航海プロジェクトのViewサーチ北海道.なにやら商品検索の試験的なサービスを開始したらしい.ターゲットは楽天市場のセレクトショップ.

【楽天市場】セレクトショップコレクション:洗練されたセレクトショップのこだわりアイテムが勢揃い!

今日からの期間限定らしいので,試して衝動買いすればいいと思います.対象になっているのは以下の4品目.

なるほどなるほど.似通った商品がクラスタされるので,自分好みの商品を探すのには向いていそうです.ネット版ウィンドウショッピングといった感じです.ただ,実際の世界に対応させると,値札をチラ見しながらという状況が多々あると思うので,値札を如何様にかして再現していると,より現実感があって楽しいかと.

081216_rakuten01.png

かわゆすなぁ.レビュー記事を書くためとはいえ,女性の服をじっくり眺めることができて,心が潤いますなぁ(ぇ.これで買った商品を着て,View サーチ北海道並みにクルクル回すってのは,ブログネタ的に美味しいと思いました.

ちなみに,この案内はImageCruiserのデータクラフトから送られてきたのだが,なかなかにインシデントだった.

081216_datacraft.png

オレ,完全特定されたなw.

関連:
CEATEC JAPAN 2008 - 4403 is written
タグに頼らない画像検索「Viewサーチ北海道」 - 4403 is written

新型はてブが始まった模様です.はてブ2.0でしょうか.違いますね.知ってます.色々と新機能を見ていきたいと思います.

081125_hatebu01.png

ついに来ました.「お気に入られ」が見れるようになりました.今までは裏技的にグーグル先生に尋ねる必要がありました.もちろん,正確性も怪しかったのですが,今回はオフィシャル機能なので確実!プライベート設定の人までは丸見えではありませんが,今まで見えなかった人が見えて,楽しい!

081125_hatebu02.png

新型ブックマークレットは良いような悪いような.ポップアップウィンドウなので,画面を確認しながらブクマできるので,その点は良いかと思いますが,はてブ時のアシスタントとして大活躍していたGreasemonkeyのhighlight mytagsが使えなくなりました.これはイタイ.

bbeta ってデフォルトで AutoPagerize ついてるんだ。変なボタン押すと有効になるっぽい(haihai sakura sakura)

Twitter / hotchpotch: bbeta ってデフォルトで AutoPageriz ...

なるほど.AutoPagerizeが機能していなくて,不便になったなぁと思っていたが,セルフ実装されていたのか.

081125_hatebu03.png

これを押せばいいんですね.わかります.

081125_hatebu04.png

なるほどなるほど.個人的にはAutoPagerizeの動きの方が先読み感があって好きです.こっちのは完全にページ下に来てから読み始めるので,待ちがあります.サクサクじゃない!

それから,地味すぎてアピール度合いが足りないインクリメンタルサーチ.

081125_hatebu05.png

これ,めっちゃ便利なんだけど,こんなの動かして大丈夫なんだろうか.今のところはてブ全体が重いんですが,これの所為じゃないですよね?ただ単に,みんなクリックしすぎなだけですよね?今日は初見だから仕方がないとして,これからもずーっと重いと嫌になっちゃうなぁ・・・.と懸念を述べてみる.

関連:
はてブリニューアル? - kakku blog
はてなブックマークのリニューアルについて - はてなブックマーク日記 - 機能変更、お知らせなど

日本発の類似画像検索エンジンであるGazoPa以前に紹介したが,そのGazoPaからメールが届いた.

Here are new features we released recently.

(中略)

flow
'flow' is the feature that helps users to enjoy various images. It seems slideshow, but images are displayed based on search parameters such as a color and a shape. These parameters can be set automatically and users don't need to set them. Users only need to click 'flow' below the key image and 'flow' starts.

Basically, search requires activeness, but not all users want to click search button many times. This 'flow' feature gives you opportunities to encounter images and to enjoy image search comfortably. Just click 'flow' below the key image. Enjoy it!

New Feature Release from GazoPa

だそうです.英語なのでよくわかりませんが,``flow''という新機能が追加されたので,使えやゴルァ!といってそうな気がします.類似画像検索でググルとトップに出てくるブログらしく,レビューしてみたいと思います.一応,GazoPaのエントリーがこのブログで1番PVが多いエントリーです.以前まではKB888111のエントリーだったんですが,急に入れ替わりました.そんなこんなで,みんなの期待に応えてみる.

081124_gazopa01.png

このような形で,画像がどんどん表示されます.この後,左上の画像に対して,shape, color, moderate1, moderate2といった観点から画像をどんどん流してきます.GazoPaの類似検索能力の高さが伺えます.また,パラメータが4つあるため,それぞれの違いをパッと見で理解できるので,楽しいです.moderate1と2の違いというか,moderateっていうパラメータがどういうものなのかが,今ひとつ理解できない.

それはそれとして,上の画像の赤四角で括った画像は,同一画像に見えるだろう.GazoPaの類似画像検索能力の高さを持ってすれば,これらの画像を同一視して処理することが可能ではないのだろうか.だとすれば,flowのような流し見機能下においては,これら同一と思われる画像をパージした方がよりよいアピールになるのではないだろうか.

そしてもう1つ,GazoPaの能力の高さ故の問題点を挙げておく.以下,画像を3連発.

081124_gazopa02.png 081124_gazopa03.png 081124_gazopa04.png

類似画像検索能力が高すぎて,類似画像が膨大にある領域に突入してしまうと,なかなか抜け出せなくなる.最初に試した時はCAPTCHAの画像が延々と出続けるという恐ろしい場面に遭遇した.是非,みなさまも試して頂きたい.

それから,以前のエントリーで「誰か試して!」と述べたDrawing機能だが,今は他の人が描いた絵を見ることができるようになったので,その機能の素晴らしさが実感できます.似た形状や色といった,特徴が明らかなものは検出精度が高そうです.しかしながら,やはり絵心は必要かと.オレには使えない機能です><.

まとめ:
酷評しているように見えますが,それもこれもGazoPaエンジンの能力の高さ故の弊害です.類似画像検索機能としては,現状のピカイチではないでしょうか.皆さんも試してみればいいと思います.

なお,オレには友人を50名ほど招待する権利があるようです.どうもアカウントを入手する待ち行列があるみたいです.どのくらいで捌けるのか知りませんが.すぐに試したいって方は,ご連絡頂ければ,招待可能かと思います.右サイドバーにあるメアドまでご連絡下さい.

関連:
類似画像を見つけてくれる日本発画像検索エンジンGazopaを試してみた - 4403 is written

200811262136追記:
GazoPaの中の方からブクマコメを頂きました.

うれしいコメント。描画機能はデフォルトパラメタをshapeに変更したので以前よりかはいい感じになったのではと思います。

はてなブックマーク - GazoPaの新機能flowを試してみた - 4403 is written

そう思います.いや,確証はないけど.初期の頃は絵心の無さ加減に,まともな検索結果を得られなかった.だから,他人の描いた絵を使ってでも試せる今の状況しか分からないが,確かに良い結果が返ってきます.昔との相対比較はできないけど,単純に今のDrawing機能は十分な結果を返してます.これからも頑張って!そして,オレの夢を実現して!シチュエーション2とか3とか.

オレは世界が良い方向に回るのならば,それを回す役目はオレである必要はないと思っていて,それは即ち,研究においても同じで,オレがやらなくても,誰かがやればいいと思っている.そもそも,色々な実績を蓄えている人や研究室が総力を挙げてやれば,すぐにできるようなアイディアがあったとして,それを彼らは思いついていなくて,それをオレが思いついてしまって,ノラリクラリと基礎から勉強して,のんびり発表していくくらいなら,アイディアだけを提供して,世界がグルグル回っていく様を遠目に見ている方が,多くに有益だと思っている.

そんな今日,グーグル様が新しいサービスを展開しやがったようです.

米大統領選挙が大詰めを迎えるに当たって、Googleの社内では、一部の優れたエンジニアが、候補者のBarack Obama氏とJohn McCain氏の発言を比較できる新ツールを作成した。Google Labsのプロジェクトとなる、「Google In Quotes」という名称の新ツールでは、「economy(経済)」などの用語を入力して検索すると、その用語に関連した両候補の発言内容がリストアップ表示される。

「spin」ボタンをクリックすることで、異なった発言を表示できるようになっており、Google Newsの掲載記事から、最新の全発言が検索結果に示される。

グーグル、政治家の発言を比較する新ツール「Google In Quotes」を公開:マーケティング - CNET Japan

英語でいうと,oopsってところでしょうか.全く以て,今やってることなんですが・・・.だから早くやろうっていったのに・・・.視覚的な見せ方はまだ検討されていないから,その部分は(ごにょごにょ).全くもう!

今回の件で理解した.要するには,自分に利害というか害が発生する状況は,世界がそれを欲していても,いやーな気分.今までオレの夢を実現してきたいくつものサービスに,そういった感情がなかったのは,本気度合いということだろうか.例えば,CloudMapだったり,IMG2GPSだったり,TinEyeだったり,Gazopaだったり,瞬!コレだったり.後は,期待を遙かに斜め下の方をいったあらたにすもか.

これらのどのサービスも,実現が早かっただけで,着想はオレの方が早かったと信じている(自己満足).着眼点は良いというか,タイミングが悪いというか・・・.後は,「この画像は何?」検索ができるようになると,一通り満足できちゃいそう.世界はどんどん豊かになってます.

関連:
ヘタレ系DのBlog(終了しました): どうやって見つけるか?
クラウドマップ - 4403 is written
類似画像を見つけてくれる日本発画像検索エンジンGazopaを試してみた - 4403 is written
たった1枚の写真から撮影場所を特定する技術 - 4403 is written
画像で画像を検索するWebサービス TinEye - 4403 is written
あらたにす - 4403 is written
ヘタレ系DのBlog(終了しました): タグクラウドなアプローチだよね

画像検索エンジンのGazopaは、日本からTechCrunch50に参加してきた三番目の企業だ(OpentraceSekai Cameraに続いての登場となった)。

TechCrunch Japanese アーカイブ » TC50: 画像を渡すと類似画像を見つけてくれる、日本発画像検索エンジンGazopa

SekaiCameraは単純にすごいと思った.最早,電脳コイルの世界だし,AR技術の良い例だと思う.時代はARだって言い続けてきて良かった.間違ってない.

で.このGazopaは画像から類似画像を見つけてくれる日本発の画像検索エンジンだそうです.ふむふむ.時代が要求する検索技術の1つですね.わかります.オレも欲してます.欲しているのはちょっと違って,この画像は何なのかを答えてくれる検索.例えば,道ばたで撮った草花をアップロードしたら,「日々草」などと返してくる検索だ.ネタは出したから,誰かやればいいのに.類似画像検索とタギングでどうにかなるでしょ?卒研辺りでどうですか?

Gazopaで革新的なことは、画像検索を行う際にキーワードなどを入力する方法に変革を加えたことだ。検索語を入力するのではなく、Gazopaでは検索に利用する画像は自分でアップロードしたり、あるいはウェブで見かけた画像を右クリックして指定する。

TechCrunch Japanese アーカイブ » TC50: 画像を渡すと類似画像を見つけてくれる、日本発画像検索エンジンGazopa

どの辺が革新的なのかはわからない.アップロードはTinEyeでできる(用途がちょっと違うが)し,検索した画像を利用するのはgooがやってる.というわけで,類似技術であるgooと戦わせてみた.以下,結果.

Gazopa 

080911_gazopa.png

goo類似画像検索

080911_goo.png

講評:
Gazopaはボディフォルムが似ているスズキのSX-4を検索結果に挙げている.つまりはそこまで類似性を見ていると言えるのではないだろうか.そして,カタログ写真を多く挙げている.そもそも,元の検索対象画像がカタログ写真であることを考えれば,至極自然な結果である.類似画像検索という点で,大変に良くできていると思う.

対してgooの結果はどうか.確かにWRカーが結果として表示されているが,それはキーワードの効果ではないのか.残念なことに,Focus RSは1台も載っていない.そして,元の検索対象画像がカタログ画像であるのに対し,検索結果はSS走行中の写真ばかりである.うーん.類似画像検索?

まとめ:
Gazopaはかなり精度が良さそうです.お気に入り画像の大量収集に打って付けかもしれません.

関連:
画像で画像を検索するWebサービス TinEye - 4403 is written
似た画像を探してくれる検索エンジンはgooにもある - 4403 is written

200809111139追記:

080911_gazopa_02.png

"Drawing"なる機能を発見.女性の写真を検索してみましょう.

080911_gazopa_03.png

結果.

080911_gazopa_04.png

使えねー機能だな.嘘です.画期的だと思います.絵が下手くそなんで,精度は検証不能です.誰か試して!

200809111143追記:

またFlashを利用した「drawing box」(お絵かきボックス)で、検索に使用する絵を描くこともできる。Gazopaが描かれたものを認識して、類似画像を自動的に見つけてきてくれる。

TechCrunch Japanese アーカイブ » TC50: 画像を渡すと類似画像を見つけてくれる、日本発画像検索エンジンGazopa

紹介されてた><.

2005年くらいに実験的に提供してたけど、いつの間にか正式なサービスになってたんですな。

スラッシュドット・ジャパン | 似た画像を探してくれる検索エンジンTinEye

なるほど.アプローチは違うけど,これはこれで十分に有用性がある.うん.なるほど.

関連:
画像で画像を検索するWebサービス TinEye - 4403 is written

そこで、ニューヨーク・タイムズ(NYT)の記事検索の結果と、対象を限定しないグーグル検索の結果を比較してみよう。ここでは、“data mining”という言葉を例として検索してみることにする。ヒットするデータの総数は、グーグル検索の場合に557万件、NYTでは1万9900件である。このように、両者の間には大きな差がある。

しかし、「数が多いからよい」と言えないことは明らかだ。なぜなら、どちらも大量であるため、そのすべては見られないからである。NYTの記事も、すべては見切れない(タイトルページだけに限ってもすべてはチェックできない)。実際には、数百件をチェックするのが限度だろう。そう考えると、557万件と1万9900件の差に意味があるとは思えないのである。

ご用心!「グーグル」の検索結果があなたの目を曇らせている?|野口悠紀雄が探る デジタル「超」けもの道|ダイヤモンド・オンライン

膨大なウェブから,自分の必要な情報を探し出すのは本当に大変なことで,世の中では色々なアプローチが行われている.例えば,レコメンデーション(パーソナライズ)だったり,セマンティックだったり.どれもこれもが,「これぞ!」という感じではなく,完璧とはいえない.完璧といえないのは,システムの所為ではなく,どちらかと言えば,人間の所為であろう.

例えば,レコメンデーションでいこうか.ちょっとGoogle検索の話から逸れてしまうのだが,Amazonの話で.J君は基本情報処理技術者試験に向けて,参考書をたくさん買いました.それはそれはたくさん買いました.試験結果は別として,試験が終わりました.さぁ,Amazonでお勧めされる本はなんでしょう?J君はもう情報処理試験の本は必要ないのにねっ!空気嫁.

例えば,セマンティックな話をしようか.セマンティクスに,ウェブを意味づけして,検索する,っていうじゃなーい?でも,インターネット初心者は検索キーワードに複数語を入れませんからぁ!!残念!!単語だけじゃ,意味を酌むのは無理.切り.

人間はね,もっと機械的な動きをすれば,ウェブの情報を効率よく取り出せるようになると思うんだよ.人間は人間らしく曖昧な行動を取るから,上手く行かないんだと思う.

夏合宿でちょっと話したのだが,最近よく耳にするようになった言葉が,大変気になるようになってきた.昔は自分もよく使っていただけに,反省しきりである.その言葉はあなた方も使っているかも知れない.

ググれ

ググれという人は情報がなんたるかをわかっているのだろうか.何故ググれるのかを理解しているのだろうか.Googleが頑張っているから?いや,そんな話ではなく,その検索結果は誰かがウェブ上に情報を放ったからである.もし,誰も情報を発信しなかったとすれば,ググっても,何も見つからないはずだ.情報がないのだから.そう,我々が得る情報は,誰かがどこかで発信した情報なのだ.つまり,我々は情報をtakeしてるのだ.では,ググれググれ言っている人達は,ウェブ上に貢献したのか?giveしたのか?give&takeの精神は忘れたのか?

だから,オレは多くの人にブログを書くことを勧めている.情報はウェブに存在してこそ,ウェブの価値は高まる.もちろん,そうやって書かれる情報の全てが有益とは限らないが,無益ではない.ウェブの情報氾濫を促進する悪しき行為だと非難されそうだが,可能性は開く方向でお願いします.まだ書かれていない情報について,有益か無益かを議論するのは無駄です.

そこで,多くの人にオススメしたいのはトラブルに遭遇した時の体験談だ.何が起きたのか,どうしたのか,どうやって,どうなったのか,解決したのか,しなかったのか.皆さんもご存じだと思うが,WindowsやLinuxで発生する意味不明なエラー各種.そこに表示される意味不明なエラーメッセージをそのままグーグル先生に投げつける.往々にして,グーグル先生はそのトラブルについて書かれた記事を紹介してくれる.その多くはブログ形式である.そして,問題は解決するのである(しない時もあるけど).だから,トラブルに遭遇したら,そのことをブログに書いたらいいと思う.解決してもしなくても.これはきっとかなり役に立つ.全く以て,グーグルは優秀なFAQである.これをセマンティックウェブとかオントロジー的に整理したら,素晴らしいDBになると思うのだが,誰かやらないかなぁ・・・.

閑話休題.というか,前振り終了.実はこの記事を引用したのは,Google検索が貧弱だとか,ウェブに情報が氾濫しているとか,そんな話をしたかったからではない.取り上げたかったのは,こっちだ.目の付け所がおかしいのがオレ.

ブログは、その存在を探し出すのが容易でない。しかし、新聞社の中にあるブログは存在が明らかなので有利だ。大学でもブログのページを作ったらよいと思う。

ご用心!「グーグル」の検索結果があなたの目を曇らせている?|野口悠紀雄が探る デジタル「超」けもの道|ダイヤモンド・オンライン

激しく同意したい.所属を明らかにしたブログは,それなりの価値があるだろう.所属が明らかであることは,非常に重要である.例えば,芸能人などがアメーバあたりでブログを書くわけだ.「○○公式ブログ」などと銘打って.これが,本物であることはどのようにして確認するのだろうか.これがもし,所属プロダクションのドメイン内にあるブログだったら,その所属を確認することは簡単である.だが,それ以外の誰もがそれを名乗ることが出来るような状況下で,そう名乗ったことを,どのように本当であると確認するのだろうか.2chで誰かの名前で何かが書かれたとしても,本人が書いたのか,他人が書いたのか,どのようにして確認するのだろうか.

だから,所属が明らかではないところで述べられていることの正確性や信頼性なんて,匿名で書かれていることと何ら変わらない.違うとするならば,精々思い込みである.本当に必要なことは,情報を誰が書いたかではない.その情報に価値があるかである.そして,その価値を決めるのは,執筆者ではなく,読者である.だから,読者はウェブで見つけた情報を精査しなくてはいけない.信じられる情報か?本当の情報か?それを決めるのは読者自身である.信じるも信じないも,読者の自由である.だから,このブログを書いているのが4403なのかそうでないのかを判断するのも,あなた自身である.

まとめ:
前半と後半で全然違うことをいっているように思われるかも知れないけど,言いたいことは簡単で,ブログを書こうっていうことと,ウェブ上の情報を信頼するか否かは自分次第ってこと.だから,敢えて最後に書いてみる.このブログは4403が書いたものではありません.って.それに何の意味があるだろう.

土日と博士課程在籍時の研究室の夏合宿に参加してきた.そこで知らされたのだが,どうやら,Googleサジェストが「4403 is written」をサジェストしてくるらしい.んなばかな.と思ったので,帰宅して,すぐに検証.

080803_google.png

サジェストされました.なんてこったい.

スタディスキルズ―卒研・卒論から博士論文まで、研究生活サバイバルガイド

スタディスキルズ―卒研・卒論から博士論文まで、研究生活サバイバルガイド
著者: Kathryn L. Allen
訳者: 伊藤俊洋,黒澤麻美,伊藤佑子,吉田朱美
価格: ¥1785(税込)
出版社: 丸善 (2005/12)
ISBN-10: 4621076523
ISBN-13: 978-4621076521

発声練習さんがお勧めしていたので,即行で注文した.実は未だに読めていない.申し訳ない.忙しいという体の言い訳.また,同エントリー中で私のエントリーを取り上げて頂いて,誠にありがとうございます.お礼が遅くなって,誠に申し訳ありませんm(__)m.

さて,そんなこんなで全く読めておりません.一応,パラパラと全体に目を通してみました.

まとまった知識は本で得た方が早いよということ。

研究スタイルについてネットでいろいろ探すよりも本を読もう - 発声練習

このようにお勧めされているように,全く以てこの本を1冊読めばよい.個々の細かい知識はブログなどの情報が優れる面が多いかも知れない.でも,まずこの1冊を読んでから,webの世界を探すのが良いだろう.スタディスキルズには研究をする上での基本がほぼ網羅されている.必要十分と言える内容になっており,これ1冊でも,学ぶことは多いと思う.

発声練習さんは4章の「批判的な読み方」をお勧めしていますが,ボクは敢えて3章の「情報検索」をお勧めしたいと思います.研究者が研究者足るためには,世界を広くしなくてはいけません.我々は我々が触れた世界しか知り得ることができません.世界中にどんなに素晴らしい研究成果があったとしても,それを知るまでは,その存在を知らないのです.それがそこにあるにも関わらず.だから,研究者になろうとするためには,そこにある情報を知る術を身につけなくてはならないと思うのです.未知のものをどのようにして見つけ出すか.そのサバイバルガイドが3章の「情報検索」に書かれている.

私がまとめたサーベイの仕方も「情報をどうやって見つけるか」を伝えたくてまとめたものです.情報はそこにある.でも,まだそれを知らない.その未知の情報をどうやって見つけ出すのか.論文の読み方ももちろん重要ではありますが,その読むべき論文はどこから来るのか?指導教員が常に与えてくれるのか?それは自分の研究と言えるのだろうか.自分の研究として,自分が自立して研究していけるようになるためには,文献調査こそ大事だと思う.だからこそ,私はこの「情報検索」を大事にしたい.お勧めしたい.

まとめ:
パラ読みですが,この本はお薦めできる.間違いない.オレのブログなんて読んでないで,この本を1冊読んだ方がいいよ.マジで.その上で,また読みに来て下さい.

関連:
研究スタイルについてネットでいろいろ探すよりも本を読もう - 発声練習
サーベイの仕方・論文の読み方 - 4403 is written

全く以てこんなことになっているとは.セキュリティ界隈で,OpenIDがなんちゃらという話はいいとして,やはり他の分野でも食い付いているみたいだ.そして,その食い付き方と面白さ加減からいって,セマンティックウェブ辺りの反応が良い.セマンティックウェブやオントロジの考え方はOpenIDのそれととても親和性が良いように思える.

だから,そのネタだったのに.

直接的に食い込んでいるわけじゃないけど,今やろうとしていることはセマンティックウェブな世界でホットなトピックになりつつあるらしい.ヤバイね.そっちの分野は目につく範囲を眺めて楽しむだけで,真面目にサーベイしていなかっただけに,ビックリだぜ.

なんとなく,競合しそうな気がするから,セマンティックウェブな人達がセキュリティ領域に踏み込んでくる前に,セキュリティ領域からセマンティックウェブ領域に踏み込んでいく方向で.・・・・・・がんばろ.

カーネギーメロン大学の研究者達が、たった1枚の写真だけで、それが撮られた場所を特定する技術を開発したとのこと。

POLAR BEAR BLOG: たった1枚の写真から、撮影場所を特定する技術が登場

きたー!!ついに登場!問題提起していたシチュエーション3もこれで解決!もうシチュエーション2が解決されれば,世の中のほとんどの不思議は探し出せそうだ.いいよいいよ!次世代のメディア検索技術の進歩にメロメロです.

関連:
ヘタレ系DのBlog(終了しました): どうやって見つけるか?
画像で画像を検索するWebサービス TinEye - 4403 is written
タグに頼らない画像検索「Viewサーチ北海道」 - 4403 is written

電子化された辞書も周囲の情報を見せると良いと思うのだが, 誰かやってないものか.

辞書 - 186::Diary

こういうことでしょうか.

080620_pdic.png

たぶん,違う.いや,わかってるんですよ.

iPod touch/iPhoneのようなタッチパネルタイプだったら,ペラペラめくるかのような動作が可能ですから,紙媒体っぽく1ページを表現すれば,できそうな気がします.UIの問題ですねっ!あぁ・・・.Macな環境がないとiPnone用のアプリ開発ができないなんて・・・.気付よオレ.

TinEye

ネタフルで取り上げられていて,面白そうだったので,即行でベータテスタに登録した.何なのかというと,画像を使って,それと一致または類似する画像をWeb上から検索するサービス.本日,招待された.早速使ってみた.

まずはじめに,富士山で試してみた.

080602_tuneye00.png

orz.日本の心はダメですか.富士山は認識されませんか.まぁ,海外のサービスだから,日本固有のものは難しいのかなっと.じゃぁ,海外のものを使ってみればいいだろう.何を思ったか,MetallicaのAnd Justice For Allのジャケにしてみた.

080602_tuneye01.png

お.今度は300件ほどヒットした.確かに,検索されているぞ.検索結果は画像毎にまとめられ,ドメイン一覧の形で出力されるみたい.画像サイズやファイルサイズが違っても,しっかりと検索されています.

080602_tuneye02.png

これはなかなか面白いぞ.Firefoxのアドオンもあるので,グリグリ試せますね.

さて,この技術はどこに使えるでしょうか.考えられるのは,「手元に画像があるんだけど,入手元がわからない!」という場面.他にも,「画像を無断転載しているサイトを探す」ということも可能でしょう.ネタフルでは,「商品名がよく分からないけど探したい」というケースを紹介している.確かに,ありそうではあるが,画像だけ持っているケースってのが,想像しがたい.なくはないと思うけど.

この手の画像検索で,最も実現して欲しいのは「この画像って何?」を実現するサービス.ある画像を入力したら,それが何の画像であるのかを調べてきてくれる.確かに,TinEyeの検索結果を見に行けば,何であるかを見つけることは可能だとは思うが,そうではなくて・・・.この技術だと,既にWeb上に散在する画像と一致するかどうかを検索しているわけです.例えば,自分が撮った不思議な生き物,これは何ですか?と調べるには使えないわけです.Web上に一致・類似する画像はないわけですから.

っていうことは1年以上前に書いた.技術の進歩はめざましいものがあるから,書いておけば,いつの間にやら実現されているかもしれない.思いついたことは書いておくもんだ.

BIGLOBEまとめんとす

BIGLOBEが検索結果をマッシュアップしてまとめまくり.でも,これ,気になるわー.

080523_biglobe.png

桁区切りの位置が気になるわー.ランキングの順番がどうみても「あいうえお」順で気になるわー.

さすがは東大と言わざるを得ない.地味に素晴らしい資料が一般に公開されている.

東京大学の構成員の方を対象として、文献や情報をインターネットで収集するために知っておくと役立つ知識や効率よく探すためのポイントをまとめた小冊子のPDF版です。

ネットでアカデミック

卒研生全員に送りつけたい.それくらいに良くできた資料だ.そもそも東大の構成員を対象とした冊子なので,参考にならない部分も多々あるが,それを補って余りある充実振りだ.参考になった項目を箇条書きで挙げる.

  • p.10「論文を書く道のり」
  • p.11「情報の読み方いろいろ」
  • pp.17-25「資料収集」(契約している雑誌類が異なるが,どの大学もほぼ変わるまい)
  • pp.30-31「引用する・参考文献リストを作る」
  • pp.34-35「検索のヒント」
  • pp.38-39「文献表に出てくる略語一覧」

特に,「文献表に出てくる略語一覧」は素晴らしい.こういった略語をまとめている資料は少なく,大変参考になる.印刷して手元に置いておきたい.似たようなものにはIEICEの和文論文誌 投稿のしおり学術雑誌略語表(注※リンク先はPDF)があるのだが,役割がちょっと違う.なお,IPSJも定期刊行物の省略記法情報処理学会関連の英文表記および略記を準備している.

情報元:
略語を一覧で見ると壮観 - Vomit Comet

プロフィール

e-m@il @ddress