« August 2009 | Main | October 2009 »

2009.09.16

SIGMOD日本支部第42回支部大会 講演資料 - 大規模検索エンジンとレコメンドシステムを支える仕組み

昨日、東工大で開催されたSIGMOD日本支部第42回支部大会の発表資料です。

* 大規模検索エンジンとレコメンドシステムを支える仕組み [pdf] [pptx]

- 近年の全文索引手法の解説 
-- 転置ファイル, N-gram,半転置ファイル,格納 (VarByte, Rice, Simple9, NewPFOR)、接尾辞配列、圧縮全文索引

- レコメンデーションの内積の高速な計算,
-- 単純な計算から、LSH, 補正付サンプリング

- PFIの製品紹介
-- Sedue, Hotate, Reflexa


----
SIGMOD日本支部大会は以前オープンソース全文検索エンジンの会に参加したことはあったのですが、コミュニティが強いなという気がします。喜連川先生の受賞記念講演も重みのある話、本音の話がきけて大変ためになりました。

この一年は武者修行ということでいろんな分野の会にいくようにしてます。
自然言語処理はもちろん、機械学習、音響、DB、アルゴリズム、社会人中心の研究/勉強会
やはり実際にその場に行ってみないと、わからないことが多い。

どんな人がいて、どんなことをやっていて、どういう歴史があってそうなったか、人間関係はどうなのかとか
知ることができるので面白いです。飲み会で(酒を飲んで)勢いに任せて話していると、いい関係が作れる場合が多いです。

| | Comments (368) | TrackBack (0)

SBM研究会発表資料 - SBMの推薦アルゴリズム

先週末東工大で開催された第3回SBM研究会の発表資料です。

* SBMの推薦アルゴリズム [pdf] [pptx]

- はてブの関連エントリで利用されているBayesian setsの解説とその改良(とチューニングちょっと)
- Locality Sensitive Hash (LSH)の解説と実験結果.結構うまくいった

(最初のエコは大切というのは前の発表からの流れです)

----
研究会は熱心な人がたくさんいて、twitterでリアルタイムな反応がみれるなど新鮮でした。

| | Comments (103) | TrackBack (0)

« August 2009 | Main | October 2009 »