Bayesian Sets
Bayesian Sets, Z. Ghahramani, K. A. Heller, NIPS 2005 [paper]
が面白い
Google Setsにインスパイヤされたと書かれている。これが扱っている問題は、複数のクエリを与えた時に、それが含まれているだろうクラス/コンセプト/クラスター集合の残りの要素を返すという問題。このペーパーでも書かれている通り、clustring on demand という言葉がぴったりだと思う。
このペーパーでは、その問題をきちんと確率モデルで定式化していて、それは効率的に解けて、結果も(たぶん)いい。
このペーパーを見てまだもやもやしているのは、supervised clustring とどう違うのかという点。ざっと読んでみた感じだと、従来のクラスタリングでは正解のクラスタリングが一つ存在していて、それを求めるのに対し、今回のやつはおなじ要素でもクエリーによって違うクラスターに分類されるという点(一組のパラメーターから生成されていない) かなぁ。
#(追記)後でよく読んでみたら、bayesian setは、てんで、supervised clusteringではありませんでした。
あと、今回はクエリ対象となる要素とそのfeature(とはいってなかったけど)が明示的に与えられていたけど、latent featureも仮定するとかなるとさらに面白くなりそう。シンプルさが失われてしまうかもだけど。
#(追加)これも後で考えてみたら、違う方向。できるとすればsetではなく、階層化中の位置とかかなぁ・・。


Comments