« January 2005 | Main | March 2005 »

2005.02.28

環境パワーアップ

家の掃除をしていてコードが一番邪魔だったので、いまさらながら無線LANを導入してみた。ディスプレイもあまっているのを使ってしまおうということで、グラフィックボードさして、マルチディスプレイにしたでも。二つのディスプレイの大きさが違うから、なんか中途半端。ノートでもがりがり開発できるようにメモリーをつけたした。2Gにしたかったが、これでは無理みたい。

パソコン以外にも地震に備えて高い棚とかを整理してかたづけた。上に物があると部屋がせまくみえるし。

他のことがしたくなる時期です。。

| | Comments (0) | TrackBack (0)

H2

をコンビニで立ち読みしていたら、とまらなくなり次の日全巻読んだ。最後の余韻がなんとも・・
中高のとき途中までよんでいたんだけど、最後まで読んでいなかったもので。

いろいろ思うことがあります。自分は男子校のラグビー部だったもので・・。

| | Comments (3) | TrackBack (0)

2005.02.26

PRMU、NLC

に行ってきました。時間的に特別講演しか聴けなかったのですが。PRMU
工藤さんや鹿島さんの話はもちろん面白かったのですが、その後のコンピュータビジョンなどの最近傍探索の話が興味深くて面白かったです。十分な量の訓練データがあればk-NNでもSVMやAdaBoostingなどに匹敵する性能を持つことが知られてますが、自然言語のような高次元データの場合、k-NNをする場合に必要な最近傍探索が急激に難しくなります。(ほとんどの点同士の距離が等しくなる球面集中現象がおきる 参照)これを回避するためには次元を落とすか、距離を差が出るように定義し直すなどいろいろな方法があるらしい。その距離尺度が有効かどうかを調べるためには全点対の距離を調べてそれをヒストグラムにして一点に集中しているか調べればいいそうだ。

Joachimさんがk-NNと似たようなSpectral Graph Transducerを提案してましたが、この場合でも近傍点を高速に探索できるようになったらさらに実用的になるんだろうなぁ。

高次元中の探索問題ってどこかの分野で解かれてないんですかねぇ。

| | Comments (175) | TrackBack (0)

2005.02.25

ずっと実装。

しているけど、それ以外の話もしてみよう。

--
昼飯をいつもどこで食べるか悩む。出発はいつも昼ごろになるので、家側の駅で食べるか、本郷の駅周辺で食べるか、途中でおりて新宿とか四ツ谷とか御茶ノ水で食べるか適当に決める。最近を振り返ってみると、うどん、ラーメン、カレー、ハンバーガー、中華料理。CHてんこもり。夕食はほぼ間違いなく生協食堂。6時近くなるとわさわさと人が交信しあい、集まろうそうしようといい、わさわさと食堂に行き食べて研究室にかえる。

--
最近は、ほぼ毎日、夜に泳いでいる。クロール、平泳ぎまぜて500m。あとは時間の許す限りクロール。昔は1.5kとか2k泳いでいたが、最近は1k行けばいいほう。某研究室の秘書さんに泳ぎ勝つことを目標としている。暖かくなってきたから、走るとかもしたいなぁ

--
プログラミングしながらでは、音楽を聴いている。最近は奥田民生が中心。卒論間際では彼の「厳しいのである」があまりに自分達の状況にマッチしていたため、聴くとつらかった(胃腸も悪くなる)のだが、最近は「人の息子」とかを好んで聴いている。スピッツとかイエモンとかミスチルとかちょっと古いのがすき。最近のを知らないだけです。

--
最近は正規の終電を乗り過ごし、裏ルートの終電で帰っている。歩く距離が2倍程度になるが、夜歩くのは結構楽しい。コンビニではよく立ち読みをする。前は三国志をえんえんと読んでいた。今日はH2のワイドコミックスを読んでいた。これはドラマになっているらしいが、H2は最後まで読んでないから、これから楽しんでみてみよう。甲子園ってやっぱ特別だなぁ。自分にとっては花園が特別な場所で、花園を知っている人に会うとうれしかったりする。

--
読もうと思っていた本読んでないなぁ。午前に読もうといつも思っているけど、一度も達成されていない。

| | Comments (0) | TrackBack (0)

2005.02.21

午後からの日々

実装してます。CSA、PT、RMQなどなど。アルファベットだけだとなんじゃこりゃ
昔よりは実装スピードは上がったとは思うけど、最近始めてVisual Studio 2005でインデント整理できるのを知った。Edit->Advanced->FormatSelction。今まで手でやってたのに・・
今週中には全部くみあわせてCST動かすところまでいきたいところだ。

Max Marginも実装したいなぁ。これはでも、それぞれの問題にうまく適用しないとだめだから、SVMlightなどのように汎用的なツールとはできないんだろうな。それとももう少し理論が成熟するとできるようになるのかな。

| | Comments (0) | TrackBack (0)

2005.02.18

SA

ちょっと、目を離すと研究はあっという間に進むもので、Suffix Arraysも去年まとめて書いたころとはかなり状況が変わっているみたい。

yuuさんのページがSuffix Arraysに関して、この一年でかなり充実してきて、すばらしい。いろいろな手法の比較検討もしているし。ただ、線形時間のやつは速くないってのはもうちょっと工夫すれば使えると思う。教えてもらったことではあるが、mod3で分ける方法とかは途中で普通のSA構築アルゴリズムに切り替えれば結構速く使える。100Mとか超えてくると差がちゃんとでてきそう。

結局、二段階ソート(それをさらに儘田さんが発展させたやつ)と線形ソートはどっちが速いんだろう。アルファベットサイズによるといわれればそれまでだが、これが最強ってないのかなぁ。メモリ量も問題になるけど。

まぁ、構築するのは一回だけだから、実用的にはそんなに問題にならないんだろうけどねぇ。それよりは利用する際のメモリ、速度のほうが問題なんだろうなぁ。でも、構築は奥が深くて面白い。

| | Comments (3) | TrackBack (0)

確率と識別

Taskarさんの博論よみながら、MaxMargin、特にStructured Outputに関する実装をしようと考えているのですが、難しそう。卒論を拡張するくらいだったら、できるかな。うむむ

識別、分類するのになんとなく、確率使ったりMaxMarginなどで決定した識別平面を使ったりしているけど差はあまり考えなかった。上の論文よんだだけだとそれぞれの利点は

・確率(モデル)
 隠れ変数、要素等が存在する場合でも、EMという効率的な学習法がある
 確率自体が重要な場合がある

・MaxMarginによる識別
 正規化する必要がない(これはマルコフネットワークなどでクリークが大きい場合にきいてくる)
 Dualにして、Kernelが使える。
 確率が定義できないような場合でも識別できる(マッチング、教師付きクラスタリング等)

 と理解したのだが、どうでしょう。速度とかは工夫次第でかわってきそうな気もするが。

 (MAP推定を用いて)確率を識別に使った場合の学習理論はあまり知らない。まだ深く研究されていないのかもしれない。コリンズさんのレジュメに、エントロピー最大にするのと汎化能力に関する理論的な説明はまだされていないと書いてあったし。

 理論的に確率モデルと(MaxMaginなどによる)識別の差を述べているやつとかあったら教えてください。

 人間が識別にどっちを使っているかというと後者の気がするなぁ。
 後ろ姿だけを見て、その人がAさんかBさんか、それとも・・というのに対し全ての人の場合に適切な確率を与えて、最大の確率を選んでいるよりは、なんとなくAよりはBだろうなぁみたいな感じだし。
 あ、これは適当な意見です。

| | Comments (0) | TrackBack (1)

2005.02.12

卒業研究

の発表が無事先日終わりました。

思えば、卒業研究はものすごい難産でテーマがかなり変わりました。
最初は文書分類をやろうと思っていたけど、いろいろ試していたら、もうちょっと特殊な分類やらないと新規性ないなぁってことで、評価文を分類しようという話になって、それからしばらくして、評価文がどれだけ評価しているかを数値化するのは面白そうということになって今に至りました。最初のパワポとかを見ていると、悲しくなってくる。

この研究は、最後の方にこうしたらもっとうまくいくだろうというのがわかったので今からそれを実装してみます。

日記かいてないと何が起きていたのかわからないなぁ。12月のアブスト周辺から2月までかなりやばかった。

| | Comments (0) | TrackBack (0)

2005.02.04

卒論発表準備など

言語処理学会向けの卒論締め切りも近く書いています。英語難しいと散々言ってましたが、日本語も難しい。
発表練習でも既定の10分で終わらず、無駄な部分が多いということで、ざっくりきっています。SVRがぁ・・双対問題がぁ・・

卒論内容としては、レビューがどれくらい良いとほめているのか、悪いとけなしているのかを数値化するのだが、プレゼンしてみて面白い例はないだろうか。その場でうけたコメントをそのまま入れてみるとか。悪いのばっかりだったらへこむなぁ。

| | Comments (0) | TrackBack (0)

2005.02.03

卒論

仮提出しました。あーしんどかった。今回も残り5分を切って印刷というぎりぎりだった
振り返ってみると、前半テーマをなかなか絞り込めなくていろんなことに手をだしたことで、終盤きつくなったなぁ。

月曜に言語処理学会の論文締め切り、火曜に卒論発表ということで、まだ先は長い

| | Comments (0) | TrackBack (0)

« January 2005 | Main | March 2005 »