« July 2005 | Main | September 2005 »

2005.08.30

隠れ変数を使ったDiscriminativeな学習

Hidden-Variable Models for Discriminative Reranking, Terry Koo Michael Collins, EMNLP2005 [pdf] を読んでみた。

これは、Probabilistic CFG with Latent Annotations. [pdf]とすごく似ていて、人手でがんばってCFGの状態(非終端ノード)を設計するのではなく、隠れ状態をたくさん用意しておいて、勝手にそのような設計をやってくれと任せるもの。
しかし、今回のほうはDiscriminativeなアプローチであり、生成確率p(x,y)を学習して求めるのではなく、p(y|x)を学習して求める。(xが入力、yが出力(求めたい答え))

うまく学習、デコードができるように、よくある話だがFeatureをローカルなものに限定して、動的計画法を使えるようにしている。

| | Comments (1) | TrackBack (0)

容疑者 室井慎次

見てきました。odoru-legend
演技うまいなぁとか、警視庁と警察庁の関係を描いてたりとおもしろかったのです。

個人的には、地元福島のロケということで、いわき平の商店街が新宿三丁目として使われているのに気づいて、「あぁ、ここは昔映画館があったところだよ」とか思ってました。イトーヨーカドーが写っている場面を見てなんか地元に似ているなぁと思っていたらそうで一人で喜んでました。撮影で使われていた学校は高校のすぐ近くにある中学校です。

ということで、いわきのみなさま、見てみたら面白いと思います。

| | Comments (0) | TrackBack (0)

2005.08.24

帰省

しています。今週末ぐらいまで。
運動したり、猫を追いかけたりしてます。

あとは本を読んでいる。
前から読みたかったヒッチコック&トリュフォーの映画術
umedaさんが紹介していたIntelのGroveらが書いたStrategic Dynamics: Concepts And Cases
Suffix Arraysで正規表現をやろうとしているので、とりあえず詳説 正規表現第2版は読んでおこうと。
あと型本のTypes and Programming Languages、などなど。

| | Comments (0) | TrackBack (0)

2005.08.23

MTその後

前、ここで書いていた機械翻訳ワークショップの結果が公開されているようです。NIST MT2005 Evaluation Result google強い。

使った手法を聞いてガガーンとしたのですが、どうやら使った手法の情報は一般公開されていないので、もしかしたら表立って言えない内容かもしれない。ということで手法は伏せときますが、どうせ真似できない方法なので、ホヘーと思うしかない。

| | Comments (0) | TrackBack (0)

LZMA

のアルゴリズムについてOSASKの川合さんから話を伺いました。(LZMAは7zipが使っている圧縮法です。)
LZ法ではもうやることはないと思ってましたが、こういうことがあったのかと思わされました。CABもこれを使っていたらしいうわさなので、圧縮率が高いのも納得。詳しい技術解説は現在書いてて、そのうち記事で出る予定。

| | Comments (0) | TrackBack (0)

2005.08.20

意味の学習

面白いなぁと思っていたらUAI2005でベストペーパーをとったそうだ。

Luke S. Zettlemoyer and Michael Collins.
"Learning to Map Sentences to Logical Form: Structured Classification with Probabilistic Categorial Grammars. "[pdf]

the highestとかの意味が学習できるのか。(the highest := NP/N :λf.argmax(f.λx.elev(x)) )

もちろん0から学習しているわけではなく訓練データを使っているのだが、すごい。
構造の学習の応用例としても興味深い

以前、「very」などの副詞が係り先の意味にどのような影響を与えるのか定量化、定式化を学習できるか議論したことがあったけど、見えてきたなぁ

#UAI2005でNon-parametric Bayesian MethodsのTutorial [pdf] があって最近の話がまとめられてます。
これだけではとても理解できないけど・・

| | Comments (0) | TrackBack (0)

2005.08.19

俺生きてる

2004年度第2回未踏の最終成果報告会@国際フォーラムが終わりました
締め切りが近づくにつれて急にみえないものがみえてくるものですが、なんとか乗り切りました。卒論時の状況に近かった。作った成果は順次リリースしていきます。よろしくです。

協力してくださった方々ありがとうございました。

今日は長く、長く、眠ります・・

| | Comments (0) | TrackBack (0)

2005.08.11

そのまま

次の日突入。今日が課題締め切りなのだ。このCSAのインクリメンタル構築ができなければ・・ということで終わるまで家に帰らないことにする。昼頃ようやくできたっぽい。whiteさんのいろいろな実装を参考にさせてもらいました。そして、でかいファイルでいろいろな性能実験。1GBぐらいのデータぐらいまでは大丈夫みたい。でもそれ以上はThinkPadが悲鳴をあげているのであまりやらないことにする。昔もノートパソコンで実験しまくってHDDが壊れたし。

課題は出したが、その後もバグっぽいのを除いていく。これを使ったアプリケーションもそろそろ整備しないとなぁ。全部作りっぱなし。発表までがんばるぞ

| | Comments (0) | TrackBack (0)

2005.08.10

外は雨

家を出ようと思ったときに雨が強くなってきたので家に引き返す。おなかがすいてきて弱ってきたのでやむなく学校へ。IJCNLPの手続きをいろいろとする。あとは黒ラーメン食って実装。RunLength FM-indexとか。これってインクリメンタルに構築できて、もっとうまく圧縮できるだろうと思ってやりはじめたがうまくいかずにジョナサンへ。
雑炊食いながら実装していたら、警察の人達がきて向かいの人を連れて行った。

| | Comments (0) | TrackBack (0)

2005.08.08

西伊豆

へサークルOBの友人達と1泊2日で行ってきました。

4年ぶりぐらいに海に行ってはしゃいでしまった今、すごい日焼けで痛い。

| | Comments (0) | TrackBack (0)

2005.08.03

スティーブジョブスの講演

http://pla-net.org/blog/archives/2005/07/post_87.html

| | Comments (0) | TrackBack (0)

オープンキャンパス

大学で高校生向けのオープンキャンパスがあり、自分とうえの(飛び入りでにしかわ)がCPU実験の中身を発表した。4回も。おなかいっぱい。

高校生がCPUを知らないところで、シミューレータでadd演算を速くすると全体が2.5%速くなるんだよウハウハみたいな話を聞いて何を感じたか分からないが、H先生やS先生のコンピュータサイエンスとは何かという話は個人的に楽しんで聞いていた。サイエンスは真理を追究するものであり最新を追求するとはちょっと違うなどと。

情報科学科では情報リテラシーは教えないというのを聞いて最近読んだ記事、Open Source Paradigm Shiftとの関連がなんとなく思い出された。この記事によるとソフトウェアがコモディティ化されて、さらに一つ上のレベル(この記事ではgoogleなどのインターネットサービスを例にだしていたが)での競争が始まるとある。IT産業の多くがアウトソーシング化されてきていると聞くが、それらはコモディティ化された部分であって、本当の技術や理論とかはまだまだ勉強する価値があるし、その重要性は変わらないしさらに大きくなっていると思う。

| | Comments (0) | TrackBack (0)

« July 2005 | Main | September 2005 »