« March 2008 | Main | May 2008 »

2008.04.17

自然言語処理の学会

プログラミング言語の学会に触発された作った。私視点で書いたので、間違ってたりしたら突っ込んでください。
自然言語処理は、情報検索、ウェブ、機械学習とかとの境界領域だったりするのですが、そういうのは除いてます。
大体の学会情報はACL wiki
論文はACL anthology
から得られると思います


ACL
The Association for Computational Linguistics ACL2008
自然言語処理の一番でかい会議。理論からアプリケーションまで何でも集まるが、強いて言えば
機械翻訳、構文解析が多い。いろいろなワークショップ(10ぐらい)も併設される。

EMNLP
Conference on Empirical Methods in Natural Language Processing EMNLP2008
言語情報から統計的な情報を取り出して機械学習を使って自然言語処理やりましょうという会議。
Machine Learning NLPとも揶揄される。最近では会自体も大きくなってきた(併設が多いから?)。

CoNLL
the Conference on Natural Language Learning Conll2008
これもEMNLP同様機械学習系が多い。特筆すべきは毎年行われるShared Task。公開されたタスクに対し、
世界中の研究チームが精度競争をする。このShared Taskで作られたデータとか手法が起爆剤となり、
その後数年その分野が賑やかになる.

Coling
International Conference on Computer Linguistics Coling2008
隔年で開催される。ACLと同様いろいろなジャンルのがでてくる。ACLよりもいろんなマニアックな分野が多いイメージ。最近は併設が多い

NAACL
North American Chapter of ACL
EACL
European Chapter of the ACL
NAACLは北米版ACL, EACLはヨーロッパ版ACL。NAACLは機械学習や精度が高いぞというのがでる一方、EACLはヨーロッパが昔から多言語国で言語学が進んでいたこともあり、理論的にしっかりしているのが好まれる?(イメージです)

IJCNLP
International Joint Conference
on Natural Language Processing
(IJCNLP 2008のサイト)
ほぼ隔年。アジア版のACL的なポジションを狙っている(主催はAFNLP)。まだできたばかりで次三回目。

#上記のNAACL, EACL, IJCNLPは主催がそれぞれ北米、ヨーロッパ、アジアなだけで参加者はいろいろな国から来ます。主催のところが多いのは多いけど

その他
------
言語リソースを扱い発表数がめちゃくちゃ多いことでも有名なLREC。(今年はモロッコ。いいなぁ),
どっかと必ず併設しているHLT、うちの学科だと教えちゃう(俺教えてる)HPSG, ParsingをとことんやるIWPT, (そういえばParsingのもありましたね)

追加
-----
MT Summit
Machine Translation Summit XI
TMI
Theoretical and Methodological Issues in Machine Translation
機械翻訳の国際会議。この他にもNISTのワークショップではいろんな研究グループ、会社がほぼ毎年精度競争してる。

他にあったら教えてください


最初に言ったように、自然言語処理は境界領域なので、他の分野の学会(SIGIR, WWW, ICML, NIPSとか)にも出す場合が多いですね。

| | Comments (43) | TrackBack (0)

2008.04.09

2年目

博士2年目突入

博士1年目は好き勝手にやったが(どちらかというと新しい分野の勉強が多かった。知らない分野の勉強会やワークショップにできるだけ参加するようにしました)、2年目はテーマを決めて本腰を入れてやりたいところです。

最近は年度始めというだけあって濃密で、

研究室引越し+面白い英語の授業(宿題もガツガツ出る。ちゃんと本気でやる授業は好き。駒場時代も大鬼な授業は面白いのが多かった。単位はとれないが)+演習準備、採点+実験、論文書き

会社の方も精力的にやってます。

---
伊庭先生から謹呈本(「科学」)をいただきました。ありがとうございます。持橋さんもいろいろ書いてる。

確率の特集なのですが、知らないことが多かった。例えば、大数の法則・中心極限定理と並ぶ第3の極限定理として近年出てきた大偏差定理とかは知りませんでした・・。

個人的には科学ジャーナリズムについて述べている章が気になりました。「ネイチャー」、「サイエンス」中心の問題点とかが述べられていましたが、確かに今のマスコミは殆どがそのへんのネタだなぁ。
世の中の科学の中心は圧倒的に生物、物理、数学、化学で、コンピューターサイエンスというのはまだまだ新参者なのだと改めて思いました。

頑張りましょう。

---
ACL, CPM, などのaccpeted paper listを眺める。
この二つの開催日がかぶってるので後者に出したのだが力負け(殆ど同じタイトルの他のがaccept。厳しい)。4、5,6月とまだ立て続けにいろいろチャンスがあるので良い結果が出るよう頑張らないと。

ACLのは、ざーっとみて興味深いのが
Aria Haghighi, Percy Liang, Taylor Berg-Kirkpatrick and Dan Klein "Learning Bilingual Lexicons from Monolingual Corpora"
Liang HUANG Forest Reranking: "Discriminative Parsing with Non-Local Features"
前者のはタイトルから何をやっているのか想像ができない。まだpaperはでていない。

後者の詳細バージョンは博士論文のproposalとして挙がってる。
構造を学習する問題では、構造をグラフの形で表して、出力コストをグラフの枝、頂点だけにつけて、グラフ上の最小コスト問題をviterbiとかで解くことによって構造を予測する。
これにnon-localな特徴(グラフ上の枝や頂点を超えた情報)を加えると、そのままでは動的計画法が適用できない。なので従来手法ではn-bestを生成して、それらをrerankingするという二段階の学習/予測手法を使っていた。

彼の方法ではn-bestを生成せずにnon localな特徴を丁寧にdecomposeして高速化しさらに高速なn-best生成で使っていた高速化技法を駆使して、強引にexactな1bestを求めてperceptronを走らせでnon-localなfeatureも含め学習してしまう。

他もペーパー挙がったら読んでみる

---
今夜(日本時間で4/10 0:00ぐらいから?)、ICPC World Finalがカナダで開催されます。これはプログラミングのオリンピックみたいなものです。大学対抗という形で1チーム3名で出場し、制限時間内に解いた問題数(解いた数が同じ場合は時間)で競い合います。日本代表の2チームの両方に同僚が出場しているので激しく応援してます。是非楽しんできて欲しい。
これまた同僚の方が今日に合わせ2年前の大会の様子をアップしてますので、是非読んでみてください。熱い

| | Comments (3) | TrackBack (0)

« March 2008 | Main | May 2008 »