資源分配問題
世の中にあふれる情報が、自分の時間、気力の限界と比較して多すぎることは人生の早い段階から明らかでした。人生は短く、やりたいことですら、優先順位をつけて選択肢なければなりません。ましてやどうでも良い情報に時間や気力を割くのは無駄です。ですので、ある種の情報が自分に関係のないと判断すると、それ以降はその情報はまるごと遮断して生きてきました。フィルタリングに失敗して、必要な情報を逃していることも結構あるのではないかと推測します。それにあとで気付くこともたまにあります。
それは2013 年の年の暮れのことでした。その年の 9 月にオリンピックの東京開催で決まりました。もちろん、オリンピック関連情報は自動的にフィルタリング対象になりました。スポーツで、かつ東京です。自分に関係することは何もないように思えました。自分にとってどうでも良いことに自分の払った税金の一部が使われるという点を除いては。そうしてオリンピック関連情報を自然と遮断しながら数ヶ月過ごしてきました。ところが、とある企業研究者が飲み会の席で言うわけです。オリンピックがあるから、しばらく機械翻訳特需が続くと。オリンピックと機械翻訳を結びつける言説は今でこそ業界内で頻繁に耳にしますが、私が聞いたのはこれが最初でした。自分にその発想が微塵もなかったことに危機感を覚えました。
写真は今津の元寇防塁跡 (2014 年 8 月 30 日撮影)。埋まっています。
記憶と性格
アスペルガーとADHDの時間感覚の違い―過去と現在と未来という本の紹介記事が面白かったのでメモっておきます。精神疾患を時間感覚の観点から分類しています。例えば、内因性うつ病は過去に、統合失調症は未来にとらわれており、広汎性発達障害は過去、未来、現在のいずれにもとらわれていないといった具合です。この分析が妥当かどうかは知りません。ただ、記憶と性格が関係する可能性の指摘は私にとって新規性がありました。
前にも書きましたが、過去の体験を覚えておくのが苦手です。記事には「学生時代の出席番号や生徒数まで覚えている人」が知り合いにいるとあります。私などは担任の名前すら怪しいです。この性質が現在の私の性格に関係する可能性がある (因果関係はわからないけど) ことは、考えてみればもっともです。どうして今まで気づかずにいたのでしょうか。
写真はムンバイとプネの間にあるカルラ石窟の石柱 (2012 年 12 月 12 日撮影)。彫ってあるのはブラフミ文字だと思いますが、私の知識では微妙に読めません。
NLP2015
京大吉田キャンパスで開催された NLP2015 についてのメモ。例によって箇条書きです。
- 久しぶりの京大。立地が良すぎる。離れてみるとよくわかる。
- 京都でホテルに泊まるのは大学受験のとき以来。
- 参加者が 800 人超え。共催の情処から流れ込んだという説あり。この人たちは普段どこで何をしているのだろうか。
- スポンサーがさらに増えた。学生への宣伝としては効率の良い投資ではないか。しかし、もし学会全体として産業界と仲良くする方向に舵を切ってしまうと、つらいことになりそう。
- 法人化のため総会は今回で最後だという。
- 期間中論文の締め切りに追われていた。失敗。ながら仕事なんて効率が悪いだけ。
- チュートリアル。藤波進氏の「言語データベースの制作公開と著作権」。「概要」を読んだだけでは、どう転ぶか未知数だった。蓋を開けてみれば、ぶっちゃけ話が最高だった。細かいところは頭に入っていない。おおまかに全体像を把握しておいて、あとは必要に応じて資料を参照するたぐいの話。なお、司会の略歴紹介によれば、氏はかつて NTT で機械翻訳の研究をしていたという。そういうキャリアもあるのか。
- 前回に引き続きテーマセッションをやった。いろいろ収穫があった。今後どうするかは決めていない。
- 携帯電話を携帯しない同志がまた一人見つかった。勇気づけられる。
- 相手は私を認識しているが、私は相手を認識していない場面が増えた。年をとったということか。
- ポスターがつらい。毎年のことだが。今年の発見は、内向きに折り曲げるポスタースタンドが思いの外使い勝手が悪いこと。そもそもつらいのに、可視範囲が狭まってますますつらい。
- 今年も YANS 懇に参加。そろそろ年じゃないかと言われつつ。ありえない人数。持続可能なのだろうか。
- 面白かった/面白そうな発表
- B2-2: アレキサンダー大王の遠征は再現できるか? (聞いていない)
- E3-4: 日本語 Universal Dependencies の試案 (聞いていない)
- P3-19: 多目的遺伝的アルゴリズムを用いた組合せ最適化による要約生成 (聞いた結果理解していないことがわかったので後で調べ直す)
- E4-3: ZIPの圧縮率を超えた単語エントロピー符合化と意味構造符合化の一体化による言語解析圧縮データの再利用 (聞いていない)
- A6-5: Language independent null subject prediction for statistical machine translation
- あいかわらず問題をうまく分割して解いている
- 対象言語側での post-editing で精度あがるのがちょっと不思議な感じ。parsing までする賢い言語モデルだと思えばよいのだろうか。
- P4:28: 言語モデルを用いた株価の動向を記述するテキスト生成への取組み (テキスト生成は楽しそう)
- P4:29: モンテカルロ木探索を用いた確率文脈自由文法に基づくテキスト生成 (ちょっと意外な応用)
- E7:2 木刈込みに基づく文書要約のためのZDDを用いた動的計画法 (理解していない。系列的ではないテキストの圧縮表現は要約以外にも応用できそう。)
写真は嵐電の御室仁和寺駅 (2009 年 2 月 11 日撮影)。京都に住んでいる間は結局嵐電に乗らずじまいでした。自転車でどこまでも行けるので。
雨よけ
写真は京大工学部 3 号館中庭の駐輪場 (2013 年 9 月撮影)。
京大吉田キャンパスの微妙なところは全体的に雨よけつきの駐輪場が少ないことでした。おそらく自転車があまりに多すぎて整備する気にならないのでしょう。学部時代は情報学科の入っていた工学部 10 号館 (現総合研究 7 号館) でかなりの時間を過ごしましたが、その 10 号館前も雨ざらしでした。院に進学して、3 号館に移ると、雨よけつきの駐輪場にありつきました。これほどはっきりと quality of life を向上させる設備はなかなかありません。
九大伊都キャンパスでは、駐車場が遠すぎるという不満をよく聞きます。あいかわらず自転車に乗っている私には縁のない話です。建物のすぐ前に屋根付きの駐輪場があることで、私はとりあえず満足しています。
九州という虚構
某巨大学会には九州支部というものが存在します。会員は住所によって機械的に支部に割り振られるようです。同じように関西支部も存在するのですが、以前はほとんど意識することはありませんでした。他の支部などなおさらです。九州では観測範囲で目にする機会が増えました。代わりに関西支部が視界からきれいに消えました。九州では支部活動にかなりの人的資源が投下されているようです。
しかし、ふと思うわけです。九州というものは本当に存在するのだろうかと。島が物理的に実在するのはわかります。ただ、社会的なまとまりとしては、惰性で続いているだけであり、ひとたび人々がその存在を疑うように仕向ければ、案外あっけなく崩壊しそうな気がします。
そう思う理由は時間距離です。福岡 (博多) から見ると、熊本は 30 分、鹿児島は 1 時間 20 分です。いずれも新幹線で。距離的に近そうな長崎は 2 時間です。大分も 2 時間です。いずれも在来線の特急で。宮崎となると、どうやって行くのが正解かもわかりません。新八代でバスに乗り換える場合 3 時間 10 分かかるそうです。沖縄は飛行機がないと行けません。もっとも、「沖縄」で支部のメールを検索してもヒットしないぐらいなので、存在感がありません。
2 時間というのが微妙な所要時間です。1 時間 10 分で広島に、1 時間 45 分で岡山に、2 時間 20 分で新神戸に着きます。飛行機に乗り始めると時空が歪むので、東京に行くのと感覚的に変わりません。福岡から見えれば、物理的に同じ島にあるというだけで、長崎や大分を広島や岡山より優先するのは合理的選択ではなさそうです。
おそらく、九州という虚構が維持できるかは、福岡からその他の地方がどう見えるかではなく、反対にその他の地方から福岡がどう見えるかにかかっているのでしょう。宮崎は福岡の方を向いているのでしょうか。福岡の方を向くのが合理的選択なのでしょうか。
あと、熊本が九州の中心になっていれば、事情が違ったかもしれません。福岡は北に偏りすぎです。熊本には鎮台があったわけですし、可能性は充分にあったと思うのですが。
写真はカシュガル (2009 年 5 月 4 日撮影)。