音
いま住んでいる場所は、騒音の面で微妙です。前に住んでいた京都の家のまわりは昼夜を問わず静かだったので、余計にそう思うのかもしれません。いざとなれば簡単に逃げ出せるのが賃貸の良いところです。とはいえ、引っ越すほどではありません。
夜中の 1 時を過ぎてから外で騒ぐ連中がたまに出没します。シベリア送りにしたいところです。朝は朝で 7 時くらいから工事が始まります。
特筆すべきは、いわゆる珍走団が出現することがあることです。古俗は縁辺部に残ると言いますが、21 世紀になって 10 年以上経っても観測できる (目で見たわけではありませんが) とは思ってもいませんでした。
写真は八代駅 (2015 年 3 月 28 日撮影)。駅の裏に製紙工場があって妙な圧迫感があります。
九州で2年暮らして
中国地方が出てくるのは、福岡と実家のある神戸の間に位置するからです。往復に最初は山陽新幹線を使っていましたがすぐに飽きました。トンネルだらけですし。これは以前にも書きました。
そこで、18切符を使って寄り道することにしました。画像は乗り潰した JR 路線です。乗りつぶしオンラインで生成しました。あくまで帰省のついでなので、採れる経路は限られています。備後落合・新見間のように朝晩しか運行していない区間には行っていません。追記: いま確認すると朝昼晩の3便でした。
資源分配問題
世の中にあふれる情報が、自分の時間、気力の限界と比較して多すぎることは人生の早い段階から明らかでした。人生は短く、やりたいことですら、優先順位をつけて選択肢なければなりません。ましてやどうでも良い情報に時間や気力を割くのは無駄です。ですので、ある種の情報が自分に関係のないと判断すると、それ以降はその情報はまるごと遮断して生きてきました。フィルタリングに失敗して、必要な情報を逃していることも結構あるのではないかと推測します。それにあとで気付くこともたまにあります。
それは2013 年の年の暮れのことでした。その年の 9 月にオリンピックの東京開催で決まりました。もちろん、オリンピック関連情報は自動的にフィルタリング対象になりました。スポーツで、かつ東京です。自分に関係することは何もないように思えました。自分にとってどうでも良いことに自分の払った税金の一部が使われるという点を除いては。そうしてオリンピック関連情報を自然と遮断しながら数ヶ月過ごしてきました。ところが、とある企業研究者が飲み会の席で言うわけです。オリンピックがあるから、しばらく機械翻訳特需が続くと。オリンピックと機械翻訳を結びつける言説は今でこそ業界内で頻繁に耳にしますが、私が聞いたのはこれが最初でした。自分にその発想が微塵もなかったことに危機感を覚えました。
写真は今津の元寇防塁跡 (2014 年 8 月 30 日撮影)。埋まっています。
記憶と性格
アスペルガーとADHDの時間感覚の違い―過去と現在と未来という本の紹介記事が面白かったのでメモっておきます。精神疾患を時間感覚の観点から分類しています。例えば、内因性うつ病は過去に、統合失調症は未来にとらわれており、広汎性発達障害は過去、未来、現在のいずれにもとらわれていないといった具合です。この分析が妥当かどうかは知りません。ただ、記憶と性格が関係する可能性の指摘は私にとって新規性がありました。
前にも書きましたが、過去の体験を覚えておくのが苦手です。記事には「学生時代の出席番号や生徒数まで覚えている人」が知り合いにいるとあります。私などは担任の名前すら怪しいです。この性質が現在の私の性格に関係する可能性がある (因果関係はわからないけど) ことは、考えてみればもっともです。どうして今まで気づかずにいたのでしょうか。
写真はムンバイとプネの間にあるカルラ石窟の石柱 (2012 年 12 月 12 日撮影)。彫ってあるのはブラフミ文字だと思いますが、私の知識では微妙に読めません。
NLP2015
京大吉田キャンパスで開催された NLP2015 についてのメモ。例によって箇条書きです。
- 久しぶりの京大。立地が良すぎる。離れてみるとよくわかる。
- 京都でホテルに泊まるのは大学受験のとき以来。
- 参加者が 800 人超え。共催の情処から流れ込んだという説あり。この人たちは普段どこで何をしているのだろうか。
- スポンサーがさらに増えた。学生への宣伝としては効率の良い投資ではないか。しかし、もし学会全体として産業界と仲良くする方向に舵を切ってしまうと、つらいことになりそう。
- 法人化のため総会は今回で最後だという。
- 期間中論文の締め切りに追われていた。失敗。ながら仕事なんて効率が悪いだけ。
- チュートリアル。藤波進氏の「言語データベースの制作公開と著作権」。「概要」を読んだだけでは、どう転ぶか未知数だった。蓋を開けてみれば、ぶっちゃけ話が最高だった。細かいところは頭に入っていない。おおまかに全体像を把握しておいて、あとは必要に応じて資料を参照するたぐいの話。なお、司会の略歴紹介によれば、氏はかつて NTT で機械翻訳の研究をしていたという。そういうキャリアもあるのか。
- 前回に引き続きテーマセッションをやった。いろいろ収穫があった。今後どうするかは決めていない。
- 携帯電話を携帯しない同志がまた一人見つかった。勇気づけられる。
- 相手は私を認識しているが、私は相手を認識していない場面が増えた。年をとったということか。
- ポスターがつらい。毎年のことだが。今年の発見は、内向きに折り曲げるポスタースタンドが思いの外使い勝手が悪いこと。そもそもつらいのに、可視範囲が狭まってますますつらい。
- 今年も YANS 懇に参加。そろそろ年じゃないかと言われつつ。ありえない人数。持続可能なのだろうか。
- 面白かった/面白そうな発表
- B2-2: アレキサンダー大王の遠征は再現できるか? (聞いていない)
- E3-4: 日本語 Universal Dependencies の試案 (聞いていない)
- P3-19: 多目的遺伝的アルゴリズムを用いた組合せ最適化による要約生成 (聞いた結果理解していないことがわかったので後で調べ直す)
- E4-3: ZIPの圧縮率を超えた単語エントロピー符合化と意味構造符合化の一体化による言語解析圧縮データの再利用 (聞いていない)
- A6-5: Language independent null subject prediction for statistical machine translation
- あいかわらず問題をうまく分割して解いている
- 対象言語側での post-editing で精度あがるのがちょっと不思議な感じ。parsing までする賢い言語モデルだと思えばよいのだろうか。
- P4:28: 言語モデルを用いた株価の動向を記述するテキスト生成への取組み (テキスト生成は楽しそう)
- P4:29: モンテカルロ木探索を用いた確率文脈自由文法に基づくテキスト生成 (ちょっと意外な応用)
- E7:2 木刈込みに基づく文書要約のためのZDDを用いた動的計画法 (理解していない。系列的ではないテキストの圧縮表現は要約以外にも応用できそう。)
写真は嵐電の御室仁和寺駅 (2009 年 2 月 11 日撮影)。京都に住んでいる間は結局嵐電に乗らずじまいでした。自転車でどこまでも行けるので。