寺町計算言語

計算の話や言語の話もするかも。多少は。※個人の見解であり、所属する組織の公式見解ではありません

多様性


多様性 (diversity) という言葉の使われ方には問題があるのではないかという話をします。たぶんそんなに危険ではありません。

多様性を「ある系の中でのある観点におけるばらつきの度合い」と定義しても、それほど外していないと思います。生物多様性 (biodiversity) を語るときには、この定義で支障はなさそうです。

問題は人間に適用する場合です。人間社会で生物多様性に近い現象として思い浮かぶのは、インドのジャーティです。職業や通婚関係という点でジャーティはそれぞれ異なります。社会 (系) に様々なジャーティが存在するという点で多様です。ついでに言えば、それぞれのジャーティが補完的な役割を果たすことで社会が維持されているという点でも生物多様性と共通します。

性別は基本的に 2 種類しかありませんが、どの社会にもほぼ半々存在します。性別の点で社会は多様と言えるでしょう。

そろそろ限界でしょうか。何かがおかしいわけです。例えば性別労働分担をなくしたいとしましょう。上記の定義からすると、性別労働分担の有無に関わらず、社会は多様です。多様性は所与のものであって、系に介入することで変えるべき対象ではありません。多様性の実現を標榜する運動は、実態としては、その逆で、別の観点における均質性を実現しようとしているのではないでしょうか。(1) ある観点における均質性、(2) 別の観点における多様性の両方を満たすことが事の本質です。そうなると、多様性という言葉は不適当であり、別の言葉を用意する必要があります。

写真は生駒山宝山寺 (2017年11月19日撮影)。とにかく危険です。

どこにでもあってどこにもない


私は情報学研究科という組織に所属していて、情報学という分野の一部をやっていることになっています。この情報学の位置づけについては、学部生の頃からいまにいたるまで、いろんな人から大きく 2 通りの説明を聞いてきました。1 つは、すべての学問分野において情報学が不可欠になり、情報学自体いずれ消滅するというものです。もう一つは、情報学は旧来の文系・理系とも違う第 3 の道だというものです。そんなことはどうでもよいと昔は思っていたのですが、そうも言っていられないことを最近は認識しはじめたという話をします。

この 2 つの説明は一見対立しているかのようですが、時間軸を導入すれば矛盾しません。数理モデルを使って定式化する、計算機を使って問題を解く、それらを通じて定量性と検証可能性を確保するといったことは、いまだにそれが行われていない分野にも不可逆的に広がると思っています。問題はそれを実現する過程です。既存の分野に新たな方法を導入し、それを普及させるためには、どうするのが効率的かです。

反対にどんな問題があるかというと、数式への敵意に満ちた人々 (文系に限らず、例えば生物学にもいるそうです) への対応に限られた研究資源を浪費するといったことが現実に起こりえます。彼らは査読者として既得権を行使しうる立場にあります。既存分野のものとは別の発表媒体 (雑誌や国際会議) が作られる事例をよく目にしますが、妨害に対する有効な対抗手段という側面があるようです。

同じことは研究組織についても当てはまります。既存分野の組織に入った場合、データ分析屋さんとして従属的な地位に留め置かれてキャリア的に詰む危険があります。人事権も既得権です。この危険性は、以前はぼんやりとしか見えていなかったのですが、最近は現実のものとして眼の前に立ち現れてきました。既存のとは別の組織は身の安全を確保するために不可欠なようです。

写真は鴨川 (2018 年 7 月 6 日撮影)。大雨の日に信号待ちの新幹線から。

対人関係処理の外部化


ネタです。私も現代人の一人として、記憶の外部化を行ってきました。もはや無文字社会がどんなものだったか想像もつきません。予定の管理も計算機に任せっきりです。PC を開いていないと、その日自分が何をすることになっているのか、何もわかりません。普段は家か研究室で引きこもっているからいいのですが、たまに学会に行って PC を閉じたままにしていると事故を起こしてしまいます。

さて、このまま技術が進展するとして、この先何が起きるかを考えるわけです。そこで思い至ったのが対人関係処理の外部化です。すでに gmail が Smart Reply というメール返信の推薦を導入していますが、あれを発展させた先には何があるのでしょうか?

昔、松浦先生の『清の太祖ヌルハチ』を読んでいて、ヌルハチが毎日部屋にこもって延々と人事を考えていたというような挿話を見つけたときには、王様なんぞになるものではないなと思ったことを覚えています。しかし、よく考えると、人間は誰しもが、多かれ少なかれ群れの構成員の状態を頭の中で継続的に管理しています。人間に限らず、チンパンジーやその他の群れを作る霊長類 (霊長類に限らないかもしれませんが) も同じように、他者の状態管理を行っているようです。おそらく人間の機能の深いところに組み込まれているはずです。

しかし、昔からそうだったから今後もそのままとは限らないことは、無文字社会から移行という事例が教えてくれます。実際に、対人関係処理の自動化に対する潜在的な需要はのびていると思います。それを示す一例は、「人権意識のアップデート」という、最近見かけた気持ち悪い文言です。他人への配慮を増やすということは、他人の状態を管理するコストが増えるということであり、その背景には対人行動の選択を誤ることのリスクの増大があります。計算機に相手の状態管理を支援してもらわないと危なくてやっていられないという状態がまず到来し、そのうち支援の範囲を超えて全自動化するのではないかと妄想しています。

写真は菊水山駅跡 (2018 年 4 月 7 日撮影)。正式に廃止されたあと。

IJCNLP2017


いまさらですが IJCNLP2017 の報告です。2017 年 11 月末から 12 月はじめにかけて台北で開催されました。会場の南港展覧館は台北市内の東の端でした。官製の箱物ということで日本と似た匂いがしました。大阪の COLING と同じく、昼は弁当を配布する方式でした。コーヒーばかりでお茶が出てこなかったのが残念でした。中華圏なのに。

IJCNLP についてはこの日記でも 2013 年名古屋開催のときに言及しました。*1IJCNLP は 3rd tier の会議で、現状では喜んで投稿するところではありません。今回も、主要会議の後に投稿日が設定されていて、それらに落ちた論文を拾い集める意図が見え隠れしていました。似た名前の IJCAI が良い会議なので、その連想から、分野外の人からは良い会議のように誤解されることがあるようです。

自分の論文も、投稿したのは年度内に成仏させるためでした。予算の都合で。*2本当は問題発見編と問題解決編に分けたかったのですが、問題発見編だけの論文を査読者が拒絶したので仕方なく合体させました。無理がたたって補助資料が 6 ページになってしまいました。

一般発表で特に印象に残ったものはありません。招待講演では、Rada Mihalcea が、この世界や、この世界についての人間の認識と、書かれたものとの対応について、思った以上にナイーブな議論をしていて驚きました。言語処理のようにすべてが雑な分野だから許されているのでしょう。出るところに出たらしばき倒されそうです。

写真は松山駅 (2017年11月30日撮影)。

*1:どうもその頃は気分が荒んでいたようです

*2:さいわい次の予算も採択されて、研究は継続できています。

電子ペーパー



最近ソニーの電子ペーパー DPT-RP1を買いました。これが結構使えるという話をします。

昨年度の同じ時期に同種の DPT-S1 を買おうとしたら生産中止で断念しました。今年度後期になって、同じ演習を担当している同僚におすすめされました。それで思い出して、後継機を買うことにしました。

買って早々実戦投入しました。職業柄、学生の作文に赤を入れまくることになります。今年は卒論、修論をほとんど印刷せず、電子ペーパーで作業が完結しました。書きやすさは普通のペンと遜色ない出来です。なお、赤ペンではなく、青字です。もしかしたら設定で変えられるのかもしれませんが。

何が一番助かるかというと、管理できることです。赤ペンを入れた論文を学生に渡すとそれっきりです。手元に残っていても、印刷された紙を私は管理できません。ふと思い出して探しても二度と見つかりません。スキャンして保存するのはあまりにも面倒くさくてやる気が起きません。

電子ペーパーだと wifi で母艦に簡単に複製できて、そこから先は複製し放題です。適当なディレクトリにファイルを放り込んでおけば、あとは検索で何とかなります。

普通の論文を読むのも電子ペーパーに移行しようかと思うのですが、こちらの進捗は半分程度です。論文はぼっち飯しながら読んでいることが多いからです。この高いおもちゃを汚れのつきそうな場所に持っていくのは気が引けます。

あと、本体側面にくぼみがあって、磁石でペンを固定できるようになっていますが、簡単に外れます。ペンをなくしそうで少し心配です。

追記: その後カバーを買いました。