2004年 2月 (2)。

おふとんとの同化、人間との道化。

Last Modified: Fri Feb 20 23:54:15 EST 2004 (02/21, 13:54 JST)

Feb 20 [Fri]


(11:41)
きょうの todo: 早く帰ってセンタクする。
(14:22)
ふう。ダメなプレゼンだったわ。

新山は最初ちょっと見てダメだと、あっさりと理解するのをあきらめてしまうタイプで、 これは自分でもあまり誉められたものではない。でも多くのプレゼンテーションを 見ていると、プレゼンが協調作業であるということをわかってない人がけっこういる。 ただ自分がやったことを独り語りに「記述する」だけではだめなのだ。 なので、最初から明らかに独り言に専念しているようなスライドをみせられると、 ほとんど残りは時間の無駄に思えてしまう。本当に知りたきゃ論文読んで苦労して理解して 質問するからもう許してくれ、という状態になる。しかしプレゼンを 途中で抜け出すのは失礼にあたるのでそれはできない。あああもう。うだうだ。

これの帰結として、わかってない人が起こすよくある現象は、背景説明やプレゼン全体の文脈の 圧倒的な欠如である。ほとんどの場合、「プレゼン者が重要だと思っていること (伝えたいこと)」と、 「聴衆が重要だと思っていること (知りたいこと)」は激しく食い違っているので、 まず最初に「説得」というか、「歩み寄り」のようなプロセスが必要なのだ (ほかのプレゼンは知らないが、学術的プレゼンみたいに題名だけ何を喋るのか内容が 推測できないものはそうだと思う、それをわからせるのが一番の目的であって)。 それができてない人の発表は、いくら物腰がやわらかくても表現が簡潔でも 傲慢に映るんだけどな。もちろんクリアすべきところはそれだけじゃないが、

(15:16)
NYLUG には Job Posting のコーナーがあるのだが、 これをみてるとおもしろい。さっきは 「New York Botanical Garden が PHP プログラマーを募集しています…」というアナウンスが流れた。 きっとあのお洒落な web ページのデザインなんかをやるんだろうなあ。 わりとこのページのデザインは好きなのだ。フレーム使ってるのが欠点だが、 オンラインショップもあるし、植物園の案内図とか結構ちゃんと 作りこんであるし、ただ見せ物だけじゃないところがすごい。 啓蒙・教育機関としての役割もはたしている。 ご家庭のための「ガーデニング FAQ」とかが細かく書いてあって、 「落葉性の植物を植えかえるのに最適な時期はいつ?」とか、 「春に枝刈りをする必要がある木はどんな木?」とかいったぐあい。 カネのかけ方が違うよ。
(16:40)
ダレかオレに CPU 時間くれーー
(19:38)
セキネさんの書いた腐った Perl スクリプトをなおして自分の実験で使う。 あーつかれた。正直いってこの人の書いた Perl スクリプトは見たくない。つうか、 他人の書いた Perl スクリプトは誰のでも見たくない。そもそも「きれいな Perl スクリプト」って、 「おいしいウンコ」みたいなもんで (なんて下品な! でも思いついてしまったのだから仕方がない)、 絶対にありえない、そもそもそれ自体が名辞矛盾なのだ。

でもまあこの人のプログラムは、C で書かれててもあんまり見たくないけど。 それをいうなら、うちのプロジェクトでまともに「見てもいい」コードをかくのは Ralph だけのような気がするな。 Dan はコード書いてるの見たことないし、他の人々は出自が計算機科学じゃないからまあしょうがないし。 自然言語屋ってまともな計算機科学には入れられてないのかもなー。

きょうはノルマを達成するために (?) 早く帰ってきた。 緑茶もかったし、長ネギもかったし、洗濯もしたし、。それによし。

(21:41)
飛行機とった。

新山の予定:

日本でのおもな目的 (上に行くほど優先度が高い) :

  1. メシ食う
  2. 銭湯へ行く
  3. 本買う
  4. メガネ買う
  5. 墓参り (ちょうどお彼岸だし)
  6. その他
  7. ...
  8. 学会発表

さーーて、それまでにはスイスにタダ旅行できるよう、がんばらねば! (べつにそのためにわざとバルセロナを蹴ったわけではない)

(23:18)
なにやら呪われた予感。

物事は、どうしようもなくなって あとの祭りになったときに始めて理解されることがある、 というのは本当だった。

Feb 19 [Thu]


(12:20)
ところでてくるで、新山も発表する予定である某ワークショっぺであるが、 ナニをトチ狂ったのか当初の予定をはるかに超える 100人以上の 参加申し込みがあったことが判明。セキネさんは喜んでいたけど、みんなオカシイよ! 90人定員の会場に入りきらなくなったので場所を変えるとのことだが、 会場は東工大なんだけど、100人以上入る教室ってあのへんにあったっけ…? W241 とかになるのかな? (ちょーローカルネタ)

どうか「固有表現」がつぎの流行語にならないことを祈る。

ちなみに、ringlog はよく動いているよ。

(14:22)
ふと、PCA について考えて (妄想して) いて、 「アイゲン名詞 (eigennoun)」という考えはどうよ? と思いつく。 つまりひとつの名詞 (あるいは概念) は、いくつかの異なる成分の線型合成であるとするのである。 ばーか。ばーーーーか。テキストマイニングだと?? ぷっっ

専門用語を日常的に使いたがる奴ほどバカ度が高い、という法則は依然として成り立っている

オレが日本語をただの文字列として扱うことに、 後ろめたさを持っていないとでもきみは思っているのか。

(14:40)
ふーん、トイザラス (Toys-R-Us Inc.) って Charles Lazarus が始めたからそういう名前なんだ。

新山のメジャーなプログラミング言語に対するイメージ:

Lisp は言語仕様だけをみれば Python よりもずっと上品なのだが、 ライブラリや実装の分裂ぶりを見ると全体的に優雅というにはほど遠い。 いっぽう Python は優雅というほどの上品さはなく、むしろ 「余裕」と呼んだほうがいいのかもしれないが、現在においては 「ふつう」でいることそれ自体が優雅であるような気がする。

(17:14)
OS の授業で疲労困憊。きょうはどういうわけか 2人がお休みで、 先生もふくめて全部で 4人しかいなかった (つまり、新山のほかに出ていた学生は 2人)。 つまりそれは質問に答えなければならない回数が、いつもの 2倍になるということを意味する。 あーつかれた。そもそも、オレは Ethernet ドライバとかパケットフィルタの仕組みなんて知らねえよ! この授業は、おそらく自分でカーネルを書いたことがあれば、よりよく理解できるんだろう。 さすがにカーネルは書いたことねえからなあ。x86 の機械語もほどんどよめないし…。 新山のプロセッサに対する知識は MC680x0 の時点で止まっている。まあ基本はあんまり 変わってないと思うのだけど、パイプラインとか分岐予測とか、はあ? ってかんじだ。 しかしそれでもこの授業は役に立つ。緊張してるから英語力が鍛えられるし、 毎回「なにが問題なのか? この論文はそれをどうやって解決しているか? それによって解決されていない部分は何か?」という質問を くりかえしされるので、論文を読むときに自然とそのことが意識できるようになる。

それにしても別の世界だこと。用語もちがえば学会も違う。今日きいてみたら 論文の構造が違うのは「伝統」らしく、ぐりむ先生によると「とーくすの論文は長い間こういう慣例になっている…」 とのこと。「とーくす」って何?? と思ったら、これは "talks" じゃなくて "TOCS (ACM Transactions on Computer Systems)" のことだった。 ガーソ。(とうぜんながら東急のキヨスク TOKS のコトではありません。) ほかにも授業中に「NSDI が NSDI が」といってて、何のことかと思ったらそれは USENIX NSDI という USENIX の 新しいシンポジウムのことなのだった。知らないのはオレ一人なのか? 新山は USENIX については 知っていたが (といっても名前だけで実際に行ったことはない)、そんな内輪の分科会なんて 知らねえよ! まあこのようにシステム屋と言語処理屋は違うわけです。同じ計算機科学科なのにねえ。

(18:27)
ぶほっっ
(19:29)
List comprehension をひさしぶりに使ってみようと思ったらエラー続出。 以下のやうなものを書いていた:
s = [ x*2 in x for mylists ]

こういうときに誰かバコっと殴ってくれると助かる。ガッでもいい。

どうでもいいが、id って変数名は使っちゃいけないことがわかった。 混乱するから。

(19:55)
明日ってころきああったっけ?

todo: 緑茶かうこと。もうない

(21:02)
list comprehension に慣れてきた。ら、こっちのほうが map + lambda + filter よりも ずっといいことがわかった。短くて読みやすいのだ!

しかし、これの欠点は変数のスコープがいいかげんなところにある。 [ x*2 for x in range(10) ] などとやっても、x*2 は 閉包あつかいにならず、ローカルに新しい変数 x が導入されてしまう。 これは lambda のほうが明らかにまさっている。 x = [ x*2 for x in range(10) ] とやると いちおう x には望みのものが入るが、混乱を招くのであまりやらないほうがいいな。

(22:27)
じつは ringlog などではなく、multilog を使えばいいんじゃないかと思いついた。 が、たかが実験スクリプトを走らせるのにちょっとそれは大げさすぎるなあ…。

この手のツールを「どの程度まで一般化すればいいのか」については、 いつも悩む。やりすぎると本末転倒だし、かといって何にも考えないでいると 毎回似たようなことやんなきゃいけないし、スクリプトが増えすぎて何が何だかワケわかんなくなる。 毎日がデータとの格闘だ。

(23:11)
げーもう 11時だよ。帰らなきゃ。やりすぎだ。

Feb 18 [Wed]


(10:01)
(10:01) ってなんか人の顔みたいだね。

オイ! ところで、雪が降るって予報はどうなったんだよ? はずれたらしい。空はみごとに晴れている。前線はもう Boston のずっと東に行ってしまったらし。

(13:12)
ひさしぶりの占いクッキー:
Ask a friend to join you on your next voyage.
Lucky Numbers 6, 8, 21, 25, 29, 45
(14:03)
今日の午前中は時系列セミナーで、奇遇にも JPL の人がトークをした。 MISR (まいざあ) プロジェクトで 画像分析をやってるおばさんの話。いやそれにしても。

JPL カッコいーよなー…こういうところに就職したい…
でも「自然言語処理が専門です、機械学習はキライです」なんていう奴が行ったところで、 いったい何に使えるんじゃ、という気はする。 いや、でも天気予報とか地震予知のためのデータマイニングだったら やってもいいかな…とは思うけど。

で、話は戻るが、MISR ってのは NASA がやってる地球観測システム (Earth Observation System, EOS) のひとつで、AIRSMODIS などの他のシステムとともに 科学的な分析のためのデータを提供する装置 (衛星) だ。MISR がほかと違うのは、 複数 (9つ) のカメラがそれぞれ異なる角度で地表を撮影しており、これによって 地上のある 1地点を異なった角度から見ることができるのだそうな。 これで何がうれしいかというと、地表の物体は種類によって光の反射の仕方が違うので、 地表がどんな物質でできているかがわかるというのである。たとえば氷でも、 固い氷と解けてきた氷では反射の方向が違うのだそうな。さらに衛星写真には雲がつきものなのだが、 このシステムでは視差 (parallax) の情報がつかえるので、雲の高度が測定できるのである! これによって地表の映像を立体的に構成することが可能になるらしい。

衛星自体は軌道上をゆるやかにスライドしており、9個のカメラが それぞれ異なる角度から R・B・G・IR (赤外線) の画像を撮影する。 1つの画像は約 1M個のピクセルからなっており、1ピクセルが地上の 270m かそこらに相当する。 この衛星は子午線のまわりをぐるぐる回っており、40ミリ秒に一回の速度で撮影をおこない (その 40ミリ秒の間に衛星は 200m も進む!)、90分で一周、そのあいだに地球は自転しているので 9日間で全地上をカバーする。1日に撮影される画像データの量を計算してみると…

9 × 1M × 4 × (60×60×24) ÷ (40/1000) ≒ 77TBytes!

実際にはこれだけの量を送りきることは無理なので、R チャンネル以外の画像は 間引いているらしいが、とにかく 1日に数テラバイトのデータがたまるらしい。 で、この送られてきた生データは数段階に分けて処理される。 まず位置補正や光学的なキャリブレーションをおこなった Level 1 のデータがあり、 つぎに 9台のカメラの画像をひとつに合成した Level 2 のデータがある。 しかしこれだけでもまだバカでかい。画像データは子午線の半周分という単位 (1 swath と呼んでいた) で 分割してファイルにおさめられるが、この 1ファイルが 600MBytes もある。おまけに 科学者がこれをそのまま研究に使うのは容易ではない。NASA のデータセンターのひとつは ヴァージニアにあるらしいのだが、そこには画像処理した膨大なデータが貯蓄されていて、 オペレータがおり、まず研究者はそこに使いたい画像の ID を渡さなければならない。 で、1週間 (!) ぐらいするとメールが届いてはじめて FTP 可能になる、ということらしい。 こんなんではとてもやってらんないので、彼女の仕事はこの Level 2 のデータから、 さらに研究者が使いやすい、手ごろな大きさの「要約」画像 (Level 3 データ) を提供する ことなんだそうだ。

ところが MISR の限界というのがあって、これは 9日間で地球をほぼカバーするのだが、 もとの場所に「正確に」戻ってくるには 230日ぐらいかかるらしい。 なので、ある狭い領域 (たとえば、セントラルパーク) を継続して観測しようと思ったら、 年に約 1.5回しかサンプリングできないのだ。これをデータ処理でどうにか補間できないか? という話だった。ちなみに、現在のところ天気予報は AIRS システムが得意とする分野なので、 MISR はそれ自身の有効なデータ活用法を見つけなければならない。たとえば何年か前にあった (新山は知らなかったけど) インドかどっかの地震では、地震の前に海面上昇があったという 記録が MIRS にははっきり残っていた (このシステム自体は数年前から動いている)。 なので、もしある地域の時間変化が継続的に観測できるようになると、 地球上の 2つの場所の変化の相関関係をさぐることができて、これは 地震予知などにも使えるようになかもしれないということだった。 ひさしぶりに夢のある話だなあ、と思いましたですね。

ちなみに、ぷれぜんは Keynote だった。 やや視覚効果を使いすぎな感じがしたが、内容がおもしろかったのでドーでもよし。 それにしても米国は気に入らねえ国だが、JPL の技術力や、 その科学的貢献というのは文句なしにすごい。地球科学をやってる人には たまらんだろうな。

(15:03)
そういえばオレはむかしウサギの肉 (斑尾高原で獲れた解体したてのウサギである) を シャレで生のまま食ってみたことがあるが、たしか中学生のころだったが、 あれからおかしくなっtのだろうか? もしかしてウサギにも狂牛病と同じような ウイルスがあって、それが人にうるつというくとはありるうだ
ろうか????? ?

トンコレラ!!

(17:45)
ぼふっっ
(21:22)
機械学習の授業をサボって、LUG のトークを聴きに 57丁目の IBM へ行く。 きょうは PAM の詳細についてだった。いままで新山は、 /etc/pam.d/ の下なんかはのぞいたことがあるけど pam の設定ファイルを自力で書いたことはなかったし、 その仕組みもほとんど理解していなかった。

ところが今日のトークを聞いた結論: PAM はキチガイ的。学習する価値なし。 以上。なんだよありゃ? いや、Mordy のトークはとてもよかったのだが、PAM 自体が悪い。

(21:42)

このような決意表明を、きみは今後何回も聞くことになる。

(22:23)
あるスクリプトの実行ログをとりたい。しかしログは数百 MBytes にもなるので、 全部は記録しておきたくない。ときどきは記録できればいい。

…という目的のために ringlog.prl というのを作ってみた。 基本的に

$ ほげほげ | ringlog.prl

としておいて、ringlog プロセスに kill -HUP すると 過去 100行のログを吐きだす。

#!/usr/bin/env perl
print STDERR "ringlog: $$\n";

$BUFSIZ=100;
@buf = (); $p = 0;
$|=1;
sub dumpy() {
 for (my $i = 0; $i < $BUFSIZ; $i++) { print $buf[($p+$i) % $BUFSIZ]; }
}

$SIG{"HUP"} = sub { dumpy(); };
while(<STDIN>) {
 $buf[$p] = $_; $p = ($p+1) % $BUFSIZ;
}
dumpy();

まあ、screen でいいんじゃん? というのはもっともだが、 screen は激しくログが吐かれるとわりと CPU を食うので。

このよーなどうでもいいスクリプトは Perl でかくにかぎる。

(23:22)
しっかし、また JPL の話に戻るが、こっちで PhD を取って就職すれば、たとえ JPL とまではいかなくとも、 もしかするとこういう「すんごく面白い仕事」にありつけるかもしれないんだよ
な…。 まあ JPL はきっと Caltech 出身者で占められているのだろうが。

いや、だめだ! オレは日本に帰るのだ!

米国にいるのは健康的で鼻息がする。(←ようするにこれが書きたかった)

以上

Feb 17 [Tue]


(11:05)
またネボった。
(11:30)
SURGEON GENERAL'S WARNING: You are late.
(13:39)
…と思ったら、ぎりぎりで間に合った。 しかも、きょうはミーチィングなかったんだって! 忘れてたよ。

で、きょうの student seminar は fu jie が出てきて、 画像 (オブジェクト) 認識についてしゃべった。 neural net のほうが SVM よりも 2倍性能がよかった、ということと、 実験で撮影したオモチャはすべて Walmart で買った、ということしか覚えていない。

画像認識においてはトレーニングに背景や光源が激しく違う画像を利用するため、 SVM のような global matching をおこなう学習アルゴリズムは実際には不利にはたらき、 local maxima が実際には有用だということだった。しかし、一般的に SVM は サイコーだと考えられているため、このことはなかなか信じてもらえないのだと。 この考えはおもしろいな。同じ現象は自然言語にもあてはまりそうな気がする。 そういえば一時期、とある国のとある学会では猫も杓子も SVM を使っていたことがあったが、 今年の年次大会プログラムをみると、タイトルをみるかぎり「サポートベクタ」が入っている発表は 一件しかなく、某国における SVM 馬鹿は一掃されたかのように見える…が、 実際にはタイトルに入ってなくても中で SVM を使ってる連中が増えたダケかもしれない。 で、これまた煽った奴と煽られたアホが両方いるわけで…。 まあ、「学術界ってこんなもんか」と妙にサメた気分で思うわけですな。 つぎの頻出キーワアドはなんだろ〜。「アクチブラーニング」かな? かっこわらい

どうでもいいが (よくないが)、先学期までは機械学習の授業をとっていたので、 「Kernel」といえばアッチのことをさしていたが、今学期に OS の授業に出はじめたら、 「Kernel」といえばまたアレのことにさすようになってしまった。 そしてカタカナで「カーネル」と書くと思いだすのは道頓堀に投げこまれた例のおじさんか、 ディーノとルイージのコンビ (どっちがどっちだったか忘れた) だけである。 まったく、なんでおんなじ用語を使うんだよ!? Colonel に「カーネル」という カナ読みをあてたのは確実に失敗だ。いや逆だな。Kernel に「カーネル」という 読みをあてたほうがいやらしいな。これからは Kernel のほうは「カーのる」と呼んでほしい。 そっちのほうが発音近いから。「カーぬる」でもいいよ。ちなみに古い Hansen の論文などをみると、 当時は「OS の核」という意味で Kernel という言葉と Nucleus という言葉が両方とも 使われていたようだが、 Nucleus というとなんか生物っぽいよな。 だいたいアッチの Kernel はなんで Kernel と呼ばれているのか全然わからん。 たしか線型代数でも出てきたような気がするけ? ど?

(15:12)
よ?

しかし、考えてみると「Kernel」という用語のまったく異なる意味が ふつうに存在しているのは、計算機科学という分野がいかに分断されているかを よく表している。のかもしれない。Machine Learning と Honors OS を 両方とってんのはオレぐらいのもんだろう。 つうか、OS の授業に出ている顔は全部覚えている (新山のほかに 4人しかいない) ので、 この大学では確実にオレだけだ。だからどうしたって感じだけど。 システム屋のセミナーに出てみるとあきらかに雰囲気違うもんな。 それからおもしろいと思ったのが、これらの分野には論文の構造にも慣例上の違いがあるということ。 OS の授業で読まされる論文のほどんどが、Related Work を実験結果のあとに書く (うちらが書く論文ではふつー逆)。これがさらに離れた分野 (たとえば、社会科学系の論文) になるとまっったく変わってるんだろうな。そういやー、前にウエキさんから 「文系の論文」のおどろくべき特徴についてショックを受けたという話を聞いたことある。 それによると、彼らはあまり連名で論文を書かないし、 学会発表とかでも OHP もなにもなしで「ただ壇上でしゃべるだけ」なのだという。 それはたしかにすげえ違いだ。

(17:05)
そしてまたその OS の授業に出てくる。 この授業に出るといつも自分のバカさ加減にうちのめされて帰ってくるのだった。 なぜならそれは先生を含む 5人の議論に参加しなければならないからである。 (…つづく…)

(追記 00:41) この授業がいいのは、論文を批判的に読む訓練ができることだ。

(22:40)
はーーー。ぐりむ先生の授業で出てきた OS の priority inversion について 調べていたら、1997年の Mars Pathfinder について書かれた 「ヒットな」記事をみつけてしまい、おもわず翻訳していたらこんな時間。もう帰る。 5時間以上もかかってるじゃねーか。

火星でいったい何が起きたのか? (20kbytes)

まあこうして自前のプロジェクトは遅れに遅れていくわけですが…。

ところでお前 pygame 関連の翻訳はいったいどうなったんだよ? 最低あと 3つは未訳ファイルが残っているじゃねえかよ! 当初は面白ければリファレンスマニュアルも訳そうかと思ったが、 どうもあれから他におもしろいものがいっぱい見つかってしまったために じょじょに熱意が失われているなあ…。思うに、Pygame はさいしょ プラットフォーム独立にゲームが組める (し Java よりは軽い) ので いいのではないかと思ったのだが、Flash がこれだけ浸透してしまうと どうもニッチがない。

(23:41)
ようやく帰宅。ハラへった〜〜〜〜〜〜

また navneet の料理をつまみ食 (しょく) する。 毎回なんか申しわけないなあ、たまにはオレもお返しをせねば、と思うのだが、 Owen のときと違って、彼は日本の料理にはまったく興味がないようだった。 まあ、あんまり日本に興味があるヤツってのもうざいけどね… そんな奴はオレ一人で十分

(00:36) ついでにけんきゅう日誌
今日は一日じゅう授業やセミナーに出ていてほとんど何もやらず。 実験スクリプト走らせたぐらい。でも明日も時系列せみなあがあるし、 srg があるしで、どうかなー。でも「お前セミナーばっか出てて研究してねえだろ」とか 言われると困るので、さっさと実装ることにしよう。 聞くところにょるとアスは雪らしいので、はやめにいってやるかね。 TODO: extraction system, scorer の実装。

Feb 16 [Mon]


(10:01)
(やっと) 宿題が出た。

夢の中で、自販機のボタンを勝手に押すおばさんと格闘してたが、 こっちが先にボタンを押そうとして「おりゃぅ」とやったら 現実の手で左側のカベをドスンとやっちまった。 まあ実害はなしさ。

(12:31)
目標のひとつは、いかにして「お茶目でありつづけるか」ということだ。 いまの新山の芸風は「お茶目」とはちょっと違うと思う。

あ、統計的手法のメリットがもひとつあった。それは:

というのがある。まあ実際には規則ベースで ロバストにかけないかというとそんなこともなく、 data sparsness (マイノリティ) の問題は統計だろうが 規則だろうがどのみちふるい落とされるのだけど。

自家製形態素解析の話だが、chasen 付属のモデルだとどうもいまいち性能が悪い。 だいたいこれって新聞記事みたいな文章のことしか考えてねえでしょ? ちなみに新山がテストに使っているコーパスは山形浩生の文章 (1MBytes 強)である。 目的がバレバレだが、文句あっか。 そこで suffix array と EM を使って辞書とモデルを自動的に (unsupervised で) 学習できないかと思いはじめた。 が、どうせうまくいかないんだよなあこういうのって。

(なお、この作業は大学での研究としてやっているワケではないので、セキネさんには内緒です)

(13:06)
作業用のディレクトリ名をつけるときには、ひとつ重要なポイントがある。 それは「最初の1〜2文字をなるべく重ならないように名前を決める」ことだあ (あれ、「あ」が入ってしまった、うっかりしてたら)。

なぜならそうしないとシェルから補完するときにむかつくから!

(14:44)
空をげばどちらを見わたしても雲がひとつもないほどのい空。

だが、放射冷却で久しぶりにサブいのだよ今日は。

ところでいまふと気づいたのだが、「寒空」っていう言葉は ふつうなんとなく風ピューピューな「どんより曇り」気味の空を連想させるが、 本当に寒いのは今日みたいに放射冷却で雲ひとつない空のほうじゃないだろうか。

NYLUG のメイリングリストで、デンマークの計算機科学の学生グループが、 「観光で NY にくるんだけど、どっか Linux を使ってる企業で見学できるところない?」 と尋いている。IBM や Google NY をはじめとして、Goldman Sachs、Morgan Stanley など 金融の大手も使ってるところは多いらしい。そういえば前に FRB (連邦準備銀行) の アドレスから投稿してる人もいたしな。最初これを見たときは「おお @frb.org だよ、すっげー!!」と と思ったもんだ。聞くところによると、あすこは自前でシステム屋をもってるらしく、 強者ぞろいなんだそうな。ちなみに FRB 議長のグリーンスパンは NYU 卒である。 出世頭だな。

(15:43)
セキネさんのパーザに致命的なバグを発見。ある文章をかませると、 出てくる依存構造がループしているのだ! こりゃあアカンでしょ。 なんでみんな今まで気がつかなかったのだろう。ちなみに、 これはスドウフォーマットに変換されたあとも直っていない。 だから木構造を番号で表すのはやめれってのに。 これは簡単にエラーを導入しうる (しかもそれがわかりにくい) という意味で、 本質的に脆弱な表現形式だと思う。現在使っている依存構造のフォーマットというのが、 基本的には:
* 文節1 → 文節2
* 文節2 → 文節3
* 文節3。
というふうに書かれているのだが (本来は英語なので chunk だがここでは文節とした)、 これはあきらかに KNP のマネだが、こう書けば簡単にループを実現できてしまう:
* 文節1 → 文節2
* 文節2 → 文節1
* 文節3。
おまけに、この文節は番号順に並んでいなければならないので、 途中の行を削除した場合に番号をつけかえなければならない。 S式のほうがずっとましである。しかし S式は S式で別のまちがいやすさを導入するため、 これまた依存構造の human-readable な出力形式 (ふだんは読まないが、その気になれば人間が読めるし修正もできる) としては適切でない。 結論: インデント。しかし実はインデントには 「空白に重きを置きすぎる」という深刻な欠点がある。ホワイトスペースの数をまちがえると致命的な結果になるのだ。 このおかげで、プロポーショナルなフォント環境では信頼性が低い。 結局、汎用的なデータフォーマットなどというものは ありえない、その場に応じて設計するしかないということになるわけだが、 task-specific な形式を考えるときに意識しなければならないこととして、 次のようなものがあると思う (前にも煮たようなこと書いたけど、改訂):

みんなこの手のことを甘く見てるけど、「データ構造の視覚的な見やすさ、 および頑健さ」というのは個人的には重要だと思っている。 UNIX のパイプはあのシェル上での記法が発明されなかったらここまで使われなかっただろうし、 たとえば物理とかでもファインマン図 (新山はよく知らない) の発明は かなり重要だったんじゃないか。

…そう考えると、自然言語というのはどうなんだろう。 こいつは上にあげた (表現にける) 利便性、(伝達の際の) 頑健性や信頼性といったものを 上げる方向に発展してきたはずと考えるが、言語によってこれらの優先順位が違ったのかもしれない。 「日本語がもし今とは違ったやり方で発達したら」という想像はほとんど無理だが、 あまりに multi-purpose すぎる構造なので、どれもたいして向上してないのかもなあ。 論文用語や軍隊なんかの喋り方はそっち信頼性を上げようとして意味的な曖昧さをなくしているのかもしれないが、 日常生活では曖昧じゃなくなったらかえって不便になることも沢山あるしね。 言語学ではこういう方面からアプローチしてる人はいるのかな?

(17:36)
久しぶりの Strand Books。 $12 で 900ページ超の「現代ハーブ辞典」という本があって、 買うべきかどうか深刻に悩む。つうかオマエ、そんなもん買ってどこに置くんだよ? そもそも読むのかよ?? という疑問は虚数解をもつ。ほかにも料理関係の本でいくつか 楽しそうなのがあったが、どれもカラー写真つきでデカくてぶ厚いのでやめとく。 新山がおもに立ち止るのは一般的な Science 関係と、Cookbooks の棚が多い。 しかし料理本はどれも写真集としては楽しくても、自分が食う気にはならなそうのが多いんだよな。 あと最近植物や動物、ガーデニング関係の写真もわりと楽しいことがわかった。 Architecture はやや止まる。History や Fiction は比較的スルー。 そのあと奧のほうにいくと Philosophy や Psychology、LGBT Studies といった 社会科学系のコーナーがあるのだが、そっちも結構時間をつぶす。 まんなかへんの、あの背の高い文芸評論セクション (おそらく植草甚一が通いつめたのは このへんだろうと思はれる) はぜんぜん行かない。そもそも、 あんな高いところにあっちゃ本取れねえし。一番高い段は新山の背丈ほぼ 2倍の高さで、3m もあるのよ。 明確な目的があって探すならともかく、なんとなく見るには向かない。 しかしときどきあの安定の悪そうな本の谷間 (むしろ本でできた崖という表現が適切だる) を通ると思うのだ、 「ああ今ここで地震が起こったらオレは確実に死ぬな」と。 でも本の山におしつぶされて死ぬわけだから、それはわりといいかもしんない。 でもどうせなら日本語の本で死にたい、などと妄想する。

どうよこのスノッブさ! 新山だってブログロ的なことを書こうと思えばこれくらい書けるのだ! そのあと帰ってきてビルのエレベータにのったら、McDonald のポテトの匂いが充満していた。

(18:23)
あーこんな時間にねむくなってきたよちくしょう。。。
(21:47)
おもしろいメールが forward されてきた。 linux-elitists のコレだ。 Linux-2.6.2 の tar.bz2 を「カーネルのソースコードここ! Googleも使ってる!」と宣伝して BitTorrent で放流したら、あっという間に 600 のアクティブクライアントがついて、 数日後には MS の法律部署から彼の ISP 宛に「unlawful な行為」の停止要求が来た、という話。 流されていたファイルが Windowsのカーネルではなかったということに MS すら気づかなかったとさ。
(22:24)
家へ帰るとなにやら妙な匂いがした。ら、じつはこれは Navneet がお香を焚いたことがわかった。ふむ、まあそういえばそんなかんじだ。

どうも今日はネットワークの調子がよくないらしい。

Feb 15 [Sun]


(11:53)
朝おきたら、左上半身が気化していた。

久しぶりに寒い一日になりそうだ。空は雲ひとつなく晴れている。

ほんとうはなにか「ブログロ風に」書こうと思ってやってみたのだが、 書けなかった。ブログロにはネタが必要である。 お天気の話なんぞを書いていてはいけないらしい。 どういうわけか、天気とか料理について書く人はあんまり見ない。 たいていは

そういうネタが「お上品」とみなされる。のである。

まあ、つまらんよね。基本的に。

(12:20)
ふいに、あたらしい遊びを「発見」した。 それは、トースターの赤熱している導線をじっと見ることである。 とにかくじっと見る。すると、パンのまわりの空気が 流れて陽炎ができているのがわかる。

「陽炎」ってスゴい言葉だよな。よく作りやがった。

するとふいにがたん! と音がして、火花が散ってあなたは現実に 引きもどされる。引き戻す距離は (尺貫法で) 4光年ぐらいあるので、 ひっぱられた腕はだいぶ痛むだろう。

(13:38)
なにげなくひねり出した名前 (モドキ) の "Gotham Burger" が、
なんとなく気に入っているのだった。

いつもなにか (いつのまにか)、Safaryy が 1.2 にアップデトされて煎る。

あのさあ、どうでもいいけどさあ。

人工甘味料ってどうしてこんなに甘いの?

新山はまだおカロリーを気にする体格ではないので、 人工甘味料よりも伝統的なグラニュー党のほうが好きなのだが、 ここでは砂糖というとドブクロ (袋まるごと一個、の意味、いま勝手に考えた、 かさばってうざいあたりの感覚が先頭の「ド」に集約されてる、ドブロクと非常に煮ているが煮て火なるものである) でしか 売ってないことが多く、一口サイズのパックで売ってるのは人工甘味料しかない。 ドブクロで買ってもいいが、だいたい量がありすぎて使わないのでもったいないのだ。 で、仕方なく人工甘味料を買うと、これがたった 1g かそこらでド甘いという 現象に遭遇するわけである。なんつうかさ、これ、下品なほどの甘さ。 わかる? 下品も下品、まるでアメリカ人向けの菓子ぐらい下品。おっと!

というか新山は「人工甘味料 → チクロ!! → 発ガン」という 安易な思考の流れがあるので、どうもいつ自分が発ガン君にやられるか不安でしょうがないのだ。 (ウソ度 34%)

(16:36)
実験するときは nice かけてほしーなー。

ところで (てくるで) Lush を使った機械学習の宿題はいつでるんだよ!! まず先々週の水曜日に「あした宿題だしますから、メイリングリストに流しますから」 って言っといて、なーんも音沙汰ないと思ったら、そのつぎの授業で 「えーと先週はたぶん気づいたと思いますが、宿題ださなかったんですけど、 あした宿題だしますから、メールしますから」で、 4日間たってもなんにもなし。オイコラ。あのおやじ、やる気あんのか? こっちは宿題を楽しみに授業出てんですから! ニッポンの大学生のときはこんなこと考えもしなかったが、こちらの学生は宿題を喜ぶ傾向にある。 よく考えられた宿題は理解を助けるからだ。ちなみに今までで一番たのしかった宿題は ぺるりん先生のやつであるが、じつは一番役に立っているのはアルゴリズムの授業で 出されたあの地獄のような量の問題かもしれない。なんたって解くのに 2〜3日はゆうにかかったからな〜 (宿題のために徹夜したのもなつかしい思い出である)。

そういえば、「旅行-driven」で思い出したけど、 トクナガ先生って絶対 旅行-driven で学会に出してるよな。 だって米国で学会やるときは全然こないのに、 ヨーロッパの学会だとどんなにマイナーでも絶対行くもんな〜。 (なお、これは「本人がこんなとこは絶対見ないだろう」と 仮定して書いておりますが、万が一見られても開き直る自信はあります)

(17:21)
ちょっと外出したらさみいさみい
(19:23)
すいません、寝坊しました
(22:00)
なんとなんとな。パスタ用のソースだと思って買ったものが、 じつはソース入りの調理ずみパスタだったということが判明した。 なんてこと。やたらと強調文字をつかうくせはやめなければならない。 ヘンなところを強調するとオモリロイね。 日本ではアヲハタやハインツなど (ハインツは日本製じゃないか) 缶入りのソースを よくみかけるが、たしかにこちらでは缶入りのソースはあまりみかけな。 ほどんどが瓶入りである。まあ、ちなみに新山がよく買うのは Prego なのだが、 どうでもいいが、ふむうへえ
(01:10)
ああ、また今宵は 氷点下 -10度℃ 摂氏 まで下がるのかしら。 頭痛が痛い痛い痛い腹痛バッファーアンダーフロー桁あふれキャリー過電流。
ツェナーダイオードは幸福!

寝るか。

Feb 14 [Sat]


(10:22)
忘れてた
(15:47)
忘れてろ
(18:14)
こんにちは。

きょうは地下鉄で遊んでしまった
名づけて「迷子遊び」。

(18:55)
久しぶりに 毛唐どもの書いたブログロ を 読んでみたら、自分はなんでこなにセンスないのだ、オレだってもうちょっとカッコつければ もっとエレガントでトワイライトでビッグライトな文章だって書けるのに、と思いしが、 まあはばかられるところもあるのでやめておく (ひらがなばっかり! うんざり君)。

思うに、やつらはなんだかんだいっても trackback とかたいして活用してないよね。 コメントとかもばんばんあるわけじゃないし。 新山に言わせりゃ「blogツール」というもの全部が第二システム症候群なのだが、 いつまでみんなこんなの続ける気なんだろ新山はもうとっくの昔に飽きた
ね。

たぶん今から10年後くらいには「ありゃあ一体なんだったんだ?」ということになりそうな気がする。 blogだけではない。Wikiもそうだ。ファイル共有もきっとそうだ。 なにかが根本的に欠けている時代に人々の目をごまかすための、 過渡的な技術というふうにしかみえない。 (それをいってしまえば、web もメールも多かれ少なかれそういう面はあるが)

しかし欠けているものがなんなのかはさっぱりわからないけれど、 とにかくなにかが欠けてるよ。それはたしかだ。

すてきなひまつぶしですね (お世辞)、と言ってあげればいいのだろうか。 そのわりには、たいして楽しくもなさそうなんだよなあ。 いやほんと、さっぱりわかんないんですよ。

(19:42)
あれからまた考えたのだが、まあべつに 「これは革新的な、革命的な、世界を変える、ツールですよ!」 というようなことをいわなければべつにいいのかもしれない。 しかしそれにしても、セコい仕組みだよなあ、どれも。
(20:09)
あーーーウマすぎたーー
(20:59)
べつにバカにされる分にはまったくかまわないのだが、 たのむからあとをつけまわすなと言いたい。 オレは被害妄想か??
(23:44)
さっきのつづき。たぶん、Wiki も blogツール (?) も、 最初はただのちょっとしたツールだったのだが、きっとどこかに誰か 一般化が好きなバカがいたんだろうな、と思う。 つまり「この概念は革命的だ!」と思いこんじゃったのne (そういうのはたいてい西洋人に多そう)。もちろん、何かは 生きのこるかもしれないが、騒がれたもののほとんどはやがて死に絶える。 で、オレが不満なのは「毎回煽動してたやつはどこへ消えたのか!」 ということである。しかし煽動したやつが悪いのか、それに 振り回されたほうが悪いのかといえば、どっちも悪い。

きょうは、赤かった。

今日のけんきゅう日誌 (手抜き)
Collins のパーザを動かしてみたら、あまりにも使いにくく + 遅くてビックリした。 メモリをバカ食うし、1文パーズすんのに 1〜2秒かかんの。 まあ、基本的にこれは reference implementation なんだろうけど、 charniak のパーザでもそうだけど、こういうのを見ると、むかしどっかでやってた 「封筒の中の絵を 30分ぐらいかけて透視する人」というのを思い出す。 はあ、そりゃ結構。すごいすごい。でも 30分かかるんなら封筒あけたほうが早いでしょ? まあさぞかしたくさんのたくさんのデータをお使いになっているのでしょう。 問題へのアプローチが激しく間違っていると思うけど (もう表層は飽きた)、 彼はこれで名をあげたんだろうから別にいいか。 knp に相当するまともなパーザが英語にないのはじつに気の毒なことだ。 (といっても knp もまだかなりアホだし、バグだらけだし、 おまけにどう動いてんだかよくわからんあやしい構造だが…)

(追記) 統計的手法をやってる人がよく言う文句のひとつに 「人手を介さずになんでも学習できるからいい」というのがある。 が、これは実際にはハゲしく間違っているということがわかった。 とくに supervised learning の場合、お前、その学習データは誰が作るんだよ、 コーパス作るほうが PhD 学生ひとり雇うよりも何倍もカネかかるじゃねえかよ! ということで、新山は基本的に統計的な手法のメリットというものを ほとんど信じていないのだが、研究者的にはこれにはひどいメリットがあって、

ということである。

まあ、なんだかんだいって自然言語処理は停滞してると思う。 新山はどっちかってえと認知科学よりのほうが好きな人間だったので、 表層ばっかり使っっってる研究はもういい加減あきてるのだが (そういうのがすきな人は、Google にでも修飾すればいいと思う 、好きなだけデータを使えるよ)、 これもタダ旅行のためですどうかおゆるしください、自分。

Feb 13 [Fri]


(08:32)
おはよ。

夢の中で、なぜかパック旅行 (日本国内の) に参加していたのだが、 バスからおろされてみるとあたりの人間はみなカタコトの日本語を話し、 間違った漢字 (「按全第一」とか) がそこらじゅうに書かれている という「エセ日本」だった。みょうに表記が古めかしく、しかも漢字が多いので 「もしかして台湾かどこかにつれてこられたのか?」 と一瞬思ったが、あと 50年もしたら移民が進んで日本は本当にこうなるのかもしれない。 あたりは曇り空で、町はなんとなくひなびた感じがし、通学中の学生はやけに純朴そうであった (というか、かれらの髪型はあきらかに中国人っぽかった)。あれは日本国内だったんだろうか。 それにしても、みょうにリアルな夢だったなあ…。

50年後までに絶対に起こりそうなことはいくつかある。覚悟しておかねばならない。

(10:09)
そういえば今年もまた ACL には出せなかったわけだが。

そうか! COLING に通せば欧州にタダ旅行できるというわけか! がんばろーーっと!!

いつもいつもいつも新山の論文はタダ旅行-drivenで書かれているような気のする。 (日本にいたときからそうであった)

todo: トイレ神、ハブらし

(12:57)
あらたまって使うものではなく
毎日つかうものを
(13:22)
用語かいせつ:

しょーもなー。スペルチェックしろよ、スペルチェック!!

まっかろっくぴっつ、
まっかろっくぴっっつ,

(16:05)
今日はころきあのあと、nycnlp のトークがあんのをすっかり忘れていた。 「さーてこれから研究すっかー」と思っているときに「これからトークがあります」 と言われるのはえらく出鼻をくじかれたような気がする。しかもあんまり面白くねえし。 ころきあは、暗号プロトコルの安全性についてで、これはまたあとで。

あほなシェルスクリプトをかき、それを fooli.sh と名づける。

(17:22)
自由ヶ丘の串焼き屋? って、クシキュウじゃないだろうな。 あすこはまえに研究室の忘年会 (かなにか) で行ったよ。

smoothjazz.com で、ナレーターが 「ギタリストのロナルド・ブー・ヒンクソン! (あきらかに『ブー』の部分を強調して言っているように聞こえる)」 というたびにニヤニヤしちゃってしょうがないのでしょうが、

これは私 (わたくし) が子供だからです。(わたくしが)

(19:51)
どーーーにもヤル気ナシ雄君なので、「さっさ帰り」してきてしまった。 どうすえb? 買い物はみんなすませたし、洗濯もしている。よろよし

google://よろそよ/ (0圏)

もうどこにもいない

(20:16)
日本では学歴詐称ブームで、こっちじゃ軍隊サボったよブームか。 みんな暇だなあ。

ところで、キチガイ的クローラは自宅サーバの敵なのでなんとかしてほしい。

Feb 12 [Thu]


(09:37)
  )) ← 手

(12:19)
  )) ← 前髪

(13:48)
ひさしぶりに Python で誰も理解できないコードが (勢いで) 書けたので、 記念にここに書きつけておく:
def filter_ratio(threshold, nartss, ratioss):
  return apply(zip, map(lambda (narts, ratios): ratios,
                    filter(lambda (narts, ratios): not filter(lambda nart:nart < threshold, narts),
                           zip(apply(zip,nartss), apply(zip,ratioss)))))

これは

filter_ratio(50, [(100,120,150),(200,40,300)], [("a","b","c"),("x","y","z")])
などとして呼び出し、左の配列 [(100,120,150),(200,40,300)] の要素 2つがどちらも 50 を超えている 要素と同じ位置にあるものを右の配列 [("a","b","c"),("x","y","z")] からフィルタする (結果は [("a","c"), ("x","z")]) というものだが、 3分たったらもう自分でも何やってんだかわからなくなった。 いや、最初からわかってなかったのか。 しかし、あきらかにもっとわかりやすい方法があるはずだ。

そういえば故・祝一平の著書に、「その筋たる人間の条件」として

というのがあった。新山はこれを信念として受け入れることはできないが (受け入れたくない)、似たような信念として というのはある。でも、わかりやすすぎく(?)はしないこと!!

しかしこういうのを見ると、あきらかにオレは Lisp 的思想に毒されているな。

(15:03)
New York Times に Bram Cohen のインタヴューがのっている。 いかすおやじだな (といっても歳はオレよりいっこ下だが)。

(この日記はおもに Bram Cohen の名前を知っている人を対象として書かれています)

(17:00)
うギョー、教も時ギョー顔割ったdddyjzm. え おれ??

くそー、日本行きの国際線はノンストップ瓶だと 同じ Continental でも JFK のほうが EWR より $300 も安いじゃないか! 往復にタクシー使っても まだ全然おつりくるじゃん! 知らなかった。 これからは JFK を使うことにしようううう、う。 EWR ちかくて便利なんだけどなあ。あれは国内線専用か。

(19:21)
けんきゅう日誌
もう論文だしちゃったからアレなんだけど、 きょうデータをいろいろいじっていたら、さらにヘンな現象を発見した。 論文では複数の新聞記事で NE の分布が似ている、という観点に 着目したのだけど、頻度の変化 (= 微分) に着目するとさらに似ている。 つまり人の名前は、あるとき同期して使われるようになり、同期して使われなくなる、 ということなんだろう。この同期に比例して NE の比率も高くなるのだが、 しかしどういうわけか、C == 0 の近傍で異様なピークがある。 これらの名詞はいったいどんな特徴をもつのか? と思ってしらべてみたが、 とくにどんな特徴も持たないようだった…。 いったいなんなんだろう、これは? とにかく、この属性はもうすこし調べてみる価値がある。 ひとつのおいしい特徴は、個々の値がマイナスになりうることだ。 たとえば両方の新聞で人気が反対の方向に振れていると、この値はマイナスになる。 この場合、それがさしている実体は「別物」である可能性が高いというわけね。 しかし実はここには「2つの新聞はどちらも十分に公平だろう」という仮定が隠されている。 それと、タイムラグの問題をなんとかする必要があるな。 たしか outlier 認識の研究は machine learning のほうでかなりあるだろうが、 そいつをあたってみるか。

ひとついいのは、この方法だとデータが増えれば確実に 精度が上がると期待できることだ。。。なぜなら時系列データが増えれば、 そのぶんだけサンプリングする点が多くなるわけだから。 しかし、もうひとつの問題は、腹がへったことだ。 これは早急に解決しなければならない。空腹度でソートしたときの 結果を見ると、やや早めに切れている。ダミーの数値を与えて ごまかしておくか? いやそれはだめだよ、… が悪くなる。 そうかい、そうかい。

(21:56)
Navneet の料理をなにげなく食ったら、かれー。 なんか豆を煮たスープなのだが (名前不明)、とにかくカライのである。 こんなもん食ったらまた明日の朝がアレになっちゃうよ。でも食うけど。 インド人による本場のインド料理が居ながらにして! 食える生活。 でもオレはインド人や韓国人とは結婚できないと思う。絶対。
(23:31)
ムッシュウは?
(00:24)
やっぱり記事の波形 (というとなんかアヤしい雰囲気、波動系な) がギザってるのを 補正る必要があるだろうなあ。(まだやってる) ひとつの可能性は、重複した記事が多すぎってのがありうふ。 あれ、まちがえた。 文章のコピーばっかりしないこと!
(01:37)
遊ぶこと
探索することe
落書をするように
日本語を書くこと
レゴをつくるように
日本語を書くこと<

夏は
ひやむぎが
うまい
なあ
<,/centeR>

Feb 11 [Wed]


(07:31)
なんか知らないがこんな時間に自動的に目がサメてしまった。 これはこれはどうゆうことだ。締め切りがヤバいと早起きになるのだろうか?
それとも、死期が近いのだろうか??

てゆうか論文はもう書いたよ。あとは今日中にド変更さえなければ。

(08:25)
ところでいまだに新山は mutt-1.3.22 を使ってるのだが、 このあいだ Ralph が素(←ゲジゲジ)/bin/mail を 使ってるところをはじめてみたのにゃあ感動した。
(10:34)
新山のきらいな「負け犬論文用語」一覧:

推測ばっかしてんじゃねえええええよ! まだまだあるだらう。
(12:03)
で、セキネさんからはとくに大した物言いもつかなかったので、 この負け犬的な論文をこのまま提出する予定である。 つうことで意味もなく computer store に寄って "Learning Programming Cocoa with Objective-C" なる本を立ち読み、Objective-C は変態だった。 関数呼び出しとメソッド呼び出しが字句的に区別されている時点で使う気なし。 なんだか文法が Perl みたいなのだけど (@ とかやたら使うし)、 これは出自がもともと C のマクロだったからだろうな。 ただしこいつは「クラスオブジェクト」をサポートしているために、 C++ にくらべると少しはまともなオブジェクト思考であるらしい。 まあ、Python と同程度といったところ。それと dynamic typing をサポートしているが、 新山は強い型付けのほうが好みなのでこれはどうでもいい (その点では Python にも 不満がある、でも OCaml とか文法が変態なのでそれよりまし)。 つまり並べると次のようになる:

オブジェクト思考度:
Perl << C < C++ < Objective-C ≒ Python < Java < Ruby < SmallTalk
文法のまとも度:
Perl < Ruby < Objective-C < C++ << OCaml < C < Java < Python < CLOS?
実行速度:
知らない。
ライブラリの使いやすさ:
C < C++ ≒ Perl < Java <<< Python
ユーザの平均精神年齢:
R(省略) < Python
結論:
Python

今日も平和、と…。

(15:04)
ふう〜やっと提出した…。 毎度毎度のことながらオンライン提出はめんどくさくて神経使うからキライ (いや、それをいうなら「オンラインじゃない提出」でもそうだが、 三田まで提出にいったときは「恐縮」というプロセスが入るのでなおさらそうだが)。 あの cgi はシライ先生がおつくりになったんでしょうかね、 大変ですね、あの方も。でもなーんかインターフェイスが素気なくて 提出したあとも不安になる。誰かこの手の「オンライン提出システム・完全版」を つくって公開しろよ、J2EEかなんかで。 とーぜん提出した PDF はプレブーできて、ファイルのさしかえとかもオッケーなの。 しかしオレならそんなシステムはどのみち使いたくないね。 というか、この手のやつは HTTP なんかよりもメールで受付したほうが 安全かつ簡単そうなのだが、おそらくみんな MIME を自動処理する方法を 知らないんだろう…。(新山はもちろん知ってるさ、なぜなら email.* の部分を訳したから!) ああでもそうすると /bin/mail を使ってるおじさんは提出できなくなるから駄目だね。

で、そのご「行きの飛行機いつにする?」とかいう会話をしていたら Anina (学生事務のおばちゃん) からメールが来て 「アンタ! RAのアポイントメントレターを今日までに提出しろって言ったじゃないの さっさと提出しなさいよ!」とおこられた。ふげえええ。いちおうサインはしておいたのだが、 「あとでメシ買いに行くときに出せばいっか」と思ってたのだ。もうしわけありませんでした。 そのご帰ってきて、ゴハン (といっても米じゃないけどここは米だけど) を 食いながらこの日記を書いている、という蟻様。明日からまた Grimm 先生の授業があるので (この OS の授業は週に 2日ある)、明日の朝までに 30ページ弱の論文を読まなきゃなんないぞ。 オレは、自分の忙しさを自慢するようなやつは嫌いだ!!

(15:28)
ところ? で? 便所の蛍光灯はいつ切りかわるのかし? ら???   ???

甘いコーヒーをのんだあとに、シブい紅茶が飲みたくなってしまうオレはアホでしょうか。

(18:01)
機械学習の授業があまりにつまらんので、休憩時間にこっそり抜け出してくる。 履修してないと気楽でいいよね。まあ、あとで宿題だけやることにしよう。 内容そのものは悪くないと思うんだが、とりあえず「フランス人は教え方がヘタ」ということを学習した。 なんであんな授業にあれだけの人数が出席しているのだろう? 不思議だ。
(20:13)
頭がおかしくなってきたので、
(23:02)
(00:06)
ろんぶん。
Yusuke Shinyama