2006年 4月 (2)。

Last Modified: Mon May 1 00:36:35 EDT 2006 (05/01, 13:36 JST)

Apr 30 [Sun]


(22:30)
きょうはぜんぜんメールが来なかったが、spam はすんげー来た。最近こんなのばっかり。
$ sel -A
  1:+ (future)  Please               実は浮気希望 >> あともうひとつ、浮気専科というそのままズバリ。 直球で手っ取りはやい.
  2: 21:25   .  Eustolia             Visual identity for your business >> [text/html]
  3: 20:53   .  rikadesu             Re: >> :―― INFORMATION ―――――――――――――――――――――――――: 不正・.
  4: 18:50   .  Monjay Settro        [nylug-talk] [nylug-job] FortressITX s.. >> Posted via http://jobs.nylug.org -----..
  5:     03/31  安藤まどか           もし、会うこと出来るなら >> ホテル代などはすべて私が払いますね。 疑いもあるのかも知.
  6: 16:00   .  mailman-owner@parr.. python.jp mailing list memberships rem.. >> このメールは python.jp のメーリングリス.
  7: 15:02   .  root@tabesugi.net    LogWatch for giko >> ################## LogWatch 2.6 Begin ##################### -..
  8: 14:54   .  Support              追加事項、さきほどの件で。 >> お世話になります。 さきほど書き洩れました3万円ギフト.
  9:     03/31  安藤まどか           今日会えませんか? >> 私、真剣なんです。どうして連絡くれないんですか? 無理なお願い.
 10:  (future)  渡邊裕也             追加のお知らせです >> お世話になります。担当の渡邊です。 さきほど記載もれがありまし.
 11: 13:18   .  rikupo36riri@leo.l.. 私の写真と声をお見せしますね。 >> インターネットをしていたら無料の私書箱があったの..
 12: 13:17   .  George Georgalis     Re: [nycbug-talk] Introducing some ubi.. >> On Wed, Apr 26, 2006 at 07:39:55AM -04..
 13: 12:40   .  Ward Griffiths       Re: [nylug-talk] OT: cat6 costs - gett.. >> On 04/25/2006 12:15 am, Jim McBride wr..
 14: 00:13 Wed  Nye Liu              bug in OpenSSH_4.3p2: pam_open_session.. >> For root sessions pam_open_session is ..
 15:  (future)  Please               無料お試し・恋人も濡れる街角 >> ---------------------------------------- コミュニテ.
 16: 18:53   .  ?????                ??????????????????????... >> Ã?ºº¸ØáԨ?Õè?Ã?ʺ¤ÇÒ.
 17: 09:35   .  Melanie Maynard      seeing somebody ? get supercharged >> [multipart/related] [text/html] [image/jpeg]..
 18: 09:27   .  rereu810pss@venus... いつもいつもお返事遅くてごめんなさい。.. >> 洋子です。 家にパソコンが無いんですよ。.
 19: 08:53   .  NOTEBOOKCHILE.COM    NOTEBOOK -- LIQUIDACION DE BODEGA -- P.. >> [multipart/related] [multipart/alterna..
 20: 08:10   .  info@jidokaisa-two.. 豊満なおっぱい♪を使って気持ちよく… >> □/■/□/ /□/■/  小次郎が厳選した.

青いのが (自動判定された) spam、緑がメーリングリスト (すべて公開のもの)、 白が新山個人宛のものである。赤いのは root 用。 ちなみに、通常の (-A オプションをつけない) 状態では青いメールはもちろん表示されない。 こう考えると新山の「お手製 spamフィルタ」はなかなか優秀だよなあ。

Apr 29 [Sat]


(12:54)
なぜかこの日記に「俺」と書かない。 この 9年間というもの、つねに使ってきたのはカタカナの「オレ」か「新山」だ。 たまにうっかり漢字の「俺」を書いてしまうときもあるが、 どれも微妙に雰囲気 (ふいんき) が違うようの気のする。
$ grep 俺 /memo/*/*.html | wc -l
     77
$ grep オレ /memo/*/*.html | wc -l
   2930
$ grep 新山 /memo/*/*.html | wc -l
   3085
$ grep 僕 /memo/*/*.html | wc -l
     24
$ grep ボク /memo/*/*.html | wc -l
     22
$ grep ふいんき /memo/*/*.html | wc -l
     14
(13:15)
「考える」という言葉の漠然さ (vagueness) について。 日本の教育は自力で考えさせようとしない、などといわれているけれど、 「考える」って言葉は人によって別々のものをさしているので、これがわかりにくい。 思うに、新山は 2つの意味をときに意図的に混同させて使っている。 ひとつは与えられた枠組みの中で最良の結果を得ようと努力することで、 新山が「こいつは先のことナーーンも考えてない」というときの「考える」は これに近い (ちなみに、新山にとって「後先考えない」というのはホメ言葉である)。 けれども、もうひとつ個人的に重要だと思っている「考える」があって、 それは「枠組みそのものを疑う」という作業である。 「なるべく“外”に出ようとする努力」といってもいいかもしんない。 新山にとっては、この意味で他人が本当に物事を「考えている」かどうかは そいつとよほど長く話をしてみなければわからない。が、研究者で 身の回りの人々をみるかぎり、あまりそういう意味で「考えている」人は いないような気がする。セキネさんも Ralph もあんまり考えているとは思えないし、 H嬢にいたっては明らかに考えてない。そもそもこの手の「考える」行為は 直接的な現世利益につながらないことが多いので、どうでもいいのかも。
(15:37)
オレは「社会的地位」に縛られてるのか? そんなバカな。
(02:02)
パーティーによばれて帰ってきたが、パーティーそのものは楽しかったが、 帰りの会話で非常に落ちこんだ。まあ、つまり、ある種の人々の話は あまり真に受けるべきじゃないってことだね。

この手の会話のあとで新山がいつもミジメ〜な気分になるのはなぜかというと… つまり、彼らにとっては他人の言葉は「ホメ言葉」か「けなし言葉」のどちらかでしかないのである。 他人の発言はすべてこのどちらかに分類され、計算される。 新山が本当に言いたかった部分はキレイに無視されて、あとに残るのはただ 「コイツは十分に自分をホメたか、否か?」という評定だけだ。 まあオレも他人のこと言えないかもしれないけど、それでもさあ。

Apr 28 [Fri]


(12:57)
ゲキネボーーーです。そのせいか悪夢をみた。 あまりにも下品なのでここに書けないが、それにしても夢でよかった!
(14:52)
メモリ足りるんんのかな〜〜z
(22:07)
必要なファイルを全部移動させたので、 ついに pear.cs (Dell Dimension T700r) の電源を落とした。 おもえばこいつには本当に長いあいだ働いてもらった。 新山が 5年前ニューヨークにきたとき、こいつはうちにあった唯一のサーバで、 そのころは apple.cs という名前だった。そしてこれはまた セキネさん用のデスクトップマシンでもあった。それから何台もサーバを買い足し、 現役の計算マシンとして使われなくなったあともバックアップ用サーバ兼 yp slave として 2年以上動いた。いまだに起動ディスクは 4G しかない。 これによると 6歳を過ぎていることになるが、まだ動くので、端末マシンとしては使えそうである。 サウンドカードもついてるしよ。たびかさなる瞬電にもめげずここまで動いたってことは、 実はかなりいいマシンなのかもしれない。

それにしても、このごろ日中はけっこう暑くなるのに、 夜になると急に冷えるね。また風邪をひかないように注意せねければ。

(01:06)
「頭がいい」とか「悪い」とかいう形容詞は意味をなさない。 「頭の良さ」は時間によって変わるものであり、 すべてはいかに適した頭の状態のときに適した仕事をするかにかかっているのだ。

Apr 27 [Thu]


(11:28)
さいきん、あんまりラジむか更新されないね。

どうでもいいけど、日本のアネヒャー物件はすべてもう取り壊されることが 決定してるのだろうか。いっこぐらい「アネハの斜塔」として 後世に残しておけばいいのに (少なくとも地震が来るまで)。

(追記: ところで、いま気がついた。地震は「来る」ものか??)

(17:42)
やっぱシュレッダーのほうが焼却炉よりもいいと思うがなあ。証拠隠滅のためには。
(21:53)
Condor の使い方説明を Wiki に書いていたら、2時間以上もかかった。
(22:55)
ブロッコリー万歳。
(01:46)
今日もいろいろ書くことあったハズなんだが…なんだったっけ?

ひとつは、携帯電話を持っていないことがいかに恵まれているか、というようなことである。 新山は携帯電話を主義で使っていないわけではなく、 単純に「必要としない」から使っていないのだが、 これは考えてみればとても恵まれた境遇であると思う。 携帯電話を持つことのメリットとデメリットをあげてみると、

携帯電話を持つことのメリット:

携帯電話を持つことのデメリット:

というように、とにかく厄災ばかりなわけです…。携帯電話って、どう考えても 「自分で自発的に持つ」もんではなく、「持たされる」もんだよな。 どうでもいいが (どうでもよろ?)、 「携帯電話用の電話ボックス」ってのがあったら絶対ウケると思うんだけど (新山には)。

それからあといっこ、きょう昼飯の時になんとなく「はてな」の話になったんだけど、新山の印象では 「はてな」 == 「アンテナ + 日記サイト + delicious のパクリ + Wikipedia のできそこない + その他」のサイトである。 新山は最初からあのサービスを使う気もなかったし、たぶんこれからも使わないだろう。 結局のところ、あそこのサービスは最初からネット中毒な人間にしか必要がない。 ただネット中毒者をもっとネット中毒にするためだけに存在している。 「アンテナ」にしろ RSS にしろ、なんで「あるサイトが更新されたかどうか」を そんなにアホみたいに早く知らにゃならんのだ (そういう必要がある場合ある、 ということは理解できるけども)。普通の人間にはそんなもんは必要ないんである。 まあ、これからネット中毒者はまだ増加するかもしんないから、彼らからボッタくれるようにするのは ビジネスモデルとしていいのかもしんないけど、オレみたいな一般人にはたぶん必要なさそう。

ちなみに今日のトークは昼飯食いに行ってる間に聞きのがした。 まあオゴってもらったからよしとする。

Apr 26 [Wed]


(09:28)
ハラへった。
(13:15)
明日のころきあ予定:
Internet Algorithmics and Approximations

Lisa Fleischer
IBM T.J. Watson Research Center

Thursday, April 27, 2006 2:00 P.M.
Room 109 Warren Weaver Hall
251 Mercer Street
New York, NY 10012-1185 

きょうはシステム組のほうで Nikos が NSDI に出した論文の発表練習をするというので 聞きに行った。NSDI っていうのはシステム屋の学会のなかでは比較的デカいやつである。 が、アドバイザーのぐりむ先生のコメントのキツいことキツいこと。 「なんだその 1枚目〜5枚目のスライドは? そんなんじゃこの先を聞く気にならん!」 といって、サッサと席を立ってしまう。しかし、彼のポイントは圧倒的に正しいのである。 まあ Nikos は学会発表が初めてらしいからしょうがないのかもしれないが、 ダメなプレゼンにきわめてありがちなミスが多かった。 ぐりむ先生は「トークの最初のスライドがダメだと、あとはだいたい全部ダメだ」 と考えているらしく、まあそれもだいたい当たってると思うけど、 最初のスライド数枚が無駄な、どーでもいい事実の羅列で成り立っているのはまずい。 聴衆はいつまでたっても the problem this paper addresses を理解させてもらえないまま、 それらの内容を「記憶」しなければならない。これは苦痛だ。 けっきょくのところ (ケッキョキ、) プレゼンのキモというのは「何を発表するか」ではないのである。 何を発表するかということは論文を見ればすべて書いてある。 問題は「どう発表するか」ということだ。これはつまり物事を説明する順序と、 各項目の強調度にほとんど依存するといってもいい。順序がきわめて大事なんだが、 結局のところそれをわかるようになるためにはダメな発表とイイ発表を 何度も聞いて、耳を肥やさなければいけないんだと思う。まあ、しょせん音楽や小説と同じってこった。 ちなみに新山は映画をまったく見ないので、映画のよしあしというのはたぶん からっきしワカランものと思われる。まあどうでもいいけど (どうでもよr)。

ちなみに彼の研究では「server-side javascript」というなかなかにヘンテコなものを使っている。

(00:59)
オレってさあ、同世代の社会人と比べると「社会人の常識」を 10% ぐらいしか身につけてないよな。 こんなこつでいいんだらふか。

ぬんじゃこりゃあぁぁa

Apr 25 [Tue]


(10:16)
さいきん Wikipedia (英語版・日本語版・中国語版) を徘徊するのが趣味なのだが、 OSたん のページにぶちあたって絶句した。 コイツらは TuxPuffy と同列の扱いなのか? ちなみに「スシフグちゃん」というのは Puffy の目をジャパニメ化したヤツであって、 Puffy 自体をスシフグちゃんと呼ぶのではない。
(16:08)
けふのミーティングは Ralph がカゼを引いていてすげーー声が低かったので笑えた (と、いうか、ニヤニヤを抑えるんに苦労した)。 もしかしてオレが伝染したのだろうか。しかし時期的に考えてそれはないと思う。 たぶん流行っているんだろうな。そのあと例の書類の件について、 3時まえにあわてて OISS に行ったら、学科からもらった書類に不備があると言われる。 オレのせいじゃないのだが、確認に時間がかかるらしい。やだなあ牛 (もう)。 そのあとよーやく昼飯をくう。今日はケバブだよ。
(16:29)
apt-get に easter egg があるという話。
$ apt-get moo

まあオレは apt-get 使ってないんで知らないんだけどね。

(18:16)
それにしても雑用は片付けてもあとから後から出てきやがる。くそっっったりぇ。
(20:49)
帰ってきた。いつもこの時刻はだめだね。津々 (シンシン) ともにグッタリしてることが多い。 心身だって?

明日かうもの: テッシ箱。

(23:36)
セキュリティはフールプルーフでなければならない、と考える。 つまりバカでも安全にできなきゃセキュリティじゃないのだ。 設定ファイルを安全に書くためにマニュアルを読めだと? そんなもんは腐っとる!
(01:32)
もう眠いのだけど書いておく。

新山がやっている研究は情報抽出というのだけど、 これは要するにニュースなどの文章をスキャンして、 重要な事件の「結果」だけを表として抽出するものである。 基本的にこれはいまのところパターンマッチングだが、 検索エンジンに稚拙な文章理解を加えたものといってもいい。

いままでは、これらの検索で対象となる記事は主に企業の人事異動とか、 スポーツの結果とか、わりあい「白黒はっきりつく」ような事象が多かった。 が、いまではもっと曖昧な記事に研究対象が移ってきている。 たとえば殺人なんかがそうだ。検索キーワードとして「殺人」と入力すると、 過去の殺人の加害者と被害者、殺された年月日一覧がズラズラと表になって表示されるようなものを作っている (別にシャレじゃないよ)。そういうのがあると某政府機関などには便利だからね (推測)。 技術的にむずかしいのは、この情報を特定のデータベースなどから取り出してくるのではなくて、 あくまで新聞にかかれた文章から取り出してくるところである。が、技術的な話はどうでもいい。

この殺人事件一覧からは、個々の事件にまつわる文脈はすっぽりと抜け落ちている。 殺人がどういう形で行われ、背景にどういう事情があったのかということは一切表示されず (だってそんなの表示したらジャマだし、結局は個々の記事をいちいち自分で読まなきゃなんなくなるから)、 ただ「こいつがこいつを殺した」という記号化された事実の羅列だけがユーザの頭の中に残る。 ようするに結論だけ知ればオッケーって話になる。これはとても恐しい話ではないのか。 同じことを「盗作」などのもっと微妙なトピックに対して実行することを考えてみればわかる。 キーワードとして「盗作」を入力すると「立松和平」「田口ランディ」「安部なつみ」などと表示されるわけだ。 かれらがどういった形で盗作したかはわからないが、 ユーザは何も考えずにただ「盗作」というレッテルを貼ることができる。 こういう結果を「権威あるもの」として表示することは、道義的にまっとうなことなのか。 以前、米国で自殺幇助をして逮捕された医師がいたが、多くの新聞が彼のことを 「自殺幇助」として報道したのに対し、一部の新聞ははっきり「殺人」として扱っていた。 この医師は殺人をしたことになるのかならないのか。新聞によって多数決をとり、 「10% 殺人した」などと表示することはできるが、 そういった表示にどれほどの意味があるのか。 こういう場合に「余分な (と機械が判断した) 情報を切りすて、わかりやすい結果を表示する」のは かえって罪ではないのか? ある意味、それは価値判断の一部を計算機にまかせていることになる。 それに実際には 10% 殺人したとか、70% 交際しているとかいう数値にはほとんど意味がない。 どのみち二分法が大好きな人間はすべてグレーな部分を善か悪かにきっちり分けてしまいたがるのである。 たとえそれが避けられない人間のサガであるとしても、わざわざ機械がすすんでそれを促進させることはない。

そもそもこういうシステムに「権威」を持たせるのが間違いであって、ユーザは自分でちゃんと 記事の内容をいちいち確認すべきだ、と主張するのは簡単だ。 だが実際にそれをユーザに徹底させるのはほとんど不可能である。 人間は単純でわかりやすいものを求めるので (スポーツ新聞のわかりやすくて単純な見出し文句にまったく影響されない人間はほとんどいない)、 もし自分の求める結果が一覧表形式でズバっと表示されたときに、 その「わかりやすさ」に頼ってしまいたいという衝動を抑えることができるんだろうか? オレには無理そうだ。それにいくら機械から権威を除こうとしても、結局のところヒトは 機械の中に勝手に権威を見出すに違いない。なぜなら多くの人は、本質的に 権威 (たとえそれが機械であっても!) に従いたいという要求をもっているワケだから。 google 検索結果の最初の数項目しか見ない人間に反論の余地はない。

自然言語処理は、もともとあまり考えたがらない人間という生き物を いっそう「考えさせなくする」技術なのではないか? あるいは、コンピュータ全般がそうなのか? 全部が全部そうでもないと思う。 ああムカつく。なぜかっっていうと、もう 2時すぎてるから。ああムカ!

(コンナコツヲカイテイタラマタネムレヌクヌッテシマイマスヨ)

Apr 24 [Mon]


(11:18)
んーー。まだ平熱より 5分ぐらい高い予感。でもマアいいや。
(17:51)
雑用が終わったらまたこんな時間かよ。
(00:22)
それにしても 2.6 カーネルのごたごたはひどいもんだなあ。

Apr 23 [Sun]


(12:37)
カゼ 2日目。

頭痛と鼻水はおさまったが、発熱のためにダルくて身体のふしぶしが痛み出した。 今日も外出は無理かなああ (どのみち今日も雨だし)。 それにしても、人はこうも 1日中寝ていられるものか。

てくるで (ところで)、うぃニーーにバッファオーバーフローが見つかったんだって? あれってソースコードが公開されてんのかどうか知らないけど、公開されてたらもっと 沢山見つかっているような気がする。はっきりいって、ネットワークからの入力を扱うプログラムは C や C++ では書きたくないやな。どうあっても。

(14:23)
http://www.sky.fm/classical/ でときどき流れている HP のインクジェットプリンタの CM がおもしろい。どことなく不条理マンガを思い出させる。

(車の中で)
女「…じゃあ、次のワシントン通りを曲がって」
男「オーケー」
女「で、次に、スwぅー∞ー`ー=ー〜∂う゛ド部ドゥbどぅlるブ※⇒rぉゥブv、へ」
男「…へ?」
女「そこのワシントン通りを曲がるでしょ」
男「うん」
女「で、スwぅー∞ー`ー=ー〜∂う゛ド部ドゥbどぅlるブ※⇒rぉゥブv」
男「…それって、ほんとに道順に書いてあるわけ?」
女「そうよ!」
男「ちょっと見せてよ。…ちがう、これは スwぅー∞ー`ー=ー〜∂う゛ド部ドゥbどぅlるブ※⇒rぉゥブv じゃない、 スぅーw∞ー`ー=ー〜∂うkんにャg^、んにャg^、っっッッgぬガxっk、だよ」

ナレーション「HP のインクジェットプリンタなら、こんなことはもうありません。 印刷されたものは完璧に信頼できます!」

(21:05)
Document IDを挿入する:
(defun id () (interactive)
  (call-process "sh" nil t t "-c" "head /dev/urandom | md5sum | awk '{print$1}'"))

ところで (てくるde)、日本ではあまり見かけない fingerling potato というものを買ってみた。 親指大ぐらいのごく小さなジャガイモである。 まるごとゆでてサラダに入れろと書いてあるのでやってみる。なかなかうまい。

(23:11)
食事中に Web を見ることの功罪。

ひとり暮らしをすると食べ物の食い方がキッタナくなるという話は聞くが、 食事中に web を見るとさらにひどい。なんだか「かっこんでいる」ような食い方になってしまうのである。 これは新山だけかもしれないが、ある日このことに気づいてひどくショックをうけた。

Apr 22 [Sat]


(18:26)
風邪だあ。やられ申した。

ふつう新山は風邪のひき始めには一定した徴候があって、 まず「ノドの奥が痛い」というところから入るのだが、 昨日は喉の痛みはまったくなく、今朝になっていきなり頭に来た。 つまりひどい頭痛である。 しかし昨日の時点で、夜になったら急激に温度が下がって、 正直帰るときは寒いくらいだったのだが、途中クシャミとハナミズがやたらと出たので なんかヘンだな、とは思っていた。そういや H嬢もカゼひいたって言ってたしな。 ヤツが伝染しやがったのか!? あるいは大学にいたときからすでに (窓を開けていたので) 「サムい」と 思っていたのでマズかったのかもしれない。寝るときも、異常にネムくて 頭が多少クラクラしていたので、後知恵で考えるとたしかにおかしかったのだが、 昨夜の時点ではそんなに熱はなかったものと思う。しかし今朝になったら 見事にオカンがきて、いつものとおり目玉の奥が痛む (これまた新山にとっては風邪を識別する重要なファクター) ので、 あーこりゃやられたか、って感じ。体温計を使うのは面倒なので熱は計ってないが、 「熱がある」ということだけわかれば十分だ。自分に熱があるかどうか測定する方法は いろいろあるけど、たいていは自分の手に水道水をあてたときに、 なにか妙な感覚がするのでわかる。

しかしそれにしても、これでまた週末をムダにしてしまった。くそったれ。 だいたいオレは「週末に風邪をひいて、週開けには治っている」というケースが多い。 そのため、むかしからカゼを引いても平日に学校を休んだ経験はほとんどないのである。 小学校のときは 2回くらいあったが、中学・高校ともに皆勤であった。 まあ、ただのアホですね…。

で、今日はほとんどを寝てすごしたが、カゼでも洗濯はしなければならない。 関節痛はそんなにないのだが、とにかく頭がゴンゴンするので、死にそうな顔をして 地下室にあるランドリーへ向か…おうと思ったら、洗剤がねーー! そういえば先週 切らしたんだった。食料は昨日豊富に買ってきたのであるのだが、洗剤は忘れてたので (ついでにキッチンタオルも切らしていた) 買いに行かねばならない。 しょうがないので近所の雑貨屋へ買いに行く。 髪の毛が恐しい方向にハネているが、そんなことを気にしている場合ではない。 そして玄関のドアを開けたら外はドシャ降りで風ビュービュー。 これではどのみち今日は (風邪でなくても) 外出できなかったが、これはとにかく 罰ゲームにちがいない…。帰ってきたら頭はいたむし足はビショビショだし、 もう氏にたい。

(20:22)
ズー (鼻をすする音)。あーぼう (ああもう)、ハダみ゛ヅがデデこま゛っちゃうんだよだあーーぼう。くんぬやろ。
(23:38)
ドストエフスキー「悪霊」をよーやく読み終えた。実際には 1回読んで、 途中で (登場人物が多すぎて) ワケわからなくなり、 もう 1度最初から通して読んで 2度目にしてようやく内容が理解できたのである。 全部で 3ヵ月ぐらいかかってるかな。毎日、電車の中で文庫本を読んでいた。 あーー、つかれた。ドストエフスキーの小説はどれもそうなのだが、 とにかく登場人物の関係を把握すんのがおそろしく大変。 つうわけで、これから読む人のためにおもな登場人物の関係を以下に記しておく。

[以下、ネタばれ注意!]

(これ、tgif でかくのにすげー時間がかかった (ほんとは graphviz を使いたいところ)。 点線は「未発表の章」に出てくる登場人物。 PDF版がほしいかたはこちら)

新山が買ったのは米川訳だったのだが、江川訳だと 「スチェパン氏」は「ステパン氏」、「ヴァルヴァーラ夫人」は「ワルワーラ夫人」になってるようだ。 けど、英語版でもスチェパン氏は Stepan になっているが、ロシヤ語では Степан なんだから「スチェパン」のほうが本来の発音に近いはず。

ちなみに、作中で新山がいちばん好きなキャラクターは 「キチガイ」とされている建築技師キリーロフだ。 彼は「不正確なロシア語を話す」って設定になってるのだが、 この不正確なロシア語が、米川訳ではまるで宮沢賢治の作中人物のような日本語になっているのである。 とくにシャートフがキリーロフの部屋をたずねる場面は何度読んでも泣かせる。 キリーロフには自殺願望があり、彼は夜どおし茶をのみながら 「部屋の中をことこと歩きまわって」いるのだが、 シャートフの奥さんが帰ってきたとき、どうにもならなくなって (キリーロフも貧乏だが、シャートフはさらにひどく、ほとんど「どん底生活」なので) 彼を頼ってきたシャートフに言う台詞がこれ。

「君はスイス事件のあとでも、やはり細君を愛してるようだね。 スイス事件のあとまでとすれば、それは本当にいいことだよ。 茶がいったらまた来たまえ。夜っぴて来たってかまわないよ。 僕はまるで寝ないんだから、サモワールは用意しとくよ。 この 1ルーブリを持って行きたまえ、さあ。もう細君のところへ 行ってやるがいいよ。僕はここにいて、君と細君のことを考えてるから。」

ちなみにシャートフもかなり好きだ。 たぶんマリヤ (シャートフの奥さん) が出産するくだりは一般受けするんではないかと思う。 しかし「悪霊」は、全体としてはかなり後味が悪い話だ。 小林秀雄はスタヴローギンとヒットラーを比較している。

Apr 21 [Fri]


(13:38)
ころきあ。助教授候補。構造があるデータを学習する (ようするに、大域的な制約をどうやって効率的に取り込むか) って話だが、 トークそのものはなかなかよかった。いわく大域的な制約を現在の機械学習の枠組みにとりこむには おもに 3つの方法があるという。 1. local constraint のみを考慮する (ようするに、大域的な制約は入れない)、 2. maximum likelihood を使う (data sparseness 問題に悩まされる)、そして今回の手法である 3. 「大小比較」の概念を使う、というものである。ここを非常に直観的に 説明するのがよかったね。で、この概念は結局のところ margin 最大化問題に帰着できる。 そんで、さらに構造があるデータの場合は、探索空間が離散的であるものが多い (まあ、相手が木とかグラフとかだから)。そうすると大域的な制約というのは 損失関数に離散的に影響するのだが、これの argmin をとる、という探索問題は 「組み合わせ的」になってしまう。これを効率的にやるために、 gradient を使うというのは機械学習では常套手段ですが…。 離散的な関数をまず連続なものに直す (relaxation, これは 0-1 loss や Hamming loss だらば うまくいくといっていたが…それ以外は?)。そうすると argmin は連続な関数になって、 gradient がとれるようになる。こいつをあとは KKT 条件らやらで convex にして… あとはもうおなじみな問題。ただしこれは連続ではあっても微分可能でないので、 linear programming を解かねばならない (関数は convex hull の形をしている)。 しかしこれまた爆発する問題なので、 彼はここで「convex hull をいちど (一次近似によって) 微分可能な関数に 写像して、微分したあともとにもどす」というテクニックを使っていた。 これでとりあえず計算効率はほとんど線型になるそうな。よかったね! 結果はドーでもいいけど、説明がわかりやすかったのでトークとしてはよかった。 彼のような人物は教師に向いているように思える。

しかしセキネさんや Ralph も来ていたが、ようわからんかったと言っていた…。

(16:27)
きょうの午後はもと NYU出身で、 現在 MS Research でサーチエンジンの開発をしている Eugene のトークがあった。 まあ、はっきりいえば結構どうでもよいテーマだったのだが、 「いかに検索エンジンがユーザの行動を追跡するか」ということについて いくつかアホな話を聞いた。ようするに「検索結果のクリックの追跡と そのユーザの過去の検索履歴から、どれだけユーザの行動を予測できるか」というような話である。 それにしても、なんだか MS って意外とオープンなんだな。 こういう結果も学会発表させてくれるみたいだし…。そういえば Yahoo もけっこう発表している。 発表していないのは google だけだ。しかし彼らにしろ google にしろ、 検索結果を評価するために人を大量に雇っていることが知られているが、 この評価と調整は時々しかやらないんかと思ったら、どの会社も毎日やってるんだって。 これを聞いてびっくりした。キチガイ的。 まあそれが仕事なんだろうけど、web で得られる知識なぞタカが知れてることを考えれば、 この競争はキチガイじみてるとしか言いようがない。で、彼は MSN Search のほうがまだ Google より 検索性能が悪いということを認めていたが、おもしろかったのは 「Google も MSN の検索性能をつねにウォッチしている」ということであった。 MSN は毎日改善しているので、検索性能は毎日連続的に向上していくのだが Google は離散的に改善するんだそうな。それで Google の性能が上がるのはいつも MSN の性能が Google に追いつきそうになったときだという。そりゃおっかしいね。 会社どうしでストーキングしあってるワケだ…。あいかわらず新山は 情報検索についてまったく興味を持てないのだけど、たとえ興味があったとしても、 web 検索をどこまでも複雑化させていく方向には疑問を感じるなあ。 結局のところ (ケッキョキ)、彼らは広告が売れるような方法でしかヒトに 情報を検索させたくないのだ。もし完全な共産国家というものがまだ存在していたら (中国や北チョーセンは共産国家でもなんでもなく、ただの専制国家にすぎない)、 その検索エンジンはぜったい広告を表示しないんだろうか?

ところで、1階の教室じゃなカッタ。

(18:20)
よぅーやくクッキーを全部の人に配り終える。来週のミーチィングまで待ってられないので。
(00:11)
100年後の機械翻訳システムよりも、オレのほうがマシな翻訳ができると思う。 というか、100年後の人間でもマシな翻訳ができない人間はいっぱいいると思うので。

Apr 20 [Thu]


(08:25)
けさシャワーをあびているときに抜けた髪の毛を見てみたらビックリ! あまりにも太すぎる。 これはほんとうに人間の髪の毛か? 「黒い光ファイバーです」っていってもバレないんじゃないか? というくらいの太さと弾力性なのである。 こんなもんが生えてきたとき、オレは痛くなかったのかなあ。

さいきん、ほとんど日記を書いていないが、それは忙しいわけではなく、                                                                                     。

かといって、べつに落ちこんでいるというわけでもなく (いや、ある意味では、 新山はつねに落ちこんでいるのだが)、                                                                                   。

あなたは負け犬だ!!

(14:26)
ころきあ。クラスタリングの話だったが、 さいしょゲノムにまつわるつい最近の論争 (3月ごろにあったらしい、 新しく発見された exon が 5000種類もあったという主張) の話から始まったので、 さっぱりついていけず、オイオイ、こりゃ来るトコ間違えたかな? と思ったら、それはただの余談であり、クラスタリングの話にもどった。 まだ機械学習の話のほうが bioinfomatics (いまだにマトモな日本語訳ないらしい) の 話よりわかる (although I hate it). とにかく、トップダウンなクラスタリングと ボトムアップなクラスタリングを組み合わせるって方法なのだが、 ようするに K-means を改造してトップダウンな制約とボトムアップな制約を 両方つけられるようにしたものらしい。基本的にはクラスタの centroid を 特定の事例 (exempler) として表現し、各事例はオブジェクトとしてお互いに 制約メッセージを送り合うことによって、「自分が exempler である確率」を調整していく。 これで最終的にうまい具合に収束すればクラスタリング完了というわけだが、 このアルゴリズムは収束が保証されているわけではないという。大域的な制約は 各オブジェクト (=事例) のメッセージを監視する制約を入れてやることで実現する。 でも基本的にはこれは K-means の改良版ってところで、ようするに最初から ある程度クラスタの数がわかってないとダメなんじゃん。それに O(n^2) の時間は どうしてもかかるらっし (彼はこれが K-means よりも速いといっていたけど、なんでかな?)。 この研究ではすでに O(n^2) の行列ができた「あと」の問題を扱っているんであって、 新山の場合はそれ以前の段階で (要素数が多すぎて) つっかかってるのだから、 基本的にはオレのいまの問題を解くのにはあまり使えないな。 まあ、それができたあとで性能を上げるのには使えそうだけど、 オレはクラスタリングの性能を上げることにはさして興味がない。 新山の研究は現時点ではまだ「そもそも本当に可能かどうか」を問うている段階なので。 へれんのようにすでに出来上がった評価基準で完成したデータセットで 実験をしている人々からみると、新山のようなアプローチは度胸がある (というか、むしろ無謀) ってことになるらしいが、そう考えるとほとんどの研究者は腑抜けばっかってことになるけど。

そのあと WWH 1階で学生ミーティング。予算の話やら、TA が教えるチャンスがないという話やら、 everybody@メーリングリスト (このリストは CIMS の数学屋と情報屋のすべての人間に送られる) に 「ファックス壊れた」とかいうメール送るな! という話やら (しかし彼はこのリストの読者がいまや CS も含むようになったことに気づいてない)、 どうでもいいことばかり。まったくさあ、どこでもそうなのかもしれないが、 学生があまり元気がない。日本の博士学生よりははるかにましなのだが、 それでもあんまり自発性がみられないよね。かと思うとストライキ組の Jeremy とかは そういうこととは別の意味で自発性がありすぎて、 学科のポリシーにひとこと言いたくてたまんないらしいし。 アンバラ。

(15:07)
ぬんだか (= なんだか) 左目の下の筋肉がピクピクするのですが、 ぬにか (= なにか) これ問題でもありま賞か?? 今日は日記をたくさんかくぞ。 たとえアホらしき言明ばかりが並んでいるとしてもだな、 なぜならヒマだからだ! (ウソに決まってましょうとも)。

google://どっこり/

(16:28)
冷房が…
サムいのです…・・・よ・・・・ ・ ・   ・
(18:01)
なんか今年の夏も旅行に行けなソーな雰囲気。なんで?

あれ以外にどういう言い方があるっていうんだよ? …わかった! わかった! 落ちこんでいる暇はない!!

(19:41)
なーんか、summer of code の mentor をやるハメになりそうな気配が…。 オレ、まだ学生なのに…学生が学生の面倒を見るなんて…。 あ、そういうことは結構あるか。しかし Lisp だよ! どーする?? いちおう Kenny がついてくれるらしいけど、完成しなかったらどうすんだ。とっても心配。 おまけにべつの仕事もあるのだが、それというのが実は…。 なんだかとっても奇怪な状況になっていくような予感と防寒。

あすの予定:
11:15 − 13階
14:15 − 1階の教室のどっちか (どうせ部屋番号を覚えていてもどっちがどっちのドアだか覚えてないので、 両方開けてみればわかるという作戦)

Apr 19 [Wed]


(20:02)
1T の容量が 320ドルで手に入る時代って。(FedEx Free Shipping 込)

どうでもいいけdo (どうでもよろ)、 誰も見てないので告白しておきますが、 ラウンジの時計ぶっこわしたのボクです。ごめん。新しいの買うよ。

Apr 18 [Tue]


(23:30)
90ms-RKSJ-H

PDF のなにが害悪って、C や C++ などでは (バッファオーバーフローが) 怖くてパーザが書けないことだよ。 いままでの xpdf のセキュリティーホールを見ればわかる。 まあ、オレは Python で書いているから関係ないケド。

(02:09)
要素技術ばかりやってる人々はいつみても卑屈っぽく、
全体像ばかり話している人々はいつみても宗教っぽい。

時にはこの逆も成り立つ。

Apr 17 [Mon]


(08:48)
かうものりすと追加:
味噌 (きれた)
インスタ食品
(10:13)
./configure は「こんふぃギャーーーッ!!」と呼ぶべきだね。
(21:42)
きょうは「かいものりすと」を一個も更新できなかった。 落ちこんでいたために、忘れていたのである。なんてこと。

で、んぜ (typo … なぜ) 落ちこんでいたかというと、 たいしたことではない。いろいろメンドーな手続きで翻弄されて 「結局ダメ」だった、ということである。ついでにそのあと へれんと話していたら「中国人友達の恋愛どろどろ話」を聞かされ、余計にぐったりした。 仲のいい女友達の相手の男がサイテーな野郎で…という話なのだけど、 はっきりいって新山はそういう話を基本的に「バカ話」としか思わないので、 「がーーははは、バッカだなーー」という反応を返したい…のだが、 相手がムカついているとそうもいかぬので。 しかしバカな話はどうやってもバカな話であり、それ以上のもんにはならない。 そもそも (もそもそ) 新山はこの手の話題を自分から口にすることはまずないので、 そういうことを他人に話したがる人間というのが理解できないあるね。

(00:41)
弱小チームにもかかわらず、今年も参加ですかい。 ナゾだ…

それにしても、別の話だが、「ホントかよ〜〜」と思わせる脱力な内容のメールがきた。 これがホントだとしたら、自分はつねづね思慮に欠ける人間と思っていたが、 もしかしてオレは「悩みすぎるアホ」だったのか?? 逆の意味でショックじゃ。

Apr 17 [Mon]


(00:36)
はあ〜〜〜。ssh マニュアル翻訳がやっと終わった。自堕落な一日だった。 いつも思うのだが、どうせ自分が翻訳に時間をかけたって、 誰の役にも立たんのじゃないか、という疑念にかられる。 みんな英語読むんだろうしさ。 おまけに roff をいじるのは不毛だし、 そもそもマニュアルの原文自体がわかりにくい。 ぶつぶつ。

しかし、こんなふうに損得を考えて行動していたのでは真のデンピーな人間にはなれんぞ。 精進あるのみ。

(01:29)
日本語について。 「英語を話せると10億人と話せる」と本気で思っているバカは別として、 たいていの場合、英語の知識は日本語を外から見直すのに役立つ。 日本語以外の言語について知れば知るほど、考えるのは日本語のことになる。 日本以外の土地について知れば知るほど、考えるのは日本のことになる。 つまり道から外れれば外れるほど、道に近づく。

かうものりすと:

(01:53)
思想をもたない研究者って存在してる意味あんの? 彼らがどういう世の中を望んでいるのか、ちっともわからない。 オレのようなブンレツ者でさえ傾向はあるのに。

Document ID: 6c3a083b3adf90251a9a0d0de46a47ce

Yusuke Shinyama