2004年 4月 (2)。

Last Modified: Thu Apr 22 11:05:54 EDT 2004 (04/23, 00:05 JST)

Apr 22 [Thu]


(11:05)
なんでこんな?

Apr 21 [Wed]


(09:19)
おきただよ。よくわからんが

寝不足でフラーレンな日々だが、かまわず大学に行こう。

(12:19)
なんだよ「ルーマニア 」って…。
(17:37)
きょうの SGS のセミナーはヘブライ大学からのお客さんで、 おもに暗号について。SFE (Secure Function Evaluation) がテーマであった。 これは以下のような問題である:

結論からいうと、これは手品のような方法によって可能なのだが、その仕組みはなんだかややこしい。 みんな何度も質問して、ようやくわかったという感じだった。 基本的なアイデアは、暗号界では有名な Oblivious Transfer (なんて訳すの?) をもとにしている。

  1. まず、計算の前に関数 f を論理回路で表現する。 簡単のため、ここでは Alice と Bob の知っている秘密の値はどちらも 1 ビットであると仮定する。 この論理回路はいくつかの論理ゲートをワイヤー (べつに実際の線である必要はない) でつないだものである。
  2. この回路の各論理ゲート G について:
    1. Alice は、もともとのゲート GA を Bob の公開鍵でスクランブルしたもの (Garbled Circuit) GB を Bob に送る。これはもともとの真理値表の 0 と 1 が まぜこぜにされており、Alice はこれを使って計算することはできるが、 その出力値が何を意味しているのかはわからない。
    2. Alice は GA の入力がとりうる値をすべて列挙し、各々の場合の出力結果を Bob に送る。
    3. Bob は GB の入力がとりうる値をすべて列挙し、各々の場合の出力結果を Alice に送る。
    4. ここで Oblivious Transfer が登場する。Alice と Bob は、 それぞれ秘密の入力値 (0 か 1) を知っているので、その値を 最初の論理ゲートに入力して計算することができる。ところが、彼らは 自分が論理ゲートに 0 と 1 のどっちの値を入れたかは教えない。 どちらの場合の結果も要求するのである。
  3. 各論理ゲート (これは sequential に接続されている、フィードバックループはなし) の結果を じゅんじゅんに交換していくことによって、最終的に 2人は同じ結果を得る。

これでいいんかいな。なんかちがうような気がするぞ。 とにかく、ループの上限が定められているプログラム (ようするに原始再帰関数ということになるのだろう) は 基本的にみんなフィードバックなしの論理ゲートに変換できるので、ある程度一般的な計算を この枠組みで実現できるということだった。かれらは実際にこれを Java を使って実現している。 まず SHDL という言語でプログラムを書いて、それを仮想論理ゲートに変換してネットワーク経由で送るのだ。 しかしこれは毎回暗号化が入るので多大なネットワーク帯域と計算力を必要とする。 なんだか実験がよくわからなった。これは理論的な研究なのではないの? …と思ったら、 彼らは実装も大事なようで、わざわざよくわかんない文脈認識機能つきエディタや、 イスラエル-米国間の WAN を使って実験している。ぐりむ先生もそこにいたのだが、彼いわく 「Java のシリアライザは the worst of the worst !」ということで、 かんじんの評価のところでズッコケた発表だった。概念自体はおもしろかったので、まあいいけど。 たまーに暗号っぽい話を聞くとなんか頭の中の使ってない部分がギコギコと動くようだ…。

それにしても、今日のもうひとつの学習は、 ヘブライ語圏のひとびとはみんなああいう英語の喋り方をするのだとわかったことである。 Zvika もそうだし、AdaBoost のおじさん (名前失念、Yoav なんとか氏) もそうだった。 そもそもイスラエルって先進国だかそうでないんだかよくわかんない国だよな…。 ヘブライ大や Technion にはかなり有名な研究者がいるらしいけれど、 日々報道されるあの治安のアレぶりを見ると欧米なみの国だとはとても思えない。 それとも、あれはごく一部がやたらと強調されているのだろうか??

(19:21)
右でも左でもセンターでもなく、むしろ、ジグザグ。

という印象。

ところでジグザグとギザギザって振幅の違いだけの話じゃないよね。

てくるで「右も左も」ってはいうけど「左も右も」とはあまりいわないよね、あんまり。あんまり田。

(20:45)
久しぶりに chasen のページを見たら、変態的な色使いになっていてショックだった。 ピンク地にピンクの文字。趣味悪いよ。どーでもいいkedone…。

ところで、きょう sunrise mart でステキな商品をみつけた。 「ミルメーク」である。いやはや、日本のスーパーでもほとんど見たことないのに (というか、そもそも探す気がなかっただけだが)、こんなところでお目にかかるとは! で、思ったのだが、いまの小学生はちゃんとミルメークをありがたがるようにしつけられているのだろうか。 新山が小学生のころ、なぜか給食のときに人気があったのはミルメークと「いかリング」で (オレはあまり好きじゃなかった、なぜなら、ときどき骨が入っているから)、 何か貸し借りのようなことがあると「おまえ、つぎの給食んときに、いかリング一個な」というぐあいで 貨幣の代はりとして使われたのだが、現在でもそういうことはあるのだろうか。

どうでもいいけど「かわる」って字はむずかしいね:

そうか、「換」の字は「換わる」と送ることはできないのか。 しかし代と替は文字通り (なにが文字通りなんだ?) 可換であるような気もする。 でも「日替り定食」とか「振り替え休日」とかは必ずいつも定型で「替」の字だし、 わけがわからない。
(22:16)
必死になるならもうちょい別の対象があるでしょう。
(23:11)
げっっ。Google の日本語デフォルトエンコーディングが shift_jis から utf-8 になった。 これは今日変わったはずだ。なぜならきのうまで google://ほげほげ/ のリンクがうまく動いていたからである。いまではこれはもう動かない。 書きかえねば。めんどくさいなちくしょう

末尾に '&ie=shift_jis' を加えれば動くようだ: google://ほげほげ/

google://ほらね/

ちなみに「出雲 礼緒奈」というのは新山の IP (68.37.211.*) から書きこんだときのものである。 localhost (127.0.0.1) から書きこむと「デイビス富雄さん」という非常に アヤシゲな名前になてしまふのだが、しかしこのあやしさがなかなかいい味だしてるのでほうっておこう…。

Apr 20 [Tue]


(05:36)
あつくて目がさめてしまった。そして窓を開けるとすずしい。

うん。そゆこと。うん。

(09:34)
黙って食え、というポリシー。

さいきん、この文章群の意味不明度がさがりつつあるので、 これは非常にのぞましくないことだ。気をつけねばねれねい。

ひゃっほう!

(10:39)
つまり世の中は、寒いとか、痛いとか、ハラへったと
か。

そういうものがない状態。

(11:28)
マンハッタンの木々がいっせいに芽吹きだした。 9st. の駅をおりるとまず目につくのは Callery Pear (日本語名不明) だが、これはもう やや葉桜状態になりつつある。9st. をずっと歩いていくと、つぎに お目にかかるのが Littleleaf Linden。これも日本語で何ていうのかわかんない。 あと Maidenhair Tree というのは何かなと思ったら、これはイチョウのことなのだった。

ドーでもいいがね…

胸ポケットに櫛を入れたままで大学に来てしまった。 いつもここになんでも入れておくくせがあってこまる、オレは。

(11:47)
セキネさんの parser の出力を眺めていたら、ハゲしく自分で parser を書きたくなった。 思うに、英語では誰も coordination をまともに処理しようとしないのか? なぜ「英語版 KNP」とでもいうものがないのだろう。 新聞はとくに coordination 多いような気がるす

また始まった! 「もう誰も信じない」症候群!

(12:13)

parser にはべつに文全体を無理して解析してもらう必要はなく、 自信のある箇所だけを示してもらってもいいわけだ。 各部分における確信度を表示してもらえると助かる。

(12:44)
実例をあれこれ見ていると、言語には規則があるなんてウソだろう! と言いたくなってくる。

腹へった、ちくしょう

(18:58)
もうこんな時間!

昼飯 (きょうはまた dosa だった、あのおじさんが愛想よくてなんかいいんだ) をくったあと、 ミーティングと授業とトークが続いて何もやる暇なし。 awk の W を見てきたが、A や K にくらべて一番活発なかんじのおじさんだった。 彼は最初数学者だったのだが、それからベル研にいって、管理職になったので嫌になって G へ行ったんだそうな。それで今は G でコードを書いているが管理職っぽい仕事を しなくていいのでシアワセだ、といってた。トークはまたもほとんどおなじ内容。 G 社の人がしゃべるのはこれで 3回聞いたが、3回ともほとんどおなじことしかいってない。 技術的なことはほとんどなにもなし。GAPI の話も SOAP ですよ、ってことと、あとは スライド 2〜3枚だけ。GFS とロードバランスについてやや説明があったが、 社員の多くがネットワーク屋であるということだった。まあ、そうだろうな。 しかし聞くたびに思うのだが、あそこってなんかいい加減な会社だよなあ、と思う :

かんじんの web サーチの話は、検索エンジンマニアの方々のほうが詳しいと思うのでここには書かないでおく。

思うに、彼らの唯一革命的な発明とゆーのは PageRank なんかじゃなくて 「信じられないくらい安いハードを、信じられないくらい大量に買って使う」ということだろう。 そもそもあすこのハードって台湾かどっかから仕入れてきたバッタもんばっかりで、 チップの上には文字さえ書いてないらしい。にもかかわらず人々は G 社のテクノロジーが 最先端だと信じるのだるから、ブランドって怖いね。

砂糖水をのみすぎた。

(20:17)
しっかし… ssh で AFS 使ってる人ってどれくらいいるんだろうね??

またもや論文。長い。

(03:16)
口上・Chasen の地名辞書がムダに大きいことについて:

Chasen の地名辞書は異様にでかい。67000語も入っている (おそらくアサハラさんが一生懸命集めたのだろう)。にもかかわらず、 ムカつくことに、ほとんどの地名はたいていの人が知りもしないのだ。 これは絶大なるもったいなさである。この資源を有効活用しない奴はバチにあてられるべきである。

というわけで、chasen のムダにでかい地名辞書をたっぷり堪能してもらうために 日本全国地名しりとり なるものを作ってみました。以上。

Apr 19 [Mon]


(10:53)
なんか Penn Station で Amtrak と LIRR の列車が衝突したんだって? 死者はなさそう。 領事館のメールマガジンがはじめてマトモな内容を配信しやがったぜ!

まあ、死者がなければ日本ではニウスになんないと思うので、 親への連絡はとくにしないことにする。

(19:04)
あー暑い。けふはなんでこんなに暑いのか?

Ben から faculty candidate とのミーティングがきょうあったことを聞いた… ダメじゃん! おいおい、オレにはなんの連絡もなかったぞ? と思ったら、 ちゃんと 15日に Cole からメイルを受け取っていたことが判明。 埋もれてました…。

どうもさあ、もうあんまりいっぱいメール受けとりたくないよ、見落すから。 オレはなんしろ天下の「がさつ君」なので…。あぁ

(19:35)
ひさびすりにひどいワンライナーを書いたのでここに記しておく。 これだけ長いと編集がひと苦労でさ。
$ perl -e '$/="\n\n";print"\\documentclass{article}\n\\setlength{\\oddsidemargin
}{-18pt}\\setlength{\\textwidth}{510pt}\n\\begin{document} \\small\n";for($i=0;$
i<100;$i++){$_=<>;@a=split(/\n/,$_);print"$i . \\begin{tabular}{|p{6.2in}|}\\h
line\n";foreach$_(@a[0..@a-1]){if(/^\#/){next;};s/\$/\\\$/g;if(!/^DOC:/){print"{
\\tt $_}";}else{print$_;}print"\\\\ \\hline\n";}print"\\end{tabular}\\vspace{4pt
}\n\n";}print"\\end{document}\n"' t > t100.tex && latex t100.tex && xdvi t100

ああそう
よーかーったーネ〜〜〜〜ーー!!

(21:32)
また、アホな自由研究をしてしまった…。 「日本語フォントのビットマップを用いて、文字の複雑さを定量的に測定できないか?」と考えたのである。 30分で結果が出たが、いまは書く気がない。帰ってから書こう。
(23:43)
あち〜〜〜〜〜〜〜〜〜〜〜〜〜

もーなんなんだろねこの暑さは?? 夜12時の時点で 25℃ ある。 これじゃ寝れねえ! いきなり熱帯夜だ。きのうの夜もかなり暑かったけど、 今日は大学を出たらムワーっとして、「うわ、ジャケット持ってるオレはバカか?」と思った。 どうでもいいが今日はずっと朝からマトモなもん食ってなくて今とても ハラがへっているのである。

どうでもいいけど外国暮らしする日本人男はなぜヒゲをのばす傾向がアルのか。 そこに隠されたスタイル TV 的な根底思想とは。こちらの西洋人には 「スレテオタイプ知識人の風貌としてのヒゲ」というのはよく見かけるが (たとえば Ralph なんかサマになってる、「すてきなおじさま」風)、 日本人でヒゲのばしてるやつに賢そうなやつわいない。 オレは絶対そんなことしないからな!

しかし CS 界で一番ヒゲが似合ってるのは McCarthy だと思う。 ああそうか、髪もヒゲも白くなんないと似合わないのか??

(00:41)
♪おまえはすきにしなー 今すぐ俺を捨てろよ ヘーイ 今だぁ♪

この歌なんだっけ?

(01:01)
ところで今日 地下鉄の中でハーモニカを吹いてるおやじがいた。 さいしょ、9st. に乗ったときからハーモニカの音が聞こえてたので 「どこにいるのかな」と思って必死にそこらをキョロキョロしていたのだが、そのおじさんは 座席とドアの間の地ベタに腰をおろしていたのでこちらからは見えなかったのだ。 で、まもなく車内がすいてきたら座席にすわって吹きはじめたので、 しっかりと観察することができた。ハモニカ自体はおやじの手の中にすっぽり収まるくらいで、 すごく小さい。10センチくらいしかない。にもかかわらず、じつによく響くいい音がでる。 ちゃんとあのカントリー風の「ばぉぼぉべぉばゎぁあ〜ん、ぼゎゎゎゎ…♪」という音もでる。 どうやんのか知らないが、かなりウマいように見えた。新山は、ハーモニカのあの「小ささ」が カッコイイと思う。どこにでも持っていけるというのは、それだけ音楽好きに向いているようにも思える。 ギターじゃああいうふうにはいかない (ときどきギターを旅行に持ってく奴がいるが、 まあ、いろいろ例外はあるとしても、基本的にはアホだ)。いいなあ。

そしてもうひとついいと思ったのは、彼の楽器の吹き方がわりとしっかりしてて、 自信にあふれていることであった。つまりあんまり細かいところでトライしない。 これは何についてもいえるよね。前にも地下鉄の車内で、黒人でイラストを 描いてるおやじをみかけたのだが、揺れる車内で画用紙をもって少しずつ角度を 変えながらしずかに描いているのだが、なんというか、手つきに迷いがないっつうか、 描く線の一本一本にえらく自信があるようなのである。あれでちゃんとした絵ができるってのは、 かなり熟練じゃないとだめだろうな。絵や音楽の細かい機微についてはわからなくても、 ああやって実際に作っているところを見ると、「それが上手い」ということだけはわかる。 そういうこと。

…同じことをプログラミングにもあてはめるとどうなのか。おそらく熟練した プログラマーというのは、あれこれ悩んだりしないのだろうと思う。 作っては消し作っては消し、ということもせずに、大幅な改造するときでもドバっと改造し、 変数名は一発で決め、あとでちまちましたリファクタリングなんかしない、というところだろうな。 もちろんそんな人が沢山いるわけはないけれど。

(01:42)
そういえばハンガリーでおもに開発されている mplayer というソフトは、 ちょうど日本における Ruby のような存在であることが発覚した。 www.mplayerhq.hu を見ると、 「ハンガリー国内での人気調査: MPlayer … 96%、 Xine … 2%」となってて笑える。 いっぽう Xine とゆーのはもうひとつのメディアプレーヤ風ソフトで 開発はおもにドイツだ。そして普通はこっちのほうがメジャーである (新山が使ってるのもこっち)。いや、なにごとも必死な国々には必死な人々というものがいるのだなあ。

あれについては、あした書こう。すこし追加実験もしたいしね。

Apr 18 [Sun]


(11:37)
# unify this!
じゃねえよ! (自分で書いたコメントに文句)
(13:32)
ぼくが描いたのはぼうしではありませんでした ―

それは象をこなしているウワバミの絵でした。

(15:08)
that's patently absurd.
(16:49)
まともな メイラ がほしい。いま使ってるのは Mutt なのだけど、 あきらかに機能が多すぎる。ほんとは /bin/mail を使いたいけど、 それはそれで不便というか、日本語通らないし。というか、 コマンドラインベースなのがいいんですわ。それで、ついでに Gmail の「メールは消さない」というアイデアもいいかもな。 よくメイラの機能にある「フォルダに分類する」というのは、あまりいい方法と思えない。 というのは、ときどき 1つのメールは複数のフォルダに分類したいときがあるからだ。 だとすると、フォルダ分類よりもむしろ各メールに属性フラグをつけておいて、 「この属性 (たとえば NYLUG-talk の通信) をもつメールをどうにかしろ」 というのがいいかもな。たとえば
$ mshow -sortbydate -thread date:-10 in:csphd subject:meeting
  (csphd 属性をもつメールで最近きたやつで subject に "meeting" を含んでいるメールをスレッド表示)
1 from: ...
2 from: ...
...
$ mshow +12         (12番のメッセージを表示)
$ mnext             (その次のメッセージを表示)
$ mreply cc:sekine  (そのメッセージに返事、ただし cc: にセキネさんを入れる)
などというふうにやるのである。各コマンドは「直前の」コマンドの結果のみを記憶しており、 いちおう文脈を意識した操作が可能である。で、まったく同じものを cgi にして web からアクセスできるようにしたらどうか? よく思うのだが、あの web メイラのインターフェイスというのが いちいち何か操作するたびに reload したりして、うざくてしょうがない。 web でもコマンドを入力させろよ! そのほうがずっと早いし実装も簡単だ。 とくに address book を設定したりするのなんか、GUI でやるのはアホだと思う。

メーラを書くときの問題は、メッセージが数千通になったときにいかにスケールするかだ。 新山はメールのヘッダを直接見たりファイルからじかに MIME subpart をとりだしたりするので、 1メッセージは 1ファイルにしておきたい。しかし、何千ものファイルを扱ったらぜったい遅くてかなわんので、 どうせすごく古いメールはめったに検索しないんだから、1ヵ月以上前のメールは cdb にしておくってのはどうだろう。 うん、そりゃ便利そうだな。ちょっと作ってみっか。懸案事項は、Python の email パッケージが どれくらい速いかだ…

(17:44)
さいきん読んだ文章の中で、 日本語の文法で考えると次のような表現はなかなか思いつかないとおもったもの:

ああ、「おもった」をひらがなにしてしまった。気持ち悪い。でもこれには理由がある。 「思いつかないと思った」と書くと、「思」という漢字が 2つ続いてしまうためにオカシイなことになるだ。 メタとそうでないものを区別するために、ときどきひらがなと漢字を使いわけたくなる。 しかしこの場合、漢字を使うのは前がいいのか、後がいいのかという問題があるが、 「なかなかおもいつかないと思った」だと連続するひらがな列が長すぎるので パターン認識に異常をきたす。文章というのはこのように絶妙な漢字とひらがなの 出現スペクトルによって成り立っているもので…。

電波。

(18:18)
そろそろほげほげしてきました

とりあえず email.Parser で 2000個のメッセージ (一部 Multipart 入り) の ヘッダと MIME を parse するのにかかった時間: 5病。

そんなに激遅くもないね。使えるかもね。

(19:05)
某 ML で、「KDE + Mozilla + OpenOffice を走らせていて激遅いんだけど」といってる人が dmesg をさらしたらメモリが 256MB しかないことが判明して、みんなから 「お前それじゃ少なすぎだよ、メモリ買え!」と言われている。その本人いわく "I never thought the day would come so soon where I'd be told that 256MB wasn't enough memory. Sigh."

オレもかつては自分の頭で覚えきれるぐらいのメモリをもったコンピュータしか 信用しないことにしていたのに…。いまじゃ何が走っているかさえ時々明らかではない。 この気持ち悪さというものを人々はどれくらい知るだろうか…。

(21:21)
そのわりにはマトモな時間に帰ってきたり
した。

なぜ「した」を強調するかといふと、 新山はどういうわけか「〜みたり。」「〜したり。」という連用形で文を終わらせるのが大嫌いだからである。 「〜と思われ。」もかなり嫌いだ。なぜかは知らないが、非常に「けがれた」感じがする。 現実に誰かがこうしゃべってるのを聴いたら、きっと苦虫をかみつぶしたような顔をするだろう。 まあ、電車の中でどっかの酔っぱらいが車内にゲロを吐いているのを見たときのような気分といえばいいだろうか…。

しかし、なにがそんなに嫌いなのか、うまく説明できない。 おそらく断定しないのがいやなのだと思うが、…ああそうだ。 これらの表現にはどれも、なんとなく「自分を咎めないで」という免責事項的な 雰囲気が盛り込まれているような気がする。 つまりこれが新山にとっての「さ」に相当するのだ!! か? だ。間違いない。である。のよ。

おとといの写真をようやくとりこんだ。

Apr 17 [Sat]


(09:59)
そろそろ起きてきた。

けさは家の前でドルリ工事をやっており、うるさい。

(11:53)
http://labs.google.com/papers.html

あと、hotmail には 6000万人のユーザがいるそうです。もっと多かったか。

4月ももう気づかないうちに中盤になってしまーた。

(12:14)
さいきん、うっかりしたことで、また日本人のかく日記 (あるいはブログロ) を読んでしまったのだが、 そのとき何がこんなにウンザリするのかわかったような気がする。

それは「知識人コンプレックス」とでもいうようなものだ。 あるいは欧米コンプレックスでもいいけどさ。 どうもねー、日本人のかくブログロはかならずそういう傾向なんですよ、ほとんどどれも (目立つやつは)。 一体なんでだろう? その強調のされぐあいはアメ人のそれよりはるかにひどい。 これがブログロがブログロたる、そのうさん臭さの原因だろうな。 日本はたしかにそういうコンプレックスが生まれやすい社会だと思うので、 それがブログロにも表れるのはちっとも不思議でない。 つうかそもそもコンプレックスを持つのを美徳とすら思ってんじゃないか、と。 幸か不幸か、新山は知識人コンプレックスはだいぶ前に失われていた (大学に入ってうだうだやってるとまあだいたいそうなるね、教授とか天然ボケだと)。 ついでに、NY に来て欧米コンプレックスもなくなり、むしろ国粋主義的にすらなってしまった (うそ、これはいいすぎだ、だいたい国粋主義というのはそれ自体がコンプレックスの塊である)。 だいたいアメリカ人も文化的にはかなり欧米 (というよりむしろ欧州) コンプレックスだしさ…。 といってコンプレックスがなくなったからといって問題がなくなったわけではまったくなく、 ムカつくことはまだ沢山あるが、それでも純粋に技術的なことやセンスの問題だけで ムカつくことができるようになったのはいいことかもしれない。

しかしある意味こりゃ最悪でもあるな。

なぜなら、コンプレックスというのはだいたいの日本人に理解してもらえるのだが、 技術的なムカつきはそのセンスを共有する人にしかわかってもらえないからだ。 そういうのは「ただのヒステリー + 電波な奴」と見られてしまう。 たとえばブログロを見ても、コンプレックス丸出しを売り物にしてる人はウケがいいみたい。 Ruby が日本で流行るのもおそらくはこういう理由からだと思われる (この言語を毎度ネタに使って悪いけど)。 よくいわれる他人への迎合傾向も、そういうことが原因なんかもしれない。 いっぽう、新山みたいに「マイナー道でいいが、とにかく妥協せずにやるのだ」というあまのじゃく精神に満ちているやつは、 まったく理解されない (たとえば Ruby の変態文法が嫌だとか)。おそらく彼らはいうであろう。 「新山はわかってねえよ、Ruby で大切なのはコンプレックスに共感することであって、 機能とかセンスじゃねえんだよ!」と。まあそうですが。一億総コンプレックス社会。いいけどね。 それでもオレは日本好きですもん。

こういうことを書くとまたどっかの頭のいい人がリンクしてくれるのでしょうか。
(追記: 最初「どっかのアホがリンクするんかいな?」と書いていたのだが、 その方 (誰かは知らない) がアホとは限らないし、しかもおまけに ありがたくもリンクしてくださるのだから、敬語で書いておいたほうがいいような気がした)

(13:18)
そんなことより、てくるで最近オレの中で流行っているコンプレックス (なんじゃそりゃ) は 「妻子持ちコンプレックス」だる。 だってさあ、こっちの学生はほとんど妻子持ちなんだもん。 とくに新山の周囲では既婚の学生や研究者が多い。 学生ミーティングなどに子供をつれてきて、そいつが

「あっぶぁ〜〜〜〜」
「キぃ〜〜〜っっ、ひゃ!」

とか騒いでたりする (で、学科長が「あら、すごく若い学生さんね?」といったりする) と、すげーうらやましい

はっきりいって結婚に対するイメージはこちらにきてだいぶ変わった。 こっちでは妻子持ちでもものすごいアホなことやってるおじさん・おばさんがいて感心する。 やっぱ、ああいうのには憧れるよな…。人間、結婚してからもアホでいつづけるのが大事だと感じた。 それがカッコよさというもんだ。ろ。 つまり結婚は人生の墓場でも出発点でもなく、ただの通過点なのである。 しかし日本ではそう考えるのはむずかしかろうな、それもわかるけど。

ナンでもかんでもわかったふりをしていてはいかぬ!

(14:09)
せんたくしなきゃ。
(15:08)
successfully sentacced.
(18:16)
新山のきょう一日の行動:
  1. ほげーーー
  2. ほげーーー
  3. ほげーーー
  4. ほげーーー
  5. 洗濯する
  6. ほげーーー
(21:20)
オイコラ Apple の FireWire ケーブルわなんでこなに高いじゃあああああ!

通常の IEEE 1394 ケーブルの価格の 2倍はする。ふざけそ。なこれ。

(22:38)
いやあ WindowMaker は最低のウインドウマネージャですね。
(23:31)
ところで、ひょんなことから aist が発表したとゆー m17n-lib について見てみた…。 誰がこんなの使うんじゃああ!! という印象。そもそも X ベースなのが終わってるし、 ドキュメントも全然整備されてないしで、こりゃあきらかに時間不足だな (ついでにやる気も不足してるような気がするが、それはまあいい、しょせん産総研だ)。 ドキュメントも基本的には関数の説明しかしていない。 あんな複雑なもんを、チュートリアルもなにもなしでどうやって理解しろというのか。 例はどこ? ヘンテコな X のサンプルしかないし、ダメじゃん。 それに今更だれが好きこのんで C でプログラムしたがるっつうんだ、 せめてお得意の (こういうときこそ!) Rubyバインディング くらいつけておけばいいものを。 そして API や言語データベースをみると、あいかわらず “あれこれ想定しすぎ症候群” に 陥っているように思える。こうしてまた使われもしなそうなライブラリに多くの 血と汗が流しこまれているのを見るにつけ暗い気持ちになるのであった。 いやあ、これがいつかグジャラート語ネイティブの人々にたくさん使われるようになるといいね…。

そもそも、すべての言語を編集しなきゃいけないアプリケーションってほとんどない。 どうも「グローバリゼーションの幻想」とでもいうものがあるような気がする。 中国語を書くのにいちばんいいアプリケーションは中国人でないとつくれないだろうし、 それは地元のソフトハウスが開発するのが望ましいと思う。 そしてやつらはこんなライブラリなど使わないだろう (設計者にはそれぞれ事情があるものだ)。あるいは、ワープロは無理だとしても、ちょっとしたアプリケーションにも 多言語処理をさせたいということだろうか? しかしそれはあきらかに 売れてから考えればいい話である。それほど誰からも欲しがられ、かつ全世界で機能共通で、 しかもユニークなソフトウエアってそんなにあるだろうか? Photoshop ぐらいじゃない? Office 関連はその国の地域事情があきらかにあると思う (てくるで最近の MS Word は傍点が使えるらしい、やるじゃねえか MS)。 最初から多言語処理を考えるなんてのは、どう考えても overdesign によるコストのほうが上のように見える。 まあいいけどね。やっぱ日本のソフト産業は民間企業がガンバルしかないんだよ、たぶん…。

[追記: 力武さんが言っているように、けっきょく i18n (m17n も含む、やってるのはどのみち同じような人々だ) の問題というのは、 「世界は第二次世界大戦以後からあまり変わっていない」ということにつきると思う。 あいかわらず大多数の西洋人はアジアなんて辺境の地でしかないと思っているし、 中国人は日本大っ嫌いだし、日本だけが「まあみなさんそういわずに国際化について考えてくださいよ、ねえ?」と エヘラエヘラしても誰もとりあってくんない。実際オレも米国に来てから 「1バイト文字だけで用がすむ世界」というのがはっきりいってラクでしょうがなく、 こりゃあ多国語処理なんか西洋人に期待したって無理にきまってらあな、と思った。 しかし問題は、日本のソフトウエア産業は携帯電話なんかと違って弱っちいために、 独自ソフトウエアでやっていくわけにはいかず、 i18n はほとんど欧米 (というより、MS) におねがいするしかないということだ。 完璧主義のせいもあるのかな、わかんない。オチはなし ]

(00:31)
なんか文句しか書いてないような気のする。いかんぞ、こんなことじゃ。 そもそも文句をいうやつは「文句な状況」に入りこむのが悪いと思ってるので、 ようするに自分は運が悪い。だからなにかっていうと、あまり関係ない。
(01:44)
ところでさっきは忘れていたが、新山にはまだコンプレックスがあったことを思い出した: である。主婦コンについてはかなり症状が重く、もともと新山は小さいころから 母親に「お前、これくらいできないと、おムコに行けないよ!」と料理の手伝いなどさせられてきたので、 いつも「ああこんなんではオレは主フ失格だ、一生結婚する資格などない」と思っていたのである。 ここ数年とくに堕落してきた。もしかりにこの状態で結婚してしまったら (妄想開始)、 「下手でガサツなくせにしきりと家事をやりたがる世界最低な夫」になってしまう。 「うちの夫が家事をやりたがってウザイんです…このあいだも実験と称して鍋に国語辞典をつっこんでました」などと TV でモノミン田などに相談されてしまうこと必至である (妄想終了)。 「やんないほうがマシなのにやりたがる奴」って最悪だからな。つらいのよ。

Apr 16 [Fri]


(07:46)
ふと 20×20 までの暗算をできるようにしようと思いつかれる。おもい疲れた。 はたしてこれは「重い疲れた」の略なのかそれとも「想い疲れた」の略なのか??

2つの数値 xy をかけることを考える。 つねに x > y と仮定すると、覚えることは以下の 2つだ。 ab はともに 1ケタの数字である。

(画面をみないでかいています) つまり 14かける19。100たすよんたすきゅう、じゅうさん、ひゃくさんじゅう、 にひゃくさんじゅうたすさんじゅうろく、にいろくろく、266だと。 でわ14かける3はどうか? まず、じゅうに。さんじゅう。よんじゅうに。 じゃあ13かける4。まずよんじゅう、じゅうに、たしてごじゅうに。 15かける12は。ごにじゅう、たすにじゅう、さんじゅう。ああ、ちがった。 これはにけたただ。ひゃくたす10たす7じゅう。ひゃくはちじゅう。ほんとうか? ああ、あってる。

飽きたのでやめることにした。オレにはムリだある。

(08:06)
juunanakakerujukyuu. hyakutasunanatasukyu- juuroku, niirokumarutasusichikurokujuusan, tumarie-toniirokumarutasurokujuusan,sannsan,iya sanniisan, e?
(08:25)
いいよ、いいよ、もうそれでいいんだからさ。
(13:39)
略じゃなかった。
(15:39)
ああまたクダランことを。もう
(21:11)
すすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすす

やはりあれだ、おれは、あれは、そういうモノではないのか。

そういうムノ

(21:41)
おまえあれか、おまえおまえーおまえおまえそのおまえそのー…おまえおまえあれだよおまえおまえ…な? おまえ、ああん?

おまえ、あれだろ、おまえそのおまえおまえそのー…おまえあれだ…あの…あれだよおまえおまえおまえ…あれだろ? おまえ…

(23:30)
さて、というわけで今日は朝は例のトークをききに CEPSR まで行っていたのであるが、 結論からいうと…。

うちから Columbia までは 1時間じゃつかない。

とゆう、わけだ。どういうこと? つまり、まず最初に 33rd. でおりて、 Times Sq. までいって、そこから 116st. まで行くのに 30分ぐらいかかった。 遠いよ! というわけで見事に遅刻する。しかしさすが Columbia は NYU とはちがって まるで本物の大学みたいだった。キャンパスあるし、なんかやけに明るいし。 きょうはよく晴れていたこともあるが、じつにアッケラカーンとしてよい雰囲気であった。 建物はみんなド新しいしさ。 まあこれはアメリカじゃどこの大学もそうなんだろうな、うちがおかしいんだ。 Broadway に帰ってきたらそのボロさに愕然としたよ、まったくもう。

しかしだねー、今日のトぁーくは「ロボットの認知から言語的な概念を学習する」というものなのですが…。

まあいつもいつもこのテの研究を見るさま思うのですが… (日本語が変)

やらせすんなよ!

…と、思うわけであります。

いや、研究自体はそれなりにおもしろい。現実の (ロボットのセンサーなどの) 身体的な感覚から、 抽象的な概念をフィードバック的に学習させようというもので、 これはもともと Winograd なんかがやっていた「人間による理想化 → ロボットによる行動」の逆をいくものであるそう。 つまりまずロボットにあれこれ行動させ、そこから抽象的な概念を導けるかどうかをみる、と。 そのアイデア自体はいいのだが…。

やらせはシラけるんだあ -よ!

…と、思うわけであります。

なんで人工知能屋 (← 非常にウサんくさい言い方だ) はいつもこういうふうにやるかなあ。 いや、なにが気に入らなかったかというと、このロボットにはカメラが 2台ついていて (この Raplie というのは、人間の片腕の先に 2つの目がついたようなものと考えればよい)、 これがあちこち物体を認知してつかんだり人間の指導をフィードバックして その動きを再現できたりする高価なオモチャなのだが、なんつーか、 わざと「好奇心」とか「疲労」とかいうパラメータが動きに入れてあるのである。 だからこれはデモ (=ビデオ) では少し動くと、「疲労」パラメータが上がり、休む (これはモータの寿命をのばすためということにお題目ではなっている)。 これは本当に台のうえにヘタンとなるのである。だがすこしすると、 また「好奇心」パラメータが上がってきてそれが「疲労」に勝って動きだすということなのだが、 休んでいるときになにか指令すると (これは音声認識を含んでいる)、 「あとにしてください」などと言う。それはやらせだろ! お前そういうふうにコード書いてるだけじゃん、それで笑いとって楽しいか! …と、 思うわけであります。

この手のヤラセはどこまで許されるべきなのか? 新山はべつにヤラセそのものがいかんといっているわけではない、 だいたいこの手の技術はほとんどが「うまくいくところだけを撮っている」ので、 ほぼすべてはヤラセである (新山もむかしは研究室の犬としてそんなことやってました)。 しかしこういう明らかなヤラセをやられると、シラける。芸がない。 どうせこのような研究はほとんど頓挫する運命にあるのだ。 派手なうちは予算もつくし、メディアにも注目されるしでウハウハだろうが、 まさにカネの切れ目が縁の切れ目というか、飽きられたらそれでオワリなのだ (十年以上も目立ちつづけられるほど研究者は新鮮ではいられない)。 まさに「一発芸人」みたいな感じなわけですよ…。 だから研究者じゃなくてアーティストだと思えば腹も立たないのだと思うが、 お前エンターテイナーに徹するならもうちと考えろ。 むしろショーならそういうとこは徹底的に手をかけるべきである。 ここは NY なんだし、showbiz に対する目はキビシイよ? しかし、やはり MIT メディアラボであるだけに、派手さは目立つ。 とにかく派手ならばいいと。やはりそういうわけなのか? しかしこういうのはそんじょそこらのアーティストよりはるかに金を食うわけで、 そんな価値があるものなのかどうか、なんともいえない。

そういえば前に ATR かどっかでやってた「人工脳プロジェクト」ってのはどうなったんだ? 派手な名前つけやがって。そんなことより醍醐世代ではいったい何億円がドブに消えたんだ? ぶつぶつ。あれと火星探査ロケット一個ぶっこわすのとどっちがお得なのか? どっちも派手さと有用さ (あるいは役に立たなさ) は似たよーなもんに見えるけど、 素人目から見ると。そして一番問題なのは派手でないために理解してもらえない たくさんの重要な基礎研究をどうするのだ…。それとも、目に見えないところには 手をかけなくていいの
か? 「かんじんなことは、目に見えない」ということのそれであるよ。 そして、とかく派手なものにだまされやすい一般人をどうにか…。 つうか、そういうオレもただの一般人なわけだが…。まあいいや。知らない。

オレは地味で楽しいことをやるのだ。

(01:33)
どうでもいいけど、vnc2swf-0.4 をリリースした。 コードはずっと前にできていたのだが、ドキュメントを書くのがヒジョーに時間のかかる。 めんどくさいので日本語のやつはあとまわし。 結局、日本人からは全然反応なくて英語コメントばっかもらってるとそういうふうになるだよなあ。 tadanoiiwakedakedo.

Apr 15 [Thu]


(11:04)
ミザリーで朝食を
(12:47)
きれいによく晴れている。 晴れることと腫れることは同じではない。それは、
(15:24)
げっっ、狂ってる!!
(17:08)
きょうの授業は distributed hash table (現在の意味での DHT とは違う) による クラスタの性能向上について。またふたり休みだったので、きょうは活発に議論に参加させられた。 てゆうかさー、先生がフッテくるんだもん。

今日のハイライト:
先生「…この 7ページ目 のグラフをみると CPU 2 の utilization が時間がたつにつれて下がっているが… ここから読みとれることは何かね、yusuke? ここでなにが起こっている?」
新山「(うわ、この部分ちゃんと理解してないのにオレかよ!) あうー、あうー、えーと lookup table を見るのに忙しいのかな?」
先生「?? これは utlization だよ? 100% がいちばん load average が高い状態だよ?」
新山「あーっ、あー、そうか、えー? だとすると… ??? これは同期書き込みだから、CPU 1 が coordinator ってこと?」
先生「No, no! (数ページ前のスライドにもどる) クライアントは DDS ライブラリだ! だから Coordinator はこいつだ。 coordinator の CPU はこのグラフには表れてない!」
新山「あっそうすか… (長い沈黙)」
先生「ここで CPU 2 の utilization と throughput はほぼ同期してる。これはなんだと思う? つまり書きこみの際の throughput はもっとも遅いサーバに bind されてるわけで、ここでは sucky なサーバは CPU 1 であって CPU 2 じゃない! だとすると CPU 1 は一体なにをやってるのか??」
にこす「なんかやってんじゃないの…」
新山「ああそうだ、つまりハッシュ値の分布が一様でないんだ? だから CPU 1 ばっかりに write 要求が行くと。そうでしょ?」
先生「ブー。正解はこのシステムは Java で書かれてるから、JVM の GC バーストのせいだったのです」

そんなんありかよ! ちくしょう、またやられた。

これまでの一連の授業でわかったことは、とにかく ACID は遅いし、 あんまりスケールしないということだった。だからインターネット上のサービスで スケーラビリティを追求するほとんどのシステムでは、ACID を緩めた semantics を使っている。 しかしたいていこれは consistency を犠牲にするので (今回のシステムでは durability も犠牲にする)、 結局なにをやってもムズイもんはムズイということなんだな。

この授業でなにがうれしいかというと、難しい問題の「トレードオフ」を学習できることだ。 こういうのは、まあ現実社会で仕事してれば自然とわかるのかもしれないけど、 ふつう単一の論文を読むだけではわからないので (なぜなら個々の論文は自分たちのよさだけを宣伝するから!) ありがたいよね。

(18:24)
あー、またバカなもん書いちまった。お前研究やれよいい加減。
(19:51)
新山のきょう一日の行動:
  1. 文章書く。
  2. 文章書くのに飽きる。
  3. プログラムを書く。
  4. プログラムを書くのに飽きる。
  5. 論文読む。
  6. 論文読むのに飽きる。
  7. ほげーーー。
  8. 1. にもどる。
一生やってろ、と。
(22:20)
ヒョンなことから昔こっちにもってきた旅行トランク (新山がはじめて NY に来るときにもってきたのはこれひとつである、それ以降これは外に持ち出していない) を開けなくてはならなくなったが、これについてる 番号式ロックの3ケタの暗証番号を忘れてしまった!! …つうことで決死の総当たりパスワード破りを試したらあっさり開いたので、その番号をここに記しておく。

新山のトランクの暗証番号は、123 だ!

これ、いかにも「総当たり式ですぐに見つかるように」つけたんだと思われる。 あらかじめ忘れることを見越していたらしいが、オレってそんなに賢かったっけ。 これって余計な機能としかいいようがないよな、どのみち鍵がなきゃ開かないんだから。 たしかこのトランクは碑文谷ダイエーで 8600円くらいで買ったんだけど。もう 10年ちかくまえだな。 いまだに「西安」とかいうラベルが貼ってある。 で、またこうやって探索するのはうんざりなので、もっとわかりやすい番号にしておこう。

更新: 新しい新山のトランク暗証番号は、111 です。

これならもっと早くに見つかるだろう。000 にしなかったのは、 うっかり 111 から探索を始めるとずっと見つからなくなってしまうからだ。 さて、このトランクを次に使うのはいつなのかな。

ところで、「新しい新山のトランク」というのはなんだかヘンだ。

てくるで、いまレシピのサイトでいいのを探しているのだが、 どのサイトもレイアウトがゴチャゴチャしてて使いにくいんだよなあ…。どっかいいとこはないの? たぶん、写真を載せてるせいもあるだろうが、もうちょっとなんとかなるだろうという気がする。 いまのところ見やすいのは、日本語だと E-recipe だ (日本料理以外のレシピにはとくに興味ないし、そもそも海外の日本料理サイトを見ても ありゃオレのいう日本料理じゃない)。 とくに 基本のおかず などの 企画はいいと思う。それにしても、料理関係のサイトや本はいつみてもそうだが、 なんで色使いがみんなこうなのか?

Apr 14 [Wed]


(08:46)
何か心なしかビゴってないか??!?

考えてみれば、オレの日記はいつも朝一番は意味不明な言葉から始まる。
夢のつづきを語ろう (カッコとじ)。

(09:28)
どうでもいいけど NYTimes は一面にブッシュの顔をのせるんじゃねーよ。朝から脱力するだろ。

てくるできょうは雨ふるのだろうか?

(12:55)
時系列分析せみなあ。きょうは学生がひとり 15分ぐらいずつ出て 何かいま自分のやっていることをしゃべった。新山はほんらいやってることは 時系列分析とまったく関係ないはずだが (ほかの学生は株価の分析とかやってるのだ)、 こないだ COLING に出した論文がやや時系列分析に関連してるので、その話をする。 有益なアドバイスをもらえた。あと Tree Searching の専門家を発見。 こんな近くにいたとはね。それ以外にも、ある学生のやってた研究はなんだかすごそうだと思った。 いわく、数列の和をとるふつうの積分とはちがって、 数列の積をとる「パイ積分」というものを考えているのである。 つまり、ふつうの integral のかわりに
Πab f(x)dx = exp(∫ab logf(x) dx)
というものを定義するのだが、これで何がうれしいのか? というと、それはまだ考え中だという。 しかしこの概念を使うと、たとえば n! の上限に関する証明が簡単にできるとか、 いろいろクールな機能がありそうらしい。彼は前にも何かヘンなことをやっていたなあ。 カッコいいよ。ひとつ考えたのは、(統計的言語処理屋にはおなじみ) 確率の計算に これと類似したなんらかのモデルが使えるのではないかということだ。 しかし、これ実は内部的には
limdx → 0ab logf(x) dx = logf(a)・dx + ... + logf(b)・dx = limdx → 0 log(f(a)dx ・ ... ・ f(b)dx)
ということになるんだよな。f(x) をなんらかの確率とおくと、 これはどういう意味になるのだろうか?? なんかポアソン分布っぽいがね。 無限小時間のうちに独立した無限個の事象が起きる確率のくみあわせってことになるのだろうか??

ところで、今日はイタリャーから出向してる学生がしゃべってたけど、彼の英語はモロに ローマ字読みで最初なにいってんだかわかんなかった。だって 「だたばーせ (database)」とか「おくーるえんす (occurrence)」 「ぐらららぁっぷぇ (graph)」とかいうんだぜ? ("ららら" の部分は巻き舌) しかもなんか力点の起き方がどことなくイタリャー語っぽい。 そういえば、むかしイタリアを旅行したときも電車の車掌がいちおう英語をしゃべっていたが "permit" を「ぺるるるみっとぅ」と言っており、いかにも由緒正しいイタリア語っぽく聞こえて感心したものである。 ちなみにそのイタ人学生とはセミナーの始まる前にも話していたのだが、 彼いわく、アジア風外見の人間はみんな区別できないし、そもそもどんな国の人間が そういう風貌なのかさえもよく知らんという。まあ、イタリヤ人にとっちゃそんなもんかもね。 「えーと、こんなカオをしてるのはおもに中国人と韓国人、日本人で…」と説明しだすが、 日本人と中国人を顔だけで見分けるのは難しいというと、そばにいた中国人の学生が 新山をさして「お前は中国人に見えるよな、だって髪型が中国風だもん」。

えーと、この髪はいちおう日本にいるときに刈ったんですが…。

(13:17)
いまごろになって xcruise のバグレポート が Debian にあるらしい。「なんとかして」って言われても、こっちじゃ再現できねーし、 だいたいオレもう忘れてるってーの。どうするよ?
(14:02)
myhistory ファイルがいーかげん 5MB ちかくになったので、このさい新しいのに変えてみた。 なぜなら 5MB もあるファイルに毎日追記していると、毎回バックアップが 5MB ずつ増えていくからだ。

ついでに、シェルにおける一日のコマンド入力回数の統計をとってみた。 去年の 12月 10日からきょう 4月 14日までの 127日の記録である。 自宅でも同じことをやってたので、比較してみる。赤が大学、緑が自宅:

右のほうにあるくぼみは、おそらく日本に帰っていたころだと思われる。 自宅での 1日の平均コマンド入力回数は 332回/日、大学での平均は 574回/日。 大学のほうが働いていてよかった!

このときに使った、グレゴリオ暦からユリウス日を求めるアルゴリズム。 参考文献はこちら。 "Julius" は英語の形容詞だと "Julian" になるということを知らず、 さいしょ "julius day" で検索したがみつからなかった。

def julian(y, m, d):
  if m < 3:
    m += 12
    y -= 1
  return d + int((153*m-457)/5.0) + 365*y+int(y/4)-int(y/100)+int(y/400) + 1721118.5

Python の int() は、実際には fix() らしい。 そういえば floor()math. にあるもんな。

>>> int(1.5)
1
>>> int(-1.5)
-1
(15:09)
わたしゃーリアリー幸せ者だ。
(15:21)
寝てた。わづかな夢。
(19:04)
(20:19)
…また書くこと忘れた!!!

…ああそう。モミアゲが長いのが気になったので、洗面所で切ったらきりすぎた。
こりゃヘン。

(22:03)
そのごいろいろやったらますます変になりました。

病気カー

(00:03)
Navneet がなにやらインド風ポテトカツレツをつくってくれたので、いただく。 カツレツというよりは、こりゃコロッケだね。 なにやらビンに入っているチャトニー (今回は緑色) をつけてたべる。 カラい。Green Chilli とナントカいうハーブが入っているらしい。 ウマいけど、こりゃカラいね。彼の作るものはみんないつもカラいのだが。

TBS でブルース・ウィリスが出てる映画をやっている。 (新山の数少ない「名前を知ってる俳優」のひとり)

「こいつって、いつも同じことやってるよね? どの映画でも」

todo: テッシかうこと。もうない

Apr 13 [Tue]


(12:20)
今日も一日じゅう雨なんかいな。
(18:07)
ふうー! やっと OpenSSH www の 3週間ぶんの遅れをとり戻した。 日本にいっているあいだに FAQ がバカスカと更新されてしまい、 そのほかにもいろんな部分が変わっていて追いつくのが大変だったので。 さて、ハラへったな。

きょうの OS 授業はクラスタリングされたメイルサーバの話だったので やりやすかった。それにしても、hotmail とかはユーザ数どれくらいいるんだろうなあ。 アクティブでないアカウントを含めたら、1000万人ぐらいいるのか? なんともわからない。

「データを、データを、データを!」
彼はいらいらした調子でしゃべった。
「土がなければ、ブロックはつくれないよ」
-- Sherlock Holmes
(19:30)
ひさしぶりに Strand へいってくる。なぜか雨の中を散歩したい気分だったので (傘はさしていたよ)。 ちょっとレイアウト変わった。それにしても、頭が「ふげー」となっている状態だったので、 あまり大した発見はなし。腹がへっているときに料理関係の本をあさっていると 自虐的な気分になる。おそらくオレはそのぶ厚い本にカプリッチョとかぶりつく自分を妄想し
た。

ところで Broadway + 10st. の交差点 (南西カド) の街灯に描いてある、 サングラスをかけたおっさんの顔は誰だろう? どうしても田代まさしに見えて仕方ないのだが。

(21:43)
ひさしぶりに Owen と会う。かれの W-2 が手違いでまだうちに配達されてきたため。 かれは車に乗りネクタイをしめていた。こんなのオレの知ってる Owen じゃない! …大学の前に駐車できなかったので、書類だけ渡して一瞬で別れる。まあそういうとこ。
(23:47)
論文よまなか。2本。
(01:01)
長野におけるところの桜、いま満開。

Subject: [Phd-students] How Google works, and the Google API,
  guest lecture by Peter Weinberger, Tuesday, April 20

Tuesday, April 20, 5 - 7 PM, 102 WWH 101
これで AWK の作者 3人をすべて生で見れることになる。 だからどうしたって感じだが。それにしても Google は有名人をいっぱい集めているなあ。

Apr 12 [Mon]


(09:50)
どうもさみいと思ったら、部屋の窓が 3cm ぐらいあけっぱなしでねてた。

…夢の中で、オレは、もぞもぞしたものに向かって何かこんなことを言っていた。

「おまえアヒルだろ?」

(うん、うん、うんうんうんうん、とうなづくような気配)

「…おまえアヒルだろ?」

(うん、うん、うんうんうんうん、とうなづくような気配)

「…?」

(ふいに頭を抱えて) 「わかったああ! じつはクシャおじさんの『クシャ』ってのは、 ヒンディー語で『宇宙の真理』ということだったん! 新発見!!」

そいつがくれば朝がくる。ちなみにこれはシャワーヲアビナガラ考エデシテモノデ、 以後何の関係もない。

きみは「以前画面」を知っているかっ。

どうもさみしいと思ったら、部屋の窓が 3cm ぐらいあけっぱなしでねてた。

(13:08)
電車に乗るとき、駅で携帯電話をもったインド人が話していた。 頭にターバンを巻いている。立ち聞き (立ち聞こえ) するに、

「いまプロジェクトを進めている … ソフトウエアエンジニアは二人雇ったよ … アウトソース? いや、それは考えたが安いところがないと … ああ、.NET でもいいよね…」

などと話している。 ターバン巻いたインド人が米国内でアウトソースの話をしているというのは なんだかおかしかった。

ところで (てくるで)、どうしても auxiliary という単語がうまく言えねえ綴れねえ。
おうぐずぃりありー
おうぐずぃりありー

(14:49)
よーやくスライド完成。きょうは練習する時間あるな。
(19:18)
ぷれぜん終了したが、やっぱりワケわかんなかったか。 オレもよくわかんなかった。しかも F値はほかのどの論文よりも 20% も高い! という、非常に controversial な論文だったからな。 でも、アイデアはキチガイ的だからいいんだと思う。

まあそういうわけで…。

(20:38)
うー。しゃべりすぎ田。

それにしても、最近スパミャーの来ることが目立って多いのだが、 Subject: に英語で「なんとかかんとかだぜ, euske.」って言ってるのが多いな。 「Get なんとか! vbvxggh」というタイプよりも多いようだ。 まあ、どーーでもいーけど (DDI)。

(21:02)
フゲーーー。雨ふってやがる。

階段で 1階まで降りて外がドシャブラーなのを角煮んしたあと、 また 7階まで階段で上がってきた夜に記す。

(22:46)
Get a life!

Apr 11 [Sun]


(12:49)
世の中そんなものです (と、わかったような口を聞く自分がこわい)。
(13:41)
やべー。久々にブログロ (しかも日本人の) をあちこち見てまわってしまったよ。 その結果感じたことは: 時間の無駄。 まあ、予想どおり、ほとんどの人は何らかのニュースの引用か、 たいしたことない自分の意見 (それはよくある一般論か、 あるいはとくに新しいアイデアもない感想のどちらか) しか書いていない。 よくわからないが、ああいうことをやっていると「他人の意見を集めたもの」をつくれば、 「自分の人格」を表現できているような錯覚におちいるんだろうな。 そうした“引用の集合”をたがいに評価しあって、しかもいい歳した大人がそれを必死でやってる (まあ、ああいうのは「必死」と言ってもいいだろう) というのは、おめでたいもんだ。 どう考えてもこれが中学高校生ぐらいの人間にいい影響を与えるとは思えない。 結局、彼らは「うわべだけの知識で知ったか口をきく方法」を披露してしまっていることになる。

まあ、それが将来のねらいならいいけどね。

これは 2ちゃんねるなどを見ても感じることだが (どうでもいいけどさいきんあの掲示板は ほとんど見ていない、もうじき 30歳になるという人間が 2ちゃんねるの話題を 追うというのはいいかげん敗北だと思う)、ああいうものに気をとられて、 ひたすら「広く浅く」情報をスキャンする (この雰囲気わかるでしょ) だけで 学生の時間を終えてしまうと、本当に自分が注目すべきこと・ものを 決められなくなるのではないかという気がする。 オトナになってからも「自分さがし」とかいってるアホがいるし。 情報が遍在しすぎているというのはいいことばかりじゃないなあ。 選択肢が少ないために「おりゃっ」と決めてしまうことがいい場合もあるのだろう。 どのみち完璧な選択は不可能なのだから。

追記。オッカムの剃刀によりこのテのことは考えるだけムダなので考えないことにしよう。 こんなのは某 web 評論家 (砂の数ほといる) にまかせておべかいいさ! okeba.

(14:24)
2時なのにオモテは暗いなあ。曇ってるから。
(15:56)
しかもうすら寒いのよだよ…。
(18:20)
なんで日本人だってバレたのか。くそ

とど: そーいえばこないだ日本に帰ったとき、ちゃんと成田でオミヤゲ (きんつば、14個入) を 買ってきたのをすぃーーーっかり忘れていた! つぎのミーチィングのときにみんなにくばらなければ。

(20:22)
うー
(23:51)
きょうはなんでこんなに日本人と間違えられるのだろう?? 帰りに broadway を歩いてて、ルンペンの前を通ったら、そのおっさんに "please give me change, sir! 50-yen! 20-yen!" と言われて笑った。 国際都市 NY ではルンペンも国際的なのである。 それはそうと、いま Callery Pear の木がほぼ満開になっていて、 オレンジ色の街灯の下でそいつが咲いていると夜桜のようでなかなかきれいだ (本来の花は白色)。花のつきかたもなんとなく似ているしね、幹の表面はちょっと違うけど…。

電車の中では論文を読もうと思ったらすだーた (インド人) に会った。 かれはシステム屋だので、「さいきん OS の授業とってるんだよねー」という話をする。 「TOCS の論文は非常に長いね、システム屋の論文はみんなこうなの?」ときくと 彼いわく「暗号のジャーナルペーパーはもっと長いらしいよ、60ページ超とか…」。 それに、かれらは学会論文も長いそうだ。そもそもシステム屋の学会って (NSDI などのプログラムをみても)、 そんなに沢山の人が発表するわけではなさそうなので、「自然言語屋の学会なんか制限 8ページで proceedings の厚さがこんな (→  ←) だよ」といってみせたら驚いていた。違えば違うもの。

そういえばまえに改札口がこわれていてインターホンに「カモーン!」とか 言われたことがあったけど (これだけじゃ意味不明)、このことはまだかいていなかったっけ。 うふっす!

(01:05)
「チボー家 音頭♪」というものを考えた。
チボー家、ちぼっーけ、まっちぼうけ〜〜 はっくしゅ てっびょうし ♪

この「♪」のぶぶんは「ゆーにーろくろくえー」と発音してください。
あなたと私との、約束です。

todo: zipf かうこと。法則は買わない。i don't buy it!!!


(未成年者の禁煙は法律で喫煙されています。)

どうやらハラがへ減ってくると頭おおかしい度が高まるらしい。わかりましょうが、    、。

(01:29)
そんな<rb>
たに!!!
!!! (まだ残っている!)!!

とっておきのストスレ解消ホウがあります。

用意するもの:

方法 その1 (その 2 は   ) :

  1. よく手を洗う。
  2. 豆腐をギューーーーーっとにぎりつぶす。
  3. 鍋の上でね。
  4. そいつが、うにうにと手からはみ出てくるだろう。
  5. ストレス解消済。
  6. 1. にもどる。

ほんとにやってみたら味噌汁だった。 材料がないので、ダイコンと、豆腐と、ホワイトしめじのみを使って「白一色」にする。 でも白味噌は使えない。そんなものはこの世界にはない。にもかかわらず、だ。

損益は 最初から 分岐している 分岐していないのは お前だけ

さてさてこうも変わるもんですかね??

(01:37)
こういうの書いてるのがずっっと楽しい。
塩分ひかえめ、
Yusuke Shinyama