2004年 1月 (1)。

てぇ sたrs あれ べあうちふl べcあうせ おf あ fぉうぇr よう どん't せえ…

Last Modified: Sun Jan 11 03:55:18 EST 2004 (01/11, 17:55 JST)

Jan 10 [Sat]


(11:39)
スパシーボ! (フランス語で「このプラシーボはおいくらですか?」の意)

ネボっった。土曜だからいいよね。

ちなみに今朝の明け方は -17℃まで下がりました。

朝食は、こないだ井村屋の「インスタントカップしるこ」を衝動買いしてしまったのでそれにす
る。正月が終わる (=いちおう新山の認識では、15日夜に神社で行われる「どんど焼き」が正式な 正月期間の終わりということになっておるます、かきぞめ燃やしたなあ昔) 前にきちんと消費しておかないと。 ちなみに今夏買った中華三昧・冷麺は完全に機会を逸し、また手つかずのまま残っている。 まあこのクソ寒いときにシャレで冷し中華つくってみるってのもいいがね。 ところで (てくるで)、なぜこのしるこを衝動買いしたくなったかというと、 単純にこれが食いたかったというのも理由のひとつではあったのだが、 これのパッケージにかいてある「しるこ」の「」の文字が字型が非常に 好ましかったからだ。これは重要である。 以下に好ましい「」と好ましくない「」の違いを示す:

好ましくない「 好ましい「

好ましくない「」は、好ましくない。 それはこいつの鼻がトンガっていて、なんとなく欲求不満気味だからである。 いっぽう好ましい「」はどっしりとした安定感があって、「ぬーん」という感じの、 人のよさそうな、落ちついた自己充足を示している。なんだか下アゴが出ているような気もするけど 個人的にはそれは気にしない。こういう「」が書ける人になりたい。 たぶん新山は「文字をみるといつもそれが人の顔に見える」という一種キチガイ的な 病気を有しているのだろうと思われる。

(17:12)
控えめユーレイ会員の一発をくらえ!

ほんとに今日の最高気温は -10 〜 -9℃ ぐらいだったよ。 これだけアレだともうひきこもりになるね、やっぱ。

(20:14)
何かそれとは違うものを。ストレッチ
(00:02)
最新の chasen をとってきてインストールしようとしたら、 なんかヘンなライブラリを要求しやがるので、手元にあった 2.2.1 のソースでごまかしておく。 chasen の利点はあの「お手軽さ」にあったのに、これじゃダメじゃん (だって性能では Juman に… *cough* *cough*)。 そしたら今度はディスク容量がヤバくて辞書がインストールできないという事態が発生。 場所を変えようとしたら、ipadic の configure はあんまりかしこくない。 こういうのはそのアホさを経験した人でないとわからんだろうが、そういう人々は ほとんどいつも (その定義上) マイノリティであるので…、 である。 もうめんどくさいのでコンパイルした辞書を直接コピればいいや。 どうせこの世界は XML とマクドナルドとアホな configure に支配される運命にあるんだよ。 この後におよんでいったい何が言えようか?

でもなんかヘンだな。こっちは /usr/local/share/chasen に辞書が入ってるのに、 mango にインストールしてあるやつ (最近のバージョン) は /usr/local/lib/chasen に入ってるぞ。 前の辞書形式は機種依存でなくて、最近は機種依存な形式になったんでしょうか?? それってどうみても改悪だとしか思えないのだが…。

(00:59)
ソースみたら、前のやつもモロ機種依存じゃねーか! だまされた!

こんなんだった:

int i;
...
fwrite(&i, 1, sizeof(int), fp);

…ようするに、たぶん前は彼らが「share」の意味をわかってなくて、 今はわかるようになりましたということかもしれない (/usr/share はいちおう「どんなアーキテクチャのマシンからも共有できる」ものを 置くことになっている、建前では)。 しかし自然言語屋の組むプログラムって、かれら「ロバストな解析」とかいってるわりには たいていプログラム自体はソフトウエア的に全然ロバストじゃねーのな。 まあ彼らにそこまで期待するのは酷だと思うんだけど、Ralph とかはそのへんもキチンと考えていて すごい。彼が使用言語を CL → Java と移行してきたのはカシコイ選択だと思う。 Perl は Segmentation Fault こそ起こさないものの、あれでロバストなプログラムが書けるとは到底思えないし。 でも彼は真のプログラマっぽいから (IBM 汎用機のアセンブラなんかもやってたらしい)、 じつはその気になれば FORTRAN で自然言語処理が書ける のではないか? とひそかに思っている。やっぱ肉食民族はコワイぜ!

(01:40)
寝坊するとさ、また眠れなくなってさ、目がサエちゃって (うちの親いわく「トッカントッカンしてて」) さ、 そんでそのまたこれのくり返し。

いちどに 24時間以上眠る能力がほしい! (いや、いらないです)

(03:48)
日本のインスタント食品がいかに優秀かということ、
あるいは
米国のインスタント食品がいかにダメかということ

よくわからんがモジュールもなんにも使わない「最小の python インタプリタ」を どうやったらブリドできるのくについてあれくれと錯誤しておたがこれもそこかしこで徒労に終わり。 Python というのはもとから Battery Included なようにデヅァイソされているいので インタプリタだけで 使う '' というパルル (PERL) のような状況はあまりねいのかもしれなき。そうして恐そしくて心臓を着き指されました。

(以上略)

そろそろクスリが効いてくるコロです。ぼくのコロ。(病気、病気)

Jan 09 [Fri]


(11:35)
バカなことに時間を費やして「わわわわわっ」となった。

どしっするぐぬぺれていぇんねれれ

rats!

(16:35)
ころきあ。nycnlp。今日は G社だった。New York Engineering 部門の Director だというから、 まあそこそこエラいのかもしれないけど、それにしても Dan は顔が広い。 やはりこのブランド名のためか集客は強く、きょうはシステム屋の人々もきてて講義室は満員だった。 いつもはヘタすると 10人ちょいしかいないのに。でも、トークはつまらず。 というか、前のリクルートパーティーで Brin がしゃべってたのとかなり重なる部分が多かった。 スライドも。あいかわらず Keynote で Gill Sans だし。 基本的な沿革と仕事とデータセンターの概略。あと PageRank の概略 (でも PageRank の説明についていえば前にぺるりん先生の授業で聞いたのが いちばん直感的でうまいと思う、やはり彼は天才だ)。今回はおもに自然言語屋むけということで、 やや自然言語処理に関する話もあったが、基本的に彼は細かいことは何も話せないのだった。 まあ、そうだろうね。いちおう彼は Froogle を主にやっているらしく、 それについて何か具体的な話が聴けるかと思ったんだけどほとんど何もなし。 あとは Google Labs のいろんな機能の紹介とか プレスリリース のいろんな統計でお茶をにごしていた。 ただ聞いたのは「なんでも統計ベースでやってる」ということだけ。 G社はとにかくなんでも統計ベースにこだわるらしい。 そうすると人間による (政治的な)バイアスがないので言いわけがきくというのだ。しかも G社の研究者は、 ふつうの大学関係者にとっては到底不可能な大規模な実験ができるという (でもそのデータは外には出せないのだが)。

終わってからセキネさんが対抗意識をムキ出しにしており面白かった。 「あんなのただデータが一杯あるだけ、ぜんぜん大した技術じゃない」といっていたが、 まあつまり結論は世の中ゼニやってことなんですよ (あるいは米帝がいつも一番というふうにもいえる)。 データをあつめて安直な方法に頼るほうが、結局は細かい手法を工夫するより勝っちゃうワケよね。 機械学習でこういう話はよく出るのだが、多くの研究者は「これをこうして精度が 2% 上がりますた」とか いってるわけだが、結局は軒並み敗北する運命にあるわけです (まあ彼らにとっては論文かけりゃ何でもいいんだけど)。 セチがらい世の中じゃあないですか…。そのあと彼とふたりで「Google を蹴落とすにはどうするか」という 話で盛り上がっていたのだが、べつに新山は「Google が蹴落とされる」ほうには興味があるのですが、 自分が「蹴落とす」ほうには興味ないんで、それに今のかんじでいくと蹴落とすのは MS かなんかになりそうな 気がするし、どっちにしたって面白くねえよ、けっっ、という感じ。人間には器というものがあり、ふつうの人が そんなデッカいことを考えてはいけない。新山 (というかたぶん多くの日本人) はその伝ね。

ただ、彼がいったことでひとつ面白いと思ったのは、言語処理や IR の研究を進めるためには、 実験物理でいうところの「サイクロトロン」のようなものを計算機科学にもつくるべきじゃないか、 ということだ。それは「開かれた Google」のようなもので、莫大な web データベースを 管理して、研究者が純粋な学術研究のために利用できるような施設のことね。 そういうのはいいかもしれないが、問題は誰が金を出すのか? ということである。 個人的にはそういうののほうがサイクロトロンよりも安くつくれて役立ちそうなのだけれど、 税金でやるのは難しいだろうなー。 はっきりいって素粒子物理とか天文学なんて、あんなに金かけて一体なんの役にたつの? Scientific American のネタになるだけじゃん! 資金不足で苦しんでる分野はほかに山のようにあるのに! と正直思うのだりますが、これは聞いた話だけど、 たとえば日本では政治家にたいして影響力ある「おエラい学者」というのは ほとんど物理や化学などの「ハードな」サイエンス出身者ばっかりなんだそうだ。 それからマスコミのバイアスはもちろんでかい。派手なモノにはいつも金が集まる。当然のことだ。 物理学科がいつも理学部で一番人気なのはダテではない。宇宙開発もしかり。 だからそっち方面には多大な税金がつぎこまれるが、計算機科学なんてのはぜーんぜん無視されるらしい。 役人の間ですらそういう分野差別があるんだから、ましてや一般人をや。 どう考えてもうちら (計算機屋、さらにいえば自然言語屋) は負け犬街道を歩いているわけですよ。 しかしどうせ負け犬街道をいくならトコトンまで明後日な方向に爆進したほうが 破滅的でカッコイイと思うんだけど。

新山にとって、「破滅的」というのは「カッコいい」と燈火ですが何か文句ある?

しかし自分が「破滅的かどうか」を気にしているのはまだまだ全然である。
もっとなりふりかまわず破滅しなけりゃダメだな。

(19:57)
いったい何種類の「俺フォーマット」に対応すりゃいいんだ?
(20:47)
そろそろヤルキー君がお去りになられるのでオレも帰るのであり桝。

unsigned long があれば無限にでかい数を表現できると信じていたあの頃…
オレはまだ若かった…

つ   づ   く
(22:17)
なんか、この冬一番の寒さっぽい。9st. を歩いていて、耳がポロっととれるかと思ったよ。 みたら -13℃ (体感温度 -19℃) といてある。なにこれ。 しかも明日の予想最高気温 -9℃ って、なにこれ。 ここはほんとに北半球か?? (意味不明)

帰りがけに、怒れば寒さが薄れるかと思って、 空を仰いで「コラー! 月!!」と言ってみたが、効果はなかった。 きかんとみえる。キカン

(23:39)
あれからさらに寒くなったらしい。 もうね、凍るね。確実に。

てゆうか 1日平均 10MBytes 以上ってどうゆうことよ?? (最近こんなことばっかり言ってる)

1年で 4GBytes 超ってどうゆうことよ??? ふんがあ

(01:59)
-16℃。。。こういう言い方は不謹慎なのだけど、確実に人が死んでるね、今日は。。。

Jan 08 [Thu]


(08:27)
あいかわらず寒いね、朝。
(12:20)
テキストというよりトキステというほうが好きだ。ひびきが
(13:06)
電話がかかってきて「寝てた?」といわれる。寝てませんよ!
(14:24)
きょうが木曜で、ミーティング 1時からだったのすっかり忘れてた…。 氏んでしまえ。
(16:55)
「セキネさんに Python を覚えさせる計画」、略して SPL が勝手に発動。 (ただし、こっそりと)
(20:39)
ひさすいぶりに中国人 Ph.D 組とメシを食ったが (今日は中華料理ではなかった)、 中国の米大使館のビザ発酵はいかにひどいかという話。 へれんの友達の女の子がいるのだが、彼女は入学はうちらと同期だったのだが (英語クラスで一緒だった)、今学期はまったく大学に来れなかったという。 なぜならこの夏中国に帰ったあと、 米国の学生ビザが発行されるのに 4ヵ月も待たされ、12月おわりにようやく来れたというのだ。 4ヵ月! 日本人と違って、中国人の学生ビザは せいぜい半年かそこらしか持たない。だから彼らは毎回国に帰るたびに ビザを申請しなければならないのだ (でもいったん米国に入国したら I-20 の効力があるかぎり滞在は許される、米国外に出なければの話だけど)。 ふえーー。それにしても 4ヵ月ってどういうことよ! イヤガラセとしか思えないな。 日本のお役所がいかに優秀なことかと思わず思ってしまう (変な日本語)。 それにひきかえ、新山のビザは 5年間有効なんだけど…。 彼女が「それって不公平だ」とぶつぶつ文句をいいたくなる気持ちはわかる。 かの国ではコネの問題もあるのだろうが、彼女の場合は父親が某大の教授だというから、 そういうことは通常難なくクリアできるはずだし、わからんなあ中国は。
(23:44)
うーむ。かのファイルが本気で 4GB を超えそうなので、DB の設計もしなおさなきゃならんのだが、 そもそもフントにおらっちのファイルシステムは 4GB 超のファイルが大丈夫なんか? と思ってやってみた実験。
$ time dd if=/dev/zero of=hoge bs=1024 count=4194305 (4GB+1kb)
4194305+0 records in
4194305+0 records out

real    2m33.617s
user    0m4.520s
sys     0m34.060s
$ ls -l hoge
-rw-r--r--    1 yusuke   4294968320 Jan  8 23:43 hoge
どうやら大丈夫そうです…。じゃあ、やるか! 今日はもう寝るけど。
(23:53)
てゆうか、ぞうぴいしか使ってない奴が Python 使えるとか言うんじゃねー

そういえばパッケージ管理で gnu stow というのがあるみたいね。 …しかしこれにはもっと適した名前が日本語ではすでについている。 何ていうか知ってるか? 本末転倒というんだ、ものしり君。

Jan 07 [Wed]


(09:27)
今朝、氷点下 -10℃ちかく。 激寒 (←クリックしても何も起きませじ)。

さすがに昨晩中に終わったらしい。まあそんなもんですか。 で、きょうのノルマは IR システムをこさえて run まで出すこと。 しかしもういっこデカいのを走らせなきゃいかんのだが、 だいじょぶかな。

そふいえば夢の中で誰かが「それはやめたほうがいいよ」っていってた。 お前、日本語しゃべれよ! でも夢の中での言葉はべつに自分の直感とは一致しないので (ハズっす、多分) このまま続けることにする。やや不安家。

(11:08)
今日はめづらしく 岩田さんち の ネタに答えてみるのだが、Google が抜かれるその日は以外に近いのかもしれない。 たとえば最近の Slashdot を見ると 「Yahoo! が Google を解雇」 というニュースがある。これによれば Yahoo! は Google を「仲間というよりはむしろライバル」とみなしていて、 これからは Google に頼らない独自の検索技術をあみだしていくという方針。 第2 の Jeff Besoz をめざして IPO を準備している彼らにとって、これはイタいと思う。 いかに Google がスゴい技術をもっているといえども、アメリカじゃー財政的な面が弱いと、以外とあっけないからな。 ほかにもある。 「Google を超える検索結果?」 というやつで、Vivisimo.com というサーチエンジンが紹介されている。 これは Google 的な検索結果に加えて、さらにそれを内容によって自動的に分類する機能 (クラスタリング) をつけたやつで、 たとえば「Python」で検索すると「プログラミング言語」とともに「モンティ・パイソン」というカテゴリも現れる。 ここで「モンティ・パイソン」のほうをクリックすると、そっちの検索結果のみが自動的にフィルタされるというもの。 こりゃあ、便利だよ! まだ英語しか対応してないし、クラスタリングも完璧ではないのだが、 精度が上がっていけば確実にこれは Google よりも便利になる。でも、じつはこの手のやつはだいぶ 前からやられていて、日本のインターネット初期にあった ODIN (現在は閉鎖) という 検索エンジンはこのクラスタリングを実現していた (という話をまえにクロハシ先生から聞いた)。 つまり、まだまだ何が出てくるかわからないということで、まあそんなことはさておき、新山はとにかく 何事も「一番のやつをあがめる」というのが嫌いで、 そいつが「(予想に反して) 蹴落とされる」という諸行無常な展開が大スキなのですわ。 だからいずれ Google スバラシイ! とかいってたやつも「ばーかばーか」と言われる日がくるだろう。 大樹の陰にすり寄る奴は氏ね。そういう意味でもこんないばりくさったアメリカ国にいるのは全然好きでない。 しかし同様のことは誰にでもあてはまるのだが、世の中そういうもんでしょうよ。(何が?)

どうでもいいが、「英語で読むITトレンド」って最近よくリンクされてんのをみかけるけど、 あれ、敗北的なページだよな。あれを見ると英語だけできてもトレンドがわかるようにはならないんだな、と思う。 といって、べつに新山もトレンドをわかってるわけではないのだが、どうもあの記事からは「まわし者」臭が ただよっているぞ。つうかテキトーに英文はりつけて字数稼いでるだけにも見える。 あんなんで金もらえるんだからいい身分だよね。でも、アルクの 1日 1英語表現でも見てたほうがずっと役に立ちそう。

(13:41)
(久しぶりの) P2P 勉強会。前学期は水曜日の授業がメチャメチャ忙しかったため ちっとも出れなかったが、ひさびすりに復活した (オレがね)。

きょうは安全なプログラムを記述するための 分散オブジェクト指向プラットフォームとなるスクリプト言語 E言語 について。 …かと思ったらそうではなくて、彼 (=E の作者) の権限委譲にかんするトークについて あれこれ難癖つけるという集まりだった。TODO

(追記 1/9) ページが変わる前にきちんと書いておかないとね。忘れそうだし。

きょうまないたに上がったのは Marc Stiegler の このトーク。 P2P とはあんまり関係がなくて、おもに分散コンピューティング環境におけるセキュリティの話だ。 現在のほとんどの分散実行環境では、基本的に「権限」についての考え方が非常に粗雑である。 彼 (Stiegler) はターミネータ 3 にでてきた SkyNet という架空のコンピュータウイルスをあげているのだが、 あらゆる人間もプログラムも、権限は「必要なだけ」持つべきであって、それ以上の権限を持たせては ならないと語る。たとえば Windows のインストールではよく、「このプログラムは MS によって署名されています… 展開して実行しますか?」と尋かれるが、ここでのユーザの選択肢は「はい (100% 信頼し、プログラムに 全権限を与える)」か、「いいえ (まったく信頼せず何もさせない)」だけだ。 しかしこれはあきらかにどちらも強すぎる。

いっぽう Java WebStart は権限についてもうすこしきめ細かな配慮をしていて、 これはプログラムがどの資源 (計算時間、ファイル、ネットワークなど) をどれだけ使うかを VM レベルで監視する。たとえば JWS で実行しているプログラムがもしローカルな ディスクにあるファイルを開こうとすると、こいつはユーザに警告を出して 「このプログラムにこのファイルを読ませて本当にいいか?」と聞いてくる。 ところが今度はこれはユーザインターフェイスとの discrepancy という問題をひきおこす。 あるアプリケーションで、ファイル選択ダイアログを開いたとしよう。この時点では VM は ファイル自体にはアクセスしていないから、なにも警告は出ない。ところがユーザがファイルを 選択して「開く」を押した時点で、VM ははじめてプログラムが「ファイルを open しようとしている」ことに気づき、 警告を出す。つまりユーザはプログラムによるダイアログのあとに、VM のレベルで出されるダイアログに 答えなければならない。これはあきらかに二度手間だ。ユーザはもうファイルを選択してるんだから、 同じことをなんでまた尋くかって話。

で、彼はこれを改善するためには、ユーザの操作というものをすべて「権限の委譲」に むすびつけたシステム (あるいはプログラミング言語) を開発すべきだ、という主張だった。 具体的にどうやってるかは彼のデモにあるのだが、。 さらに、プログラム全体や VM 全部に権限を与えるというのは単位としてデカすぎるので、 権限委譲の単位はプログラム中の各「オブジェクト」レベルにすべきだ、というのである。 このためには権限をオブジェクトレベルで制御できるような新しいプログラミング言語や 実行環境が必要になる。これが彼の E言語のおもな動機らしい。 アイデアはいいのだが…すべてのアプリケーションを対応させるのは難しいだろうなあ。

そのあと Grimm せんせいが難癖をつけはじめ、彼は非常に懐疑的だった。結局のところ、 いくら信頼する部分を小さくしたところで、ユーザはコードがするであろうと「主張されていること」については 全面的に相手の言うことを信じるしかない、コードを実行してみる以外に その正当性を確認する手段はないのだから、彼は問題をただ分断してるだけでまったく解いてはいない、 というのだ。うん。そうだね。このひとはいつも総合的な信頼性というものを 人為的な部分もふくめて考えているところが好感がもてる。

ところで新山はぜんぜん知らなかったんだけど、世の中には 電子マネーや電子商取引のセキュリティと信頼性について研究する「Financial Cryptography」とゆー学問が あるらしい! ぎょえ。知らなかった。Google したら、この用語のまともな日本語訳すらまだないみたいだが、 無理に訳すとどうなるんだろう? 「暗号金融学」じゃおかしいし、「金融暗号学」でもおかしいし、 そりゃ暗号使うってのはわかるけど一体なんなんだ??

(14:35)
ぜんぜん関係ないけど pdf2swf というのを試してみた。 これ、あんまし有名じゃないけど、じつはスゴイな。ほとんど元の PDF どおりに Flash ができる。 しかもアンチエリアスされてるし。PDF が変換できれば事実上なんでも Flash でできてしまうではないか。
(15:39)
セキネさんが /usr/local/bin にダイレクトに Juman-4.0 をインストルーしちゃって、 いつもバージョン分けて入れることにしてたのになんで? と抗議にいったら、たんに彼が ./configure--prefix オプションを知らなくてそのまま make install したということが判明。 ぎゃふん。この人は古いタイプの人のため (?)、インストルー先のパスは Makefile を 直接いじるもんだと思ってたらしいが、configure の吐く Makefile があまりにもワケわかんなくて 挫折したらしい (そりゃあそうだ)。 まあたいていの configure がデフォルトを /usr/local にするわけだが、 このポリシーははっきりいって大キライだ。多くは古いバージョンを上書きしてしまううえに、 たとえば /usr/local/lib なんかにいろんなモノが混在してしまう。 消したいときなんか、どのファイルが何のためにインストールされたかを日付をみて判断するしかないというアホらしさ。 頼むからいっこのディレクトリにまとめてくれよ! ちなみに新山のバージョン管理のやりかたは、たとえば juman のようなものなら、
/usr/local/bin/juman -> /usr/local/juman/current/bin/juman
/usr/local/lib/libjuman.a -> /usr/local/juman/current/lib/libjuman.a
/usr/local/lib/libjuman.so -> /usr/local/juman/current/lib/libjuman.so
/usr/local/juman/current -> /usr/local/juman/Juman-4.0
/usr/local/juman/Juman-4.0 (実体、bin, lib, etc, share など)
にしておく (この場合、ビルド時の Juman の --prefix/usr/local/juman/Juman-4.0 である)。 こうしておけば必要なファイルはぜんぶいっこのディレクトリの下におさまるし、 古いバージョンも残せるし、バージョンアップしたときも current のリンク先を変えるだけですむ。 なんでみんなあのアホな configure のやり方で何も文句いわないのか謎だ。 ところで /usr/local/bin には chasen がダイレクトでインストルーされてるが これの犯人はいったい誰だろう?? オレか? オレのような気もするが…。
(16:18)
ドーでもいいのだが、いやちっともよくないが、 真冬日なのはべつにいいのだが、いやちっともよくないが、 明日もあさっても三日後もってのはどういうこと? よ??

しかもしかも、最高気温が零下氷点下摂氏 -5℃だと??? (冗長さを出してみました) fzkrn.

ていうかさー、昨日から口のまわりがヒリヒリして痛いんだよね、もう…。 我ながら寒さに弱くなったものよ、と思うが、じつはちっとも弱くなってはいないのだが (だって長野より寒いんだから! ここ!)、トォーーきょーーーは天国のようなところじゃろうのう… (遠い目)。

フム。「お天気」というのは、たしかに人生の生活を左右する主要なテーマのひとつらしい。 これについて哲学的考察がないのは非常に残念なことだ。フム。 もうあきたので寝る。

(16:47)
といいつつ寝てはいねいのですけど。

お前! それ! 「お兄さん」って歳じゃねーーーだろ!! コラ!

(17:29)
てゆうか、IR つくったはいいけどクエリがわかんなくて実行できなかった。

うーむうーむ今日のノルマ達成不可能の予感。 まあいつものことだけど。

(17:56)
きょうはやけにテンションが高かったような気がす。る。
寒いせいだろうか。サムいのはお前の頭だけだっての! (爆笑 (爆笑 ()))

ところで (てくるで)、こんどの言語処理学会の年次大会は東工大でやるということをきょう知った。 なんでかというと実のところこれは「タナカ先生引退おめでとうパーティー」であるとのことで、

まあ、(略)
とゆうことで、つまり、(略)
まあ、(略)
とゆうことで、つまり、(略)

とゆうことで、今ごろ準備に大変な人々がいるわけだ。大変だコト…。
ふとここで大岡山商店街の GS (GhostScript ではない) を思いだしたオレは素人である。

で、オレは発表できるのだろうか。いやその前にワザワザ日本までいって発表するような内容があるのか、ということだ。が。 なんでこ。れ。

いやあ。まったくなんでこんなにテンション高いのかナゾ

(19:20)
いま、くたく (帰宅)。投資凍死しそうになった。 なんか NJ のほうがマンハタンよりあたかい気がするのたけと…
(19:33)
検索すると懐しい気分にひたれる文字列シリーヅ:
google://キドカラー/

ちなみに新山は実物を見たことはありませんのでご了承ください (でも広告を見たことはある)。

(23:16)
つぎのようなメールがきた。
To: 惨?P組@steelix
Subject: 年終衝衝衝! 業績就全靠它了!!!
Content-Type: text/html; charset="big5"
いったい何だったんだろう…

かえるぴょこぽこむぽこぷょこ、あわせてぽょこぼこみこぽこぽ。

Jan 06 [Tue]


(09:58)
いやそれにしても。

夢の中とはいえ、自分の残酷さには落ち込むね。

(10:24)
一日に 3回以上後悔する場合………
(11:06)
合言葉は「知らぬ、存ぜぬ」ですよ、それ。
(12:35)
「ケバい = 美しい」という感覚は理解できないということについて。TODO
(14:12)
今日はミーィチングないと思ってたらあった。ガオーソ
(15:00)
ぺるりん先生が、Whitney 美術館の「今月の featured artist」 に選ばれたんだって。きゃーきゃー的。でも Whitney 美術館が Virtual Arts のポータルなんかをやってるとは はじめて知った。カッコイイっすね。しかしこういう現代芸術の大部分は 「なんだかよくわからないけどとりあえずヘンだから出しとけ」ってのが多いような気がする。 んだけど…。いや、ぺるりん先生のはちゃんとそれなりにモチベーションが理解できるのが多いけど、 まあ普通のゲイジュツ家ってのは、アレだ。個人的には「芸術」というからには 次のうちどれかがあてはまっていなければならないと思う。最低でも。

プログラミんぐ言語を芸術作品としてみた場合、Perl などはズバぬけて狂っており、 これは「芸術的な汚なさ」ともいえると思うが、 Python にはあまりそういう突出した感じはない (だから使いものになっている、ともいえるのだけど)。 いっぽう文字(漢字)を芸術作品としてみた場合、「鬱」とかいう字を考えたやつはぜったい狂ってる。 まあいいけど鬱だから。

(17:05)
8st. にある Daikichi Sushi がなくなっちゃったんだよ。ガーソ的。
これをガーソ的といわずに何をガーソ的といおうか。いや、ない (合唱)。 まあ、これまでもそんなにウマくはなかったのだが、とりあえず日本食に簡単にありつける場所として 重宝していたのだが、どうするよ。今日はそのためわざわざ弁当を買いに Sunrise Market まで 行ってたら風がヒュゴースとさむくてブルっっッた。ガーソ的。

どうも最近これ思うのだけど、オレの日本語は日本を離れてから 周囲の環境と隔絶されたので「独自進化」をとげているように思える。 ギアナ高地風というか。たぶん今から何千年も後にはまったく違った言語へと 発展をとげているに違いない (意味不)

google://プログラミんぐ/

(18:28)
複数の順序つきイテレータをマージして新たな順序つきイテレータをつくる、という話。
#!/usr/bin/env python

# insert/remove: priority queue operations
def insert(q, (p, x)):
  q.append((p, x))
  q.sort(lambda (p1,x1),(p2,x2): cmp(p1, p2))
  return
def remove(q):
  x = q[0]
  del(q[0])
  return x

INF = 99999
def merge_iterators(iterators):
  q = [ (-INF,i) for i in iterators ]
  while q:
    (n, i) = remove(q)
    if n != -INF:
      yield n
    try:
      insert(q, (i.next(), i))
    except StopIteration:
      pass

for i in merge_iterators([iter([1,2,3,4]),
                          iter([2,3,5,6]),
                          iter([3,4,6,7])]):
  print i
(19:37)
さいきん、なんか「つける名前プリファレンス」の傾向が変わってきたような気のするだ。 いままでは、適当な生成ファイルには "hoge" とかつけていたのだが、きょうつけた名前は "outy" である。「アウティ」だと? なんだこれは?? この「y」はなんなんだよ「y」は?? こうするとかわいく見えるのか? こら。 自分でも説明のつかない理由により感覚の変化があったらしいが、 それにしても「アウティ」ってなんなんだよ? とつけておいて自分で思った。
(20:57)
で、さっそく 300個ぐらいのファイル (1個 4〜5MBytes、テキストファイルではない) を マージするスクリプトを書いて走らせたわけだが、Linux の「1プロセスあたりファイル開ける数」が 1024 個でよかった。256 個だったら足りないところだった (まあそのときは何回かにわけてマージすればいいのだが、めんどくさいし)。 /proc/*/fd を見るとおそろしいことになっている。ふひゃひゃひゃは。 しかしながら HDD はいっこでやってるので、かなりガリガリ君な予感。 これくらいの規模になるとハードディスクのシーク時間は問題だ。 300個のファイルぜんぶが別々のハードディスクに入ってれば激はやなんだかもしれねいけど、 まあどのみち Python だから適度に遅くなっていいんじゃない?

結論: なにが言いたいんだかわかってない (自分で)。

(23:10)
KVM Switch ってブランド名じゃなくてじつは「Keyboard, Video, Mouse Switch」の略だったのな、がく然…。 まあ、でもじつは Java が内蔵 (ヘンな言い方) されてたりしたらどうーする!? こんなもんのために! どうでもいいけど一時は「禁句」とまで言われた Jini って最近フッカツしてるらしいね。 なんだろうこれは?
(23:45)
現在、ファイルサイズは約 900MB。

500MBytes を超えたあたりから、がくっと速度が低下したように思える。 まあ常識的に考えれば inode 階層が増えるだろうから、 ファイルがでかくなるにつれて log 的に遅くなるのはあたりまえなのだが、 そういえば XFS って (TBytes 級の) デカいファイルもわりと平気らしいよ。 やはり CG屋がおもに使ってるファイルシステムだけあって、 キチガイ的にでかいファイルを対象としているということだろうか…。 でもこんなにでかいファイルはここでは例外的だからなあ。 そのためだけに XFS にするのはどうも。ブロックのサイズをふやすとこんどは使えるファイル数が減ってしまうし…。

この手の話はやりだすと奧が深い。 Google は巨大なファイルを扱うための専用のファイルシステムもどきを作っているらしいが、 ほとんどリニアな書き込みと読み込みだけで頻繁なランダムアクセスはしないという仮定だった (はず)。 まあテキスト処理のばあいはそんな用途が多そうな気はする (考えてみれば動画だってストリームなんだから 似たようなもんじゃないか、素人からみると)。 でも今のところ一番メリットが多そうなのは、なんだかんだいって ReiserFS だと思うのだけど IDE ドライブをリムーバブルディスクがわりにボコスカやってると互換性の問題がね…。

でも、でもでも、遅くても確実に進んでいるのでいいや。 おまけに、全部 Python だし。まいったか。

おいおいところでいま気づいたが Python はちゃんと O_LARGEFILE サポートしてるんだろうな??

$ grep LARGEFILE /usr/local/include/python2.3/pyconfig.h
#define HAVE_LARGEFILE_SUPPORT 1

してた…。

(00:23)
タプルについて (今日はこんな話ばっかりだが)。 さいきん、タプルというものは“匿名な構造体”として使うと便利が多いということがわかってきた。 たかが一度きりのデータ型のためにフィールド名を定義するなんてめんどくせえ、やってらんねえよ! という場合にタプルを使うと便利なのである。ささっとタプルで渡してアンパック。 関数が複数の値を返すことだってできる。ていうか、ふつうタプルは固定長だよね。 タプルってあんまり伸びたり縮んだりしない。 話のわかるヤツだ。けど配列はヤバイ。そんなの気にしない。膨張しまくり。 しかも膨張すると O(n) のオーダーでよくわかんないくらい遅くなる。ヤバすぎ。 O(n) っていったけど、もしかしたら O(log n) かもしんない。でも O(log n) ってことにすると、
「じゃあ、配列の B-Tree ってナニよ?」
って事になるし、それは誰にもわからない。ヤバイ。誰にもわからないなんて凄すぎる。

(以下略)

(00:40)
そういえばきょうは忙しくてぜんぜん slashdot をチェックしなかったら、 いつのまにか iPod Mini の話題であふれかえっていた。

しかし、ぜんっぜんほしくないもんね。 むしろこんな時だからこそ (まさかの時にスペイン宗教裁判!) ノーマル iPod を買うべきだと思う、ガツンと。 さいきんあんまり外で音楽を聴かなくなったんでどうでもいいけど、 新山がウイソドウズを起動する唯一の理由がソニーのアレによるものなので、 それがなくなるというのはある意味うれしいんだけど、書いてるうちにますますどうでもよさ度。

Jan 05 [Mon]


(13:14)
風邪の諸症状はもうぜんぜんないのだが、汲々とした下痢だけが継続している。 ったくなんなんだこりぁ? 新山は「下痢慣れ」してるのでこの程度は大したことないのだが、 でもあんまり長く続くと心配だな。そもそも下痢というのは栄養がろくに吸収されないで 出てしまうためにエネルギー効率がひどく悪い。これではもったいないよ。
(13:52)
Pepto-Bismol で「ひとり拷問」。
(15:26)
9st. 駅で降りたら、いままさに駅に入ろうとしている Ralph と遭遇。 お互いにビックリして「は…はーい?」と言うものの、 おもわず動揺したため、そのあと雨もふってないのにカサをさそうとしてしまう。 うう、ど、土曜いや動揺が、 。汗汗汗汗汗汗
(15:41)
2.4.24 がでたが、なんだこの短かさは…。
$ ls -l
-rw-r--r--    1 yusuke       2519 Jan  5 15:40 patch-2.4.24.bz2
(16:14)
a〜〜〜〜〜〜〜〜〜
nemui
(19:01)
ぜんぜんどうでもいいことだが、心機一転ということで、ボロくなった Ethernet ケーブルを 新しいの買ってきて、ついでにマウスも光学ものにした。そして、なぜかキーリピートを速くした。 ついでにマウスカーソルのスピードも速くした。なんだか自分が速く仕事のできる人間になったような

気がした

そんだけ。

それにしても光学マウスって安くなったよな〜。

(20:53)
そろそろ帰るか or die.
つねに alternative (あるたーねいちぶ) がある、というのはいいことである。 かもしれないが実はそれは逃げではないの
か。わからぬい

はっきりいって、Python で要素数が 100万かそこらの配列をソートしたり切ったり貼ったりするのは ぜんぜん大したことじゃねーんだな、ということがわかった。 メモリもたかだか数十MB しか食わないし、十分まともな速度で動く。 大規模なデータを扱うので、こりゃあ C か C++ でコーディングしないとダメかな、 と思ったのだが (そしてそれはかなり敗北である)、どうやらそんな必要はないらしい。 ありがたいこと!

(01:34)
NyQuil で「ひとり拷問」。

よく
なり
ます
ように。

Jan 04 [Sun]


(14:05)
風邪はどうやら治ったヨウなのだが、こんだは偏頭痛でメロメロだ。 といってもこれはほっときゃ直ることはわかっているので、あるが、 といっても直るまでがかなりツライのだが、下手すると風邪よりよっぽどつらい。 無理矢理身体を動かしていたら、息をするだけでズキズキと痛むし。ぜへぜえ。 しかしなんとかそうじ洗濯その他をテキトーに行う。 てゆうかさ、やっぱ今回思ったのだが、考えたり論文読んだりするのは 身体の調子悪くてもできるんじゃないかと思っていたのだが、 やっぱり頭の調子というのは「身体の調子」をベースとしてその上に成り立っているもんであって、 風邪のときはやっぱりできないのな。すると、なーんにもできない。 これでは3日間もまるまるムダにしていたことになるではないか。 まあそのぶんだけ「ノドモト度」が上がって効率よくなるかもしれんからいいけど、 それでもこれって、本末転倒だようなあ。。
(14:49)
まだ 3時前なのにもう夕刻のような暗さだ。 なんで今日はこんななのかしらぬ。まだ頭痛もズキズキとしてるし、

ほんとに。

(15:29)
ふう。ようやくコウヒイが飲めるまでに快復した。あるいは (復改)

やっぱ、コウヒイはいいよね! 新山は緑茶もウーロン茶ものむが、基本的にコウヒイ党でもある。 まあようするに何でもいいってわけだが、ポイントは「とにかくガブ飲みする」ことだ。 水分を可能なかぎり循環させることが健康のヒケツだと勝手に思うことにしている、最近。 それでも風邪ひいたけど。

結論: 情報なし。

(18:50)
いつものように、頭の動きがにぶい。それは言い訳にはならない。
(21:30)
どうも、子音が入れ替わる病、らしい。 「おのみもの」を「おのにのも」と言いまちがえるのはオレぐらいだろう。
(01:03)
アルゴリなキモの部分はなんとか実装が終わったが、まだそのまわりがあるのだった。さ。
(01:37)
よのなか的類推の話。

いま、頭がまったく働いていないのだが、ほんとうならこんな状態のときに モノを書くということはめったにしないのだが、書いておく。なぜならそれは、 「疲れている状態」というのがどんな状態であるかを、sono頭の?中というものを、 往々にして将来の自分にぞ書きつけけることの重要さをあるので・・・。

つまり、いま頭の中と外がどんな状態であるかというと、なんかトッケリしている (溶けている、の反意的擬態語)。思考の糸というものが、なんだかネトネトとしているようで、 つまりそれは納豆を食ってるのと同じことだ。それはスムーズに流れしない。 しかも、ぬるま湯い。じっさいこれは頭の温度 (頭温) が物理的にも高いということかもしれず、 はたまた。わかんないよ、そんなの

話をもとに戻すと、ぬゴーーーー。って感じ。まあそんなとこ。 目をあちらからこちらに動かすと、ゆっくり動く。これが実際、頭がサエているときの シャキーソとした状態とくらべると、4分の1.27くらいの速度である。速度ね。 速さと速度は違うということに注意しなければならない。しなければならない。 そして、ここからが重要なところだが、微妙に目が回っているような感じだ…。 「目が回っているような感じ」と、「実際に目が回っている」のではどう違うのだろう? もうわからない。まあそういうことだ。

それで、さらに微細的にこの状況を記述しようと試みると…。これはもう日本語ではない。 日本語でなくなっている。もういい! でも、なにか視界のななめ左上のほうから 透明な恐怖とも狼狽ともつかぬものがソーーっとおりてきて…彼 (または連中) は 見つからないようにしてるつもりだろうけど (しのび足なで)、それらはもろに視界にひっかかるので、 じょじょに、それらが、ぼやけくなっている。それから。それからと。jjっっj

ああ、こりゃあもうだめだな。

和訳: 男もやっちょる日記というものを、女であるわたくしもやってみようということで、 やってみるのであった。ある年の 12月 21日の午後 8時ごろ出発。 この旅について、ちょっとばかし書きつけておくことにする。(承平四年、A.D. 934)

どうも新山というものは、立ち上がって動いているとき (米をといだりとか、 センタク物をたたんでいるときなど) には電波な文章がぞくぞくと脳内で生成されては バッファからあふれ出している (= 口から勝手に出てくる) のだが、いざキイボードの 前にすわった途端それらの「電波ワード」はシュウシュウと揮発していってしまい、 あとにはほとんど残らなくなってしまっているんだな。 だから思うように電波文がかけないんだ。これはどうしたこった。

どうやら動いているときと座っているときでは頭の働き方が違うようだ? (これはまあ、もっともといえばもっともではある、しかしこれほど違うのか)

(02:15)
人間にとって数千年という年月は、ほんとに長いのか? だってたとえば 3000年って 30年×100回でしょ。 そう考えるとオレのいままでの人生が 30年だとして、これが 100回くり返されたとしても 大して長い時間に思えない。だって、いままでの人生なんてはっきりいって 「アっという間」だったよ? 30万年ならまあ、大した時間という気がするけど。 30億年だとどうだろう。いままでの人生×1億回か。 こりゃあちょっとさすがに想像できないな。

しかも、もっとすごいのは、人類はこの 3000年のあいだにものすごい発展をとげてきたけれど、 オレがいままでの人生をあと 100回くり返したとしても、 そんなには進歩しないような気がするということだ。 なんか、3000年後になっても、同じようなことしてそうな気がする。 すると世の中ってのは相当スゴいスピードで進んでんだね…。

Jan 03 [Sat]


(11:52)
寝正月 3日目…
(16:29)
あのヨー、ほんとに食っちゃ寝ばっかりで終わるな、こら。

ほんとはこの国には三が日というものはないので、 2日からいきなり出勤なので、じつはきのう今日はズル休みなのであっら。

問. 正しいものを選びなさい。

(17:09)
さようなら、とこの国の人々が別れにさいして口にのぼせる言葉は、 もともと「そうならねばならぬのなら」という意味だとそのとき私は教えられた。 「そうならねばならぬのなら」。なんという美しいあきらめの表現だろう。 西洋の伝統のなかでは、多かれ少なかれ、神が別れの周辺にいて人々をまもっている。 英語の good bye は、神がなんじとともにあれ、だろうし、フランス語の adieu も神のみもとでの再会を期している。それなのに、この国の人々は、 別れにのぞんで、そうならねばならぬのなら、とあきらめの言葉を口にするのだ。
-- Anne Lindbergh via 須賀敦子
新山の場合、「さよなら」は怖いのでめったに使わない。 これには「永遠の別れ」というような意味があるように聞こえる。 一時的な別れを表すときにはたいてい「おやすみ」と言うのだが、 この用法は方言らしいということを最近になって知った。 昼間でも関係なく「おやすみ」を言うため、 東京でこれを使うと「もう寝るのかよ!」と言われることがある。
(02:09)
  1. トウフの角 → ┐ ← ← ← ← ( ← 頭

Jan 02 [Fri]


(12:42)
生きてはいますがあいかわらず調子悪です。下痢ってるし。もう

もうさあ、オラもうへーやだ。(かなり北信弁)

これさえマスターできればあなたも長野県人だボキャブラリー:

(17:29)
どうもこれは、「すごく腹にくるカゼ」なのではないか? と思いだした。 だいたい食中毒ならもっと嘔吐っぽいものがあるはずだがあまりそういうのはないし、 最初は下痢でじきに便秘気味、というのもなんかおかしいし。 ただ異様に腹がはるのは新山の場合は今までの風邪ではほとんど経験したことがないので これは未知の現象だが、発熱なら夜になると微妙に寒気がするし、身体がなんとなく ダルくて手足がやや痛いというのも風邪っぽい。ただしノドも痛くないし鼻水もでないし、 熱もそんなには高くないので本人的にはカゼの自覚はまったくないのだが、 当節はこれがはやりなのかもしれない。

それにしても自分の身体なのに、よくわからんことの多いことよ。 まあそれが楽しいといえば楽しいんだけれどもね。

(21:01)
カゼだな、こりゃあ。「胃カゼ」に決定。 いまだに腹がシクシクと痛むし、下痢だし、首とかも痛くなってきたし。 ただしありがたいことに食欲はある。そうと決まったらさっさとあったかくして ショウガ湯 (このあいだ何となく買ってきた) のむか。 だいたい、カゼならカゼで、もっと早く気づけっての。 しかしこれは一種の寝正月である (一種でもなんでもない)。 個人的には「寝正月」という言葉のひびきは季節の風物っぽくて気にいってるのだが。 なんかいかにもドローンと怠惰〜な感じがしていいよ
ね。

ああ、また日本を思いだして暗くなってしまった。

(23:30)
夜になりました。
(02:08)
窓の外から 2つの血走った白い目玉だけがきょろきょろとこちらをのぞいている。 そこに。

Jan 01 [Thu]


(12:22)
腹の調子が悪い。ピヨピヨする。
(21:05)
あー、今日は原因不明のボーマンにより家で一日じゅう寝ていた。 とりあえず、ずーっと腹部がアフリカの子供のようにハッており、 妊娠した女の人ってのはこのように苦しいものかしらんと思う。 でもそんなに沢山食ったわけでもないので内部はほとんど空気っぽい。 そのあとゲップがやたらとでて、ひどい下痢ピーピー。 ようやく直ってきたような気がするが、何が悪かったんだろ? あきらかにゆうべの年越し蕎麦が原因という気がするのだが、 食中毒か? でもべつに生タマゴとか今回は食ってないわけだし…。 カゼか? それともさらにヤバい病気だろうか? まあいいや。それにしてもほぼ 24時間断食状態である。 まだすこし腹痛がするし、食欲まったくないのだ。 べつに熱があるというわけではないんだが、これはなんなのだろう?

いま調べたらどうも食中毒っぽいなあ。長ネギが原因だろうか? 「食中毒」「膨満」で検索するとボツリヌス菌が多くヒットし、 それによると「細菌兵器にも使われていたほど毒素が強く、 最悪の場合呼吸困難になり氏ぬかもよ」と書かれている。 ぶるぶる。でもそんなにひどくないと思うけど。 しかし潜伏期間は 8時間とかって書いてあるから、もしこれだとすると感染源は ソバじゃないと思うんだが、だとするときのうの昼に食ったサンドイッチが原因か? これではこの国ではもう何も食えなくなってしまうじゃないか。やだやだ。

しかし「お正月に食中毒で死亡」というのは モチを喉につまらせて死亡と同じくらいバカっぽくて、ある意味カッコいいよな。 ロックな生き方というか。(←勘違い)

(00:31)
うげーもうこんな時間?

ひさしぶりに日本に電話すると発信音がものすごく短かく聞こえてアセる。

(03:40)
一日じゅう寝てたので睡眠時間が狂っています。
Yusuke Shinyama