2004年 10月 (2)。

Last Modified: Thu Oct 21 01:35:12 EDT 2004 (10/21, 14:35 JST)

Oct 20 [Wed]


(11:13)
なんか調子わるい。きのうは早めに床についたのだがなかなか眠れなかった。なんでだろ?

todo: サンプーかうこと。

(13:10)
Waverly Pl. の道のまんなかにトイレットペーパーがドサーーーーっと広がっていた。

そしてきょうは米国旗がほとんど床屋のマークに見えた。
これはオレの頭がサエているのかそれともクルっているの
か。

電車の中でふと気づいたことがある:

  1. コンピュータがウィルスに感染する。
  2. ウィルスがコンピュータに感染する。
日本語として正しい言い方はどっちなのだろう? 英語的にいえば、infect は他動詞しかないので、 「感染」の主格 (agent) はウィルスであり、したがって 2. の用法が正しそうに見える。 しかし次のようにすると、こんどは逆になる:
  1. 新山がエイズウィルスに感染する。(ウソです)
  2. エイズウィルスが新山に感染する。(ウソです)
この場合、「エイズウィルス」が主格になる、というのはなんだかヘンだ。 これはコンピュータ「ウィルス」の場合、ウィルスはなにか自分の意思をもっているように思えるが、 エイズウィルスではそんなふうには思えないからかな。 日本語では「感染する」は「(病気に)かかる」と同じような意味もあるように思う。
(18:46)
くそー、勝てねー (自分のプログラムに)。

少なくとも、これはいいことではないか? いいとこだよ、うん。

なんか今日買ってきた花は失敗だ。新山の机の雰囲気がなんか「仏壇?」てかんじになった。

(22:22)
あーどうやら先手必勝のようだなああ
(01:23)
当然サンプーは買ったよ。

ところで、きょうは先学期に OS の授業をとっておいてよかったと思った。 OS パフォーマンスのグラフを分析するくせを叩きこまれたのが、 データベースチューニングでは見事に生きてくる。 このようにいろいろな授業がかくも有機的に結びついてくるというのは (たとえ意図されていなかったにせよ) 立派なカリキュラムだれ。 とはいっても、新山は実際のデータベース運用経験がまったくないので、 ほとんど使い物になる知識は得られなそうだが (この授業は社会人が多いので、 ほかの学生はおおかれ少なかれ仕事で RDBMS をいじっている)。 しかし SQL Server ってそんなにまともな製品だとは知らなかったなあ…

Oct 19 [Tue]


(08:06)
なぜか線画のようなものでできている夢を見た。 しかし、アザミの花だけが線画ではなかった。

todo: サンプーかうこと。

新山は「シャンプーほとんど使わない病」の患者であるので、 300mlちょい入りの小さめのボトル (こちらでは小さいほうである) を 買っても 1年以上もつ。いつもなるべく香料の少なそうなのを 選ぶようにしている。ちなみに、オレはリンスが嫌いなので、 リンス入りのシャンプーは買わないことにしている。なぜなら、あれをやると 頭のベタベタがいつまでたってもとれないので (そりゃそうだ、油ぬってんだから)、 ちっとも髪を洗った気にならないのである。洗髪したあとに手で髪の毛をひっぱると 「きゅっ」と音がするようでないとダメなのだ。picky! picky! (pockyではぬい)

(08:50)
雨がふっていて出かけたくないよ
(09:50)
ラジむか が更新してる。 金子さん一方的に爆発してるよな。
(10:01)
obvious と oblivious はあまりに違うよ。
(11:00)
Friday, October 22, 2004 - 11:30 a.m.
Room 1302 Warren Weaver Hall
251 Mercer Street
New York, NY 10012-1185

Speaker: Scott Smolka, SUNY Stony Brook
Title: Monte Carlo Model Checking
(12:23)
再発明するならもうてょっとセンスよく再発明してほしいです。
(12:37)
あしたの nylug ミーティング、行きてーー。でも授業がある。 もうサボっちゃおうか?? (天秤、天秤。)
(14:05)
あー恥かいた。
(15:16)
きのうの結果についてセキネさんと議論する。 基本的に、やっていることは 20年前の Church の論文とほとんど同じだが、 使い道はちがう。これが本当に役に立つのかについてケンケンガクガクするが、 結論はでなかった。これって絶対 IR で誰かやってそうだと思うんだけどなあ。 それにしても、午後はいつもテンション低い。テンション低いのには もうひとつ理由があって、今日から入った暖房がいきなりメチャクチャ暑いからだ。 うげーーーー、なんじゃこれわ。もうこの部屋にいるだけで目がショボショボしてくるほどの 暑さなんですけど…。これではドライフラワーになっちまうよ。もう帰っちゃおうか。
(17:48)
よーやく元気になってきたら、いままで知らなかったことがあった (文脈不明、でも、もういい)。

じつは GCC では、以下の構造体はどちらも 8バイトの大きさをもつのである:

struct foo1 {
  short a1;  /* 2bytes */
  int b;    /* 4bytes */
}

struct foo2 {
  short a1;  /* 2bytes */
  short a2;  /* 2bytes */
  int b;    /* 4bytes */
}

b を 4バイト境界にアラインさせるためらしいが、 いままでバイナリデータをあんまりこういう形で扱ったことがなかったので知らなかった。 ま、そゆこと。

(21:35)
雨がふってたのでいそいそと帰ってくる… ああああああああサンプー (散布ではない、算譜) かうのわすれたっっ!!

てくるで (ところで)。

PowerBook は遅くて、ぜんぜん Power な感じじゃないので これからは「非力ブック」と呼ぶことにする。 でもそれって iBook のために予約されているような名前じゃないか。 どうでもいいけど「予約されている名前」というのは一般人にとっては 何のことかわからないが、一部の人々にとっては独特の(イヤな)感触をもつひびきなのである。

(22:52)
木曜日の対戦にそなえてプログラミングで我を忘れるところだった。 今週のゲームのテーマは Voronoi 陣取りだ。「う゛ぉろのい酢゛」とは細胞の断面によく似ている図形で、 こんなやつである。 ゲームのルールは簡単で、プレイヤーが平面上に交互に 7個の「石」を置く。 平面上の各点は、それぞれもっとも近い「石」に属するようなパーティションに区切られる。 最終的に陣地の面積の合計が大きなほうが勝ち。というものであるが…。 今回は状態が連続である。前回 (シーソー) は基本的に離散状態だったので min-max でも alpha-beta でもよかった。しかし今回それをやるのはちょっと無理がありそうだ。 おまけに、「せっかくだから全員でいっぺんに参加してバトルロイヤルもやろうぜ!」 という話になったんで (複数マシンで socket 通信する)、プレイヤーが 2人であるとは仮定できない。まーどのみち Python だから遅くてそんなにいっぱい 探索できないだろうけどサ…。

あと、Voronoi のパーティションを求めるアルゴリズムが意外とめんどい。 まあ、だいたい computational geometry というのはアルゴリズムがめんどいのだが、 この手の線分 (“直線”じゃないのだ、長さは有限である) とかポリゴン操作ってのは とにかく場合分けが多くていやだ。とはいってもぴちょん君で組んでみたら 100行ちょいで できてしまったので、ついでだから Tkinter もつけちゃえ。やや悩んだのは 「任意のポリゴンの面積をどうやって (analyticalに) 求めるのか?」ということであったが、 Voronoi 図にでてくるポリゴンは全部 convex (凸型) なんで、これは造作もないことがわかった。 ようするに、ひとつの頂点をアンカーにして扇形に三角形に分割すればよいのだ。 こういう分割はレンダリングには適さないが (さいしょ電車の中では上からスキャンライン風に trapezoid に分割する方法を考えていた、これは手製でポリゴンレンダラを書くときには必ず出てくる)、 面積さえ出りゃいいんだから ok。あとは中学校のときに習った「ヘロンの公式 (な、なつかしい! とはいってもこれって実際にテストには出なかったような気がするけど?)」 で面積を求める。まあ、ヘロンといえばゴム靴がはやるね。そのとおり。ペネタ型。

(01:17)
シャンプーがないので、せっけんで洗ってみた。大してかわんない。 もとから髪は傷んでいる。

ちなみにオレはママレモンで頭を洗ったことがある。(これじゃ変態自慢だ)

どうでもいいが (よくなき)、 「新宮澤賢治語彙辞典」などという本が存在することを知ったのだが、 これっていったいどんな本なんだろ。興味あるな〜〜〜〜〜

(最近、「〜」を使う機がやたら多い、これはやりすぎるとバカっぽくてよくない)

Oct 18 [Mon]


(10:33)
あ〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜
もう
マタ寝坊したわよ〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜コノヤロ!
暗い暗い暗い暗い暗い暗い暗いぐりとぐら

オデハそっダラプくダつなぢジョ〜だドる開せぬいゾ
むったくだ、むう。

いや、フントに。

(10:42)
はあ、まさかこのブクにフラッシをつくれと、こうおっしゃゃるのですか。
(11:03)
なんというクトだ!

(ぬんという!!)

(!!!) ♪

ワ〜〜〜〜〜〜〜〜〜〜〜〜〜イ 福健省!!

(11:14)
今日の重大ニュース: 北朝鮮ナンバー 1436775、病状回復か。

にっこ、にっこ!

(11:49)
「チョコざいな」という言葉は、「チョコレートでできた」という意味である。

いま、まさに、ふいにそう気づいたのだ。

(13:18)
b1。

** 楽しくないことを楽しくやる方法 **

異常です。↓

(13:58)
きみのお手製検索エンジンにも「Google ハイライト色」を使おう!
HIGHLIGHT_COLORS = [ 
 ('black','#ffff66'),
 ('black','#a0ffff'),
 ('black','#99ff99'),
 ('black','#ff9999'),
 ('black','#ff66ff'),
 ('white','#880000'),
 ('white','#00aa00'),
 ('white','#886800'),
 ('white','#004699'),
 ('white','#990099')
]
(15:40)
気がついたら Charniak parser の新しいバージョン (parser04) が出ているとのことで、 インストールしてあげたら、動かん! と言われる。これ、引数にディレクトリ名を 与えるようになってるのだが、DATA/ の最後のスラッシュを除くと うまく作動しないのだった。こういうヘボさはあいかわらずなんだね…。

ちなみにこいつのソースコードは C++ で書かれているが、 はっきりいって最悪の読みにくさで、 なぜ最悪かというと 「オブジェクト指向はよく知らないが、 とりあえず C++ の機能をふんだんに使ってみました」 って感じのコードだからなのである。 もぅー、最低。 この parser はメモリ周りがアヤしいのだが、C++ 風に書かれれば書かれるほどこの手のことは 追っかけにくくなる。つーか、int& なんて使うやつはみんな悪魔の手先だ! 同じことは Collins のパーサにもいえる。これには Svetlana がスクラッチから C++ で実装したバージョンがあるのだが (Java 版もあるらしいよ)、オリジナルよりも一層わかりにくくなっており、結局、 新山が改造するのはいつも愚直な C バージョンだ。まったく、こういうのを見るにつけ、 世の中ちっとも進歩してないよな、と思う。 しかし、まあ、それを言いだすと、どこぞの国ではいまだに10年前の成果を統計的手法で 必死に後追いしてる人々がい *cough* *cough*、まああれだ、ちゃんと進歩しているのは Python だけだよ、うん。 そういうことにしておく。

(17:08)
なんかやる木でない。つうか、ねむたい。あ〜〜、この時間帯はあいかわらずダメなんよ

しょうがないので、まず銀行へよってから Washington Sq. で大道芸人をみてボサーーーーッっとする。 彼らはうまいのだが、つねになんか喋りまくりながらやってるのがすごい。 そのあと Courant 図書館へよって本をあさろうとするが泣く子と眠気には勝てず。 敗北を感じつつ戻ってくる。Grey Art Gallary は今日は休み。

NYU は数学では全米のトップスクールであるので (CS は 2流だが)、 ここには計算機関係よりも数学関連の書籍のほうが多い。 しかも、ロシア語やドイツ語のジャーナルが置いてあったりする。 数学じゃ、ロシアは先進国だからなー。でも、いまもそうなんかね。 そういえば、どうでもいいが、heuristic problem solving のクラスにいる 学生のひとりは数学オリンピック台湾代表 (金メダル) なんだそうな。 ついでに彼は ACM プログラミングコンテストでも 3位につけたらしい。 まあ、これを聞いて「しょえーーーー」と思っても誰も文句はいわなかろう。 しょえーーーー

やっぱ寝る

(18:14)
おっはよ〜〜〜〜〜〜〜、みんな!!

てくるで、会議室のホワイトボードに描いてあったグラフがなんとなく オバQに出てくる O次郎に見えたので、目をもういっこ追加して本当の O次郎にしてやった。 といっても、どうせここでは誰も O次郎なんて知らないだろう。 新山はこういうイタズラが大好きである。きっと、アレだね。数千年前に生まれてたら 絶対オーパーツとか作ってたね。それにしてもピラミッドや万暦帝の地下宮殿の仕掛けの設計にはぜひとも参加したかったが、 あの手のやつは墓があばかれるのを防ぐために関係者一式みんな殺されたそうだから、 あれに出たらいまごろ生きてはいなかっただろうなあ。

(20:38)
帰ってきたら秋だった。
(21:26)
誰かさんが喜びそうな記事を発見した。 NYTimes / Google Envy Is Fomenting Search Wars

それによると「Google は MS に対抗するために、新しいブラウザを作っている」 という噂があるそうだ。コワイネーーー。っていうかもしかしてそれ Grail??

(23:00)
くるちゅーる

とゆうか、 sets を使えばいいんでないかい??

けんきう日誌

2、3日前からふと思いついてある実験をやったら、 「なんか、関連ありそうな単語」のペアを取得することに成功。やり方はチョー単純だ。 近いところにある単語をひろってきて、数をかぞえて df で割ってるだけだ。 これぞ統計的!!

1.357142857 19 14 14 protease,inhibitors
1.166666667 14 18 8 particle,neutrino
1.008154219 60 46 77 silicone,implants
0.956726568 356 430 322 pitched,innings
0.920869155 106 106 125 ozone,layer
0.824943472 138 132 212 dioxide,carbon
0.820703614 89 70 168 ghosts,castle
0.807484606 241 317 281 inning,homer
0.800030247 230 285 290 transplant,liver
0.768706115 13 13 22 harakiri,courtiers
0.766032346 13 9 32 progestin,estrogen
0.760638829 27 63 20 whales,minke
0.746766238 89 67 212 monoxide,carbon
0.716061802 1039 1153 1826 yen,dollar
0.701275243 8648 18842 8071 saying,quoted
0.700140042 10 12 17 cauliflower,broccoli
連語も含まれているが、それだけではない。 問題はこれがいったい何に使えるのであるか? ということだが、まだ考えてない。 たぶん feature に利用するとオイシイんじゃないかな、と思うんだけど、 その rationale とは、「これらの単語を2つ1組で扱うことで、(共起する語をくっつけてるため) 語義の曖昧性がある程度解消されてることになる」んではないか、というもんだ。 それにしてもしかし、この「harakiri」「coutiers」って一体何だろ…。

Oct 17 [Sun]


(10:51)
曇っていていい天気だ。

(矛盾 - 曇っているのは世の中的には「いい天気」ではないが、 新山的には「好きな天気」、したがって「いい天気」だる)

なんだ、たいしたことないじゃん。

(13:29)
それにしても中国ってスゲーな、やっぱ。 「明日このへんに衛星落としますから避難してください」ってわけ?

新山は中国人とはたぶん理解しあえないと思っているが、 日本人以外にいちばん興味をおぼえる国/民族といったら、やっぱり中国だなあ、 と最近思うようになった。米国は興味ないです (いや、研究や仕事では興味あるのだが、 文化的にという意味)。南米や欧米はおもしろいとは思うが、アジアには負ける。 アジアでも、インドとかはまだ行ったことがないのでなんともわからないが、 中国がおもしろそうなのは、「日本と似ているようでじつは違う」という所が多そうなとこである。 にもかかわらず、日本文化の無視できない部分が確実に中国起源なのだ。 韓国も興味あるけど、なんか中途半端な印象だね。

どうでもいいけど日本では「注意されて逆ギレ」というケースが非常に多いように見えるのはなぜか?

(14:00)
きょうはサムいです。午後のこの時間なのに気温 12℃だよ。。

10月中は極力暖房を入れないようにしようと思っているのだけど。 これからまた激サムき季節になるのだから。

(19:42)
それにしてもなんでこんなに接続切れるの? 10分おきにブツブツ切れたりつながったりしてるようだよ。

LWN を読んでいたら、RFID の普及にともなって、 ここ数年で確実にヒットするだろうキーワードがわかった。 google://アルミホイルの帽子/ である。

どうでもいいが (まったくだ!)、新山の知っているかぎり 英語の引用符のつけ方には 2種類の方法がある。ひとつは英国式で、 句読点が引用符の直後にくるとき、それを外に出す方式。 つまり I am a "pen". とかいうやつだ。ところが米国では I am a "pen." のように書く。そしてオレはこれが嫌いなのだ。 なぜ嫌いかは明白である。ほんらい "." はリテラルに含まれないからだ! これでわ、いざ実際に "." がリテラルに含まれた時に、 "pen." の最後のピリオドがリテラルの一部なのか、あるいは文章の句点なのかが区別できなくなってしまう! (ここでは、人間がそんなにバカだと仮定すること) "pen.." としたところで問題は変わらない。 これは明白は設計ミスである。まっっ
xtuっったく、なんということをしてくれたのか! アメリカンのバカ。証明終。

(20:47)

ああそうか。

Oct 16 [Sat]


(10:16)
セキユが値上るとまたトイレットペーハーが買えなくなるのかな?

(新山は実態を知りませんが)

(11:11)
技術はホントに進歩しつづけるのかということについて。

きのうのプロセッサに関するトークを聞いたあと、なんとなく思ったのだが、 基本的にある技術が普及しすぎると、それ以上はもう「固まって」しまって 新しい改良がほとんどできなくなってしまうんではないかと思う。

たとえばきのうの例だと、Intel は x86 アーキテクチャを絶対にやめない、というのがある。 しかしこれはべつに Intel が何も新しい研究をしていないからではない。 実際、Intel は新しい CPU アーキテクチャもけっこう以前から模索しているのである。 今までの戦績は以下のとおりだ:

しかし、これをやっている間も、Intel は既存の x86 に代わってこれらを無理に 売りこむようなことはしなかった。なぜなら賢い Intel は、いつも x86 が確実な おマンマのタネであることをちゃんと知っていたからだ。これらの研究はつねに 「ブランチ」として扱われたが、ブランチはほとんど死に、けっきょく x86 だけが残った。 しかし Intel が予測だにしなかった怪現象 (AMD の出現) により、x86 でもとにかく 食いぶちがきびしい状況になってきた。そこで Intel が持ち出してきたのが IA-64 なのだが、きのうのおじさんによれば、 「いま Intel が IA-64 を切り捨ててもオレはちっとも驚かん」とのことである。 なぜなら IA-64 はまだしばらく売れなそうだからだ。インテルは結局、 32ビットの x86 から離れられないのである (で、IA-64 への移行を推進するために 既存の x86 につけた名前が「IA-32」だった)。。。

似たような話は、いくらでもあるような気がする。Win32 にしてもそうだ。 IPv4 にしてもそうだ。(Pikeがいうように) UNIX もばっちりそうである。 どれもある臨界点を超えて普及してしまったため、もう全面的な 改良がほとんど不可能になっている。もちろん、原理的にはどっちもまだまだ 改良できるのだが、ビジネス的な要求がそれを許さないのである。 たとえ後方互換性を残すにしても、「コスト高」というデメリットがついてまわるだろう…。 16ビット→32ビットの移行時に比べ、いまではもう社会全体が以前とは 比較にならないほど既存のアーキテクチャに依存してしまっている。

同じことを言語にあてはめるとどうなのか、という話。 たとえば Perl6 とかはどうなんだ…たとえできたとしても、もはや Perl5 がこれほど 普及してしまった現在、ほんとうにみんな使うのかどうか、かなりあやしいと思う。 しかも Parrot 経由なんでしょ? 同じことは Python3 にも言える。 Rubyはどうだか知らないが、まだあれはマイナーだから大々的な改良ができるかもしれない。 ついでにいうと、これは人工言語に限らないと思う。けっきょくのところ、 なぜみんなエスペラントを話すようにならないか、というのと同じようなことなのだ。

ま、そう考えると、やはり「人生マイナーなほうがいい」という結論に落ちついたところで、 でかけよう。

todo: 箱テッシきれた、かうもの

(18:50)
今月のテーマ、それは、「恐怖と笑い」です。

うう、ヨダレでてきた

(21:04)
きょうの午後は Marshall Kirk McKusick (FreeBSD 創始者のひとり) と Eric Allman (sendmail の作者 - まあ、ある意味、諸悪の根源かもしれない) のトークにいってきた。こんな大物トーク、ふつういっぺんにやる? まあいい。 場所は Columbia の Mathematics Building である。 Eric はおもに Spam と Sender ID の話で、Kirk はバークレー時代の Bill Joy との思い出から FreeBSD の出自、およびその運営体制に関する説明。Eric はいかにもアメリカ人な、メガネかけて ぶよぶよ太った赤い顔したおやじだったが、Kirk はカッコよかった! ヒゲが似合うステキなおじさまで、 話し方も落ち着いていて (よくしゃべるのだが)、計算機屋の雰囲気を感じさせない。むしろ、芸術家っぽい風貌。

熱弁をふるう Kirk McKusick

todo: トークの内容書け。

Kirk: 現在 FreeBSD の committer は 300人ほどいる。どうすれば committer になれるかというと、 まず cvs のログを追って自分が関心あるモジュールをよく更新してる人をみつける。 そうすれば問題点がみつかったとき、誰にコンタクトすればいいかがわかる。 問題がみつかったら、しつこく原因追求してそいつに再現方法やパッチを送りつづけていると、 そのうち committer に推薦してもらえるだろう。でも 1年間 commit しないと自動的に外されてしまう。 NetBSD もほぼ同様のシステム。Linux はあきらかにマネージメントがよくできてない段階で人気が出すぎた。 Linux はとても民主的とはいえず、自分のコードを入れるには Linus に気に入られなければならない。 FreeBSD は 20年間やり方を変えていないが自己統制がとれており、ゆるやかに成長してきている。 ボランティアの難しさは、あくまでみんな空き時間にやっているためにスケジュールが きちんと立てられないことだ。それからみんな、やりたいことしかやらない。 ボランティアに「お前これをどうしてもやってくれ」というのは難しいことだ。 5.3-STABLE はいつ出るの? ガンバってるけど保証できないらしい。 なぜならここ (RC) から STABLE に至るまでの過程はいつもすげー煩雑かつ退屈なので、 Kirk は自分じゃもうやりたくない、だれか人にやらせる、という。 CURRENT は開発者しか使わないが、Kirk いわく「うちのマシンも一台は毎晩 cvsup して 自動リブートするように設定しているが、ほとんどの日は朝起きてみるとちゃんと走っている」。 「FreeBSD デーモンくん」の現在の著作権者は Kirk だが、 じつはこれは最初 Disney の知り合いに描いてもらったとのこと (だからああいう絵柄なわけだ)。 でも彼は Kirk が描いたことにして版権をくれたらしい。で、だいたいどんな人々が FreeBSD に参加してくるか? というと、おもに 20台後半からの人間が多く、みんなもともとは Linux を使っていたが、 FreeBSD の「ちゃんとしたやり方」に魅力を感じて乗り換える人が多いとのこと。

Eric: MS (Sender-ID) と Yahoo (DomainKey) は特許出願しているが、自由に使える。 これは権利よりも訴えられ防止のためだ。じつは GMail は DomainKeys を使っているらしい。 ユーザから出される全メールに署名しているのだ。

ホントか? これは今たしかめた。ホントだった!

From: Yusuke Shinyama <xxxxxxxxxxxx@gmail.com>
Subject: testee
To: yusuke@cs.xxx.xxx
Reply-to: Yusuke Shinyama <xxxxxxxxxxxx@gmail.com>
Message-id: <bfa2024704101618191b5d3e00@mail.gmail.com>
MIME-version: 1.0
Content-type: text/plain; charset=US-ASCII
Content-transfer-encoding: 7BIT
DomainKey-Signature: a=rsa-sha1; c=nofws;        s=beta; d=gmail.com;
 h=received:message-id:date:from:reply-to:to:subject:mime-version:content-type:content-transfer-encoding;
 b=a0i5jN8S4q/v1OzrJxn31FBBDH9CZAhCqELNtvT7fRr43QGe06T7WL1svdUPAv/F+p3EfRnwJuIQxo/x6rztnymTMy6rEgV/TltTbA以下略

それにしても、やはり Columbia は遠いヨナー。おなじ manhattan にあるとは思えない。おもわず遅刻しそうになった (というかした、2分か3分)。NYU 付近からだと 1時間ぐらい見といたほうがよさそう。 まるで大岡山-長津田間のような遠さなのである。よ。 そうすると途中で N線から 1線に乗り換える Times Square はさしずめ二子玉であるのか (それはちょっと、さすがに無理があるだろう)。 終わってからは 1線で一気にダウンタウンまで降りてきた。ギョウザのためである。 そのごロウアーマンハッタンをぶらぶら歩き、古本屋に寄ったりして帰ってきた。 そのご洗濯。いま乾燥機おわったとこ。しかし腹へった。

(22:21)
あ、そう。

ふーん、あ、そう。

ふ〜〜〜〜〜〜〜〜〜んん、あ、そう。

ふぅう〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜↑↑↑↑↑↑↑んん!、あー、そうーー〜!

よかったね。

悪かったね。

あ、そう?

(23:35)
google://イタさの王様/

Oct 15 [Fri]


(13:28)
雨がふってる

ころきあ。

きょう見た夢の中でもそうだったが、きょうのころきあでは、 あらためて「人間、いつでも謙虚でいなければならんよな」ということについて考えさせられた。 といっても、べつにきょうのトークをした Austin からきたおじさんが傲慢だったとか、 話が楽観的すぎたというわけではない。きょうのトークは「今から 10年後のマイクロプロセッサはどうなるか」 というようなことについての話だったが、インテルなどの話を聞いていくうちになんとなく そう思った、ということである。さいしょは謙虚だった人間 (とくに知人) が、 だんだんと傲慢になっていくさまを見るのは、とても哀しいようなムカつくような気分だし、 自分がそうなったときのことを考えるととてもおそろしい。それに、けっきょくのところ、 傲慢さとは無知からくるものだ。しかし傲慢さというものを極力排除するようにふるまっていると、 どうしても何事につけ必要以上に慎重かつやや否定的 (自虐的自己否定を含めて) になる。それはそれでまたアレだ。 基本的な (素朴な) 肯定はやはり必要なのだが、肯定しすぎてもダメなのだ。 いつも程度が重要なのである。 しかしどうしようもなくアホなものに対してはきちんとアホだと思わねばならない。むずかしいものさね。

で、それとは全然関係なく今日のトークであるが、「プロセッサは、 まだまだ先へ進むだろう」ということであった。たしか新山が大学に入ったころ、 ちょうど世間では Pentium とか 100MHz 台のチップがまさに華々しく登場したところで、 もう半導体のマイクロプロセッサは (周波数的に) そろそろ限界に来ているのだ、というようなことが (教授からも) まことしやかに言われていた。 ところで、南谷研の非同期プロセッサというのは一体どうなったんですかね? まだやっているらしい…。 しかしその後なにがどうなりましたか。いまや Pentium 4 の ALU 内部は 8.2GHz だそうですよ (コア部分だけ、全体のクロックは 4.1GHz)。そして、もはやこんなにデッカくなると、 電子が CPU の端から端まで (1センチぐらい?) 移動するのに 1クロックでは足りないらしいのだ。おまけに今や トランジスタが増えすぎて、やることないので、しょうがないから L2 キャッシュなんかを アホみたいにでっかくしている。これからどうなるのか、という話だった。 そして、そのおじさん (おじさんというよりももうオジイサンに近い、しかしとにかく元気である) が 言うには、まだまだやることが沢山ある、とのこと。挙げられたのは以下のようなことだった:

ぬどぬどです (などなどです)。よくプロセッサが速くなっているのは、 周波数を力ずくで上げているからだろうとか、とにかく集積度を上げているから だろうとか言われるが、それは幻想だと彼はいっていた。それは要素のひとつでしかないと。 マイクロコードレベルでの効率化が速度向上のかなりの部分を占めているらしい。 ようするに、技術的にまだまだやることはあるワケだ。

しかし、現在のアーキテクチャはほとんどインテルに独占されてるよなあ。 DEC も消えたし MIPS も消えた (そしてこの 2社はインテルと比べても 技術的にとても質実剛健なメーカーであった)。Sparc も事実上死んだ。 PPC にしたって、いつまでもつのやらね。Rob Pike がいっていたように、 MS だけが独裁者なわけではない。MS は手軽な標的だが、それはスケープゴートにすぎない。 似たようなやつは実際どこにでもいる。平和的和平解決。

(14:32)
妄執です
(15:08)
現在の /usr/local/bin/ はまだこれだけ :
$ ll /usr/local/bin/
total 7378
-rwxr-xr-x  1 root      56 Sep 29 13:27 MozillaFirebird*
lrwxrwxrwx  1 root      22 Sep 29 12:35 acroread -> /opt/Acrobat5/acroread*
-rwxr-xr-x  1 root      96 Sep 29 12:35 idle*
lrwxrwxrwx  1 root      26 Sep 30 14:07 jperl -> /usr/local/jperl5/bin/perl*
-rwxr-xr-x  1 root  202984 Oct  8 12:58 k*
lrwxrwxrwx  1 root      14 Sep 30 21:12 less -> /usr/bin/jless*
-rwxr-xr-x  1 root      81 Sep 29 12:35 pydoc*
-rwxr-xr-x  2 root 3654267 Sep 29 12:37 python*
-rwxr-xr-x  2 root 3654267 Sep 29 12:37 python2.4*
-rwxr-xr-x  1 root   18017 Sep 29 12:35 smtpd.py*
(17:14)
寝言を人に聞かれるとやばいなあ。

どうでもいいが、uniq が一行で書けることが判明した:

def uniq(seq):
  return dict.fromkeys(seq).keys()

uniq([1,2,3,1,3,2,3,3]) --> [1, 2, 3]
(18:46)
go figure

おでんが食いたいなあ この季節

でもそんなものはココニハナイノヨ
(いや、あればあるか、あのあたりには。しかしその証明を書くにはこの米粒は小さすぎる)

(21:47)
Everyone hates spam! but everyone loves SPAM!TM and no one knows about SMAPジャニ, so...

(ただ「ジャニ」というのを書いてみたかったダケデス)

「ジャニ」といえばたいていの人はなにを連想するのだろう?? たぶん janitor 、だな。

Oct 14 [Thu]


(08:16)
おはうよ
(09:09)
雨がふってる

ジャジャーーン!
(むかしの Windows 95 の起動音)

なぜか思い出したむかしのむじんくんの CM:

父「お前、一人や二人はいるんだろ?」
娘「いいえ一人もいませんわお父さま、なぜならそこは、♪むじんく〜〜〜ん」

どうということもなく今日も朝から狂っている

(12:33)
(def func: const lambda (x<int> y) WHERE /Ryumin-Gothic-BBB
 PRINT"PUSHRETURNEKEY";:$A=INKEY$(<>):B$=$A :- foreach (concat @x)
 ifre.match($A)=13THENDISPLAY>>SYS.STDERR;"YOU ARE PUSHED TO RETURN!":GOTO10(),
 endifelseif12.each{|d|`foo-is?(,y '%r' B$.__repr__(my d))})` % esac;;
dup 90 rotate showpage
(14:34)
いつぬまぬかマタお湯ガ出るようになったノネ。 新山は「未来は問わない人間」だるので、それがいつ出るのかとか、 どこにどれくらい出るのかとか、どんな味がするかについてはどうでもよろ。 だがしかし重要なのは、それが、「出る」、といふことなのだト。 だうでもいいけど漢字の「卜」とカタカナの「ト」を見た目で区別 (パータン認識的技術的に) するには どうすればよいのかしらぬ。これにする自然言語的な答えは 「つねにカタカナの『ト』を選んでおけ、そうすれば 99% 正解すっから」 というものであru。ようするに統計的言語処理というのは数を数えることだ名。
(16:45)
あっれえ? もうこんな時間? きょうはねむくならなかったぞ。たぶんそれはそれあhは
(17:56)
でんでん面白くなかった。どーぶりーーデーン、どーーーぶりーデーン!

まああれさ、あの、きょう実験で得られた結果について話し合ったのだけど、 まああれだ。その、あの、。

ヨノナッキブ!!

けんきう?にッシ

なぜカタ力ナにする必要のあるのであるか? …どうも英語だとあいかわらずうまくいかない、というそのこと (その現象自体、あるいはそれそのもの) の 現象なる原因は、アレが長すぎるためではないかという議論があった。なんだこりゃ? 「議論がある」って どうゆうことだ?? ばか。どうでもいいが、アレとは文章の長さである。はて、「長さが長い」。 もう疲れてますんで今日は俺は。はい。オレって。そしてそして文章の長さをミジどんにしたら (短かくしたら) 今度は結果がでない。とゆーか、よゆーか、そもそも元々はオープンドメインですよって言ってんのに 本当は IE可能 (IE-able) なドメインなんてそんなに数ないんじゃないの? あるうは (あるいわ) メジャーなものは ごく少々。などなど。ホント? か? しかしこれには追加実験 (どんなだ) をひつようとする。 それって。けれどもそれのほかにもうヒトツ実験を考えたガガががが。段落ごとにとってき。 て、それをクラスタリングすることによりて「どの部分がどの部分重要」的に発見風のこれまた打撲。 ゼッキョー。さうよねら

追金 (ついしん、、と打とうとして間違えた、新ゃ山は疲れているときはタプイミスをなおさない) n-best が出せてもあまりおもしろくはないき。つまらん違いばかりでてもね。あれじゃね。あれじゃ。

よろ。よろよろ、よろ。

これ、は、暗号です (文中のひらがなを素数個であるように取ってきて除去して残ったテキストを カタカナと共に縦側に組み合わせるとおそろしい事がおころる)

google://コテゴリー/ ((((((((((((((14件))))))))))))))

(18:13)
(/けんきゅうニッシ おわり)
(18:49)
この、フロア全体にただようポプコンのにおいが…。

さっき jas mart 買い物にいったらサザンの曲が流れており すっかり元気がなくなった (秋の夕暮れ時に流されると一層敗北感がただようのである)。 てくるで、新山が日系食料品店へいくと感じる脱力感にはもう一つの原因があって、 それは日本人のヘンな趣味を見せつけられることだ。とくに NY ではオッサンの日本人が 若造のようなカッコをしている (もちろん、これはオバさんにもあてはまるのだが かれらの場合は日本にもそんなのがいるので自動的にフィルターされるらしい)。 これがとても…アレですよ…てゆうか日本では若者でもいまどきあんな格好するだろうか?? 「ちょっと、お前、ソリャないだろ!?」と言いたくなるようなのが、いる。徘徊してる。生きてる。 なんか年齢とかそういう以前に基本的に「ヤバかっこ悪い」服装なのである。 あるいはあれは NY にいて日本だけでなしに韓国や中国の文化もヘタにとり込んでしまったために ああなるのだろうか。でも韓国人や中国人の男のほうが、あきらかに (ダサくても) まともな格好をしている。 オカシイのは日本の男だけだ。あれは、NY における一種の風土病 ( in 頭) のようなものだろうか。

(21:07)
また負けた。。。

てゆうかこらクリス! おまえだけなんであんなにスコア高いんだ! 今回の競争はだれも結果を検証していない。バグったまま事故深刻してもオッケーである。 オレはちゃんと検証プログラムまで作ってやってたのに。 くそー。しかしどっちにしろオレは勝てなかったと思うのだけど、 みんなソースコード公開すべきだろ。これじゃ追試もできねえ。

(22:54)
つかれましたですよ! もう!
(最後の「! もう!」の部分が実は疲れてなさを感じさせる、でもホントに疲れてんだよ、今日は、フントに)

フトン??? ??? ??

(23:49)
Python の定立とでもいうべきものを考え出した:

現存する、あるいは将来作られる複雑なソフトウェアの
基幹アルゴリズムのほとんどは、
1000行以内の Python で表現可能である。

これが意味するところは、つまりほとんどの解くべき (解けるべき) 問題というものは Python 1000行 に直せる程度のものだ (→ したがって、Python 使いのキミにも理解できる!)、 ということである (べつに Python でなくても、 たとえば Perl とかでもかまわないが、Perl でなにかを 1000行書いたところで なんか理解可能になる?)。少なくとも、あと 10年ぐらいはそうだろう。 このような信念を持っておくことは、新しい問題に取り組むうえで非常に重要なことだと思う。 というのは、何か新しいことをやらなければならなくなったときに 「うげ、こんなの難しそう」と思って最初からしりごみしてしまうのと、たとえ実際にやらなくても 「やろうと思えばやれる」とわかっているのでは、かなり差があると思うからである。 もちろん、だからといって楽観論にホイホイと向かっていいということにもならない。 が…いやしかし最初から諦めていたほうが人生いいのかな…。 日本人の同情を得やすいのは絶対こっち (最初から諦めるほう) だよ! しかしとにかく、この言明はいまのところ証明しようがないものであるので、 ここでは「定理」でなく「定立」と呼ぶしかない。しかしこれは本来のところは、 定立というよりもむしろ信心のようなものかもしれない。

(01:40)
あーあーわかったよ。ああもう。

てくるで (また来た!)、オレは… 書くこと忘れた。

てくるで (まただ!)、人間の思考活動の多くは空間的な推論によるものであると、 新山は思っているが、これは自分が「絵で考える」ことがもっとも多いためで、 というか、それ以外の方法では考えることができないためで、他の人もそうであるのかどうか 自信がない。しかし純粋に記号だけの推論ってあるんだろうか? 新山は、 記号的な推論をするときにも実際に頭の中では絵 (数式とか文字列とか) をあれこれいじっている。 「絵で考える」というと、じゃあ目が見えなければ推論は不可能なように思えるかもしれないが、 これは盲の人でも変わらないと思う。というのは、いくら目が見えなくても人間は 3次元上の空間で生活しているからである。いや、むしろ彼らのほうが空間的な推論に 頼っているんじゃないだろうか? 「あれがあそこにある」というのは、 おそらく目が見えなくとも具体的なイメージがあるはずだ。そういう路線 (どういう路線だ?) でいくと、新山が文章 (プログラム含む) に視覚性を求めるのはある意味当然のことといえる。 ここでいってるのはロジックが視覚的であることで、扱うデータが直接画面に表示されるか どうかは関係がない。s*k的言語の人々がいうような「視覚性」は、基本的にごまかしだと思う。

dkr???

Oct 13 [Wed]


(10:11)
やーい寝坊

pushd<br
popd<br>
cookd<Br>

オレたちは馬鹿どもだ!

(12:51)
メシを食っているとおくたーう゛ぃあんガ入ッテキテ、 「bon appetit に相当する日本語ってある?」と聞かれたが、 ないよね? 「どうぞ召しあがれ」みたいなのは、ちょっと状況が違う。 かわりに「いただきます」と「ごちそうサマ」を教えてあげた。 日本人でこれが言えねえヤツは人間として失格だからよ。
(14:12)
どーーーでもいーーけど PowerBook 12' は重すぎるよ! なんてこんなに重いいいんだっっ! ばか。
(15:36)
redhat をサーバとして使うってのはどっか神経オカシイ。 あ、うちのサーバもそうだが。
(18:24)
これは天然に存在する景色ではない・・・
(00:47)
またしばらくネットワーーアクが落ちていた。もうムカ。サポート呼んでやる。 でも、くるのは金曜の午後だって。あれ? 金曜じゃあ、ヤバいんじゃ…。

きょうもデータベースの授業が楽しかった。きょうは Byzantine Protocol についての解説。 これまた分散システムでは必ず出てくるのだが (この手の業績はほとんど Lamport の仕事だ)、 去年のぐりむ先生の授業をとったときには、新山はこれについてあまり詳しくわかっていなかった。 Byzantine Protocol とゆーのは、協調動作する複数のプロセスのどれかひとつに明確な悪意があって、 そいつがシステムを撹乱させようとしているが、ほかのプロセスは誰がウソをついているのかわからないような 場合に全体として正しい結果を出すプロトコルのことをいう。基本的にはこれは多数決システムと 似たようなものなのだが、ポイントとなるのは「お互いに 1対1でしか通信できない」というところだ。

そのご帰りに学生センタア (←超豪華建物) のトイレへ寄ったら、 またヘンな便所の落書きをハッケンする:

BUSH
SUCKS1

KERRY
 TOO2

VOTE NADER!3 ← SMART!4
あきらかに、これは上から何度も書き足されていったものだ。 色の違いは書かれた時期の違いを表す。最後の「SMART!」がちょっとウケたのだが、 つくづくバカだなアメリカ人って。
(01:07)
その後、帰ってから、怒涛のように明日の宿題のプログラミンgをする。 今回の宿題は「救急車問題」だ。こんなの:
碁盤の目状になった都市 (マンハッタン) の何箇所かに病院があり、
各病院は 5台の救急車をもっている。あるとき大災害が発生し、
街中のいたるところでけが人が発生した。かれらは決められた時間内に
病院へ搬送されなければならない。しかし 1台の救急車に乗せられる担架は
1度に 2人分までであり、担架の出し入れにはそれぞれ 1分かかるとする。
また、救急車は市内を 1ブロック/分の速度で移動する。災害発生時の
患者の位置データが与えられたとき、これらの患者をひとりでも多く救うためには、
どの病院の救急車がどこへ駆けつけるようにすべきか? 計算に使用できる時間は 2分間である。
より詳しい問題設定はこちら

とりあえず構想 (これは電車の中で) に 1時間、プログラミングに 1時間、デバッグに 1時間かかった。 今回もとーぜん全探索はムリなので、なにかてきとうにヒューリスティクスをみつけ出さねばならない。 まあ、コード (とその説明) はほとんどできたので、これであとは明日てきとうな経験則を 調整すりゃあいいやな。今回も Kitkat はムリだろうか。公平を期すため、計算はすべて同じサーバ上で行われるのだが、 やはり遅いマシン (Sun) では Python は激遅いんだよ、まったくもう。

しかし、むかしは Sun っていえば速いマシンのはずだったのに、いまやすっかり過去の話になってしまった。。。 まあ、いまでもクラスタ組ませれば速いんかもしんなけど、もはや一台ダケ買ってもニオイをかぐことぐらいしか やることがないゆおね?

(01:19)
キン コン こn

てくるでこんどの土曜日に Columbia に Marshall McKusick (FreeBSD 界隈の有名人) がくるらしいぞ。 NYCBUG にそう書いてある。

Oct 12 [Tue]


(08:49)
言うまでもなく、新山はロマンチシスト (あるいは妄想癖) である。 そうでなきゃわざわざ博士号とりに行くわけがない。屈折してるけど。

ひゃっほu!

(09:42)
おさわやかに!
(10:59)
オヤ? 今日は切れないぞ?

** 実行中の端末にうっかりタイプしてしまった文字をキャンセルする方法 **

時間のかかるスクリプトを (どこかの端末で) 実行していて、 ふいに場所を間違えて ^P Enter などと打ってしまったとする。 ふつうこれはバッファされるので、これではスクリプトが終わった直後に (Bash の履歴機能によって) もう一度同じスクリプトが実行されることになってしまう (そのスクリプトは出力をリダイレクトしているので、 結果がすぐに上書きされるものとする)! うぎゃあああ! どうすりゃあいいんじゃ!

…というときは Ctrl-Z を押しましょう。 これで一回プロセスを端末上で suspend するとバッファが消去されます。 このあとまた fg で実行再開すりゃあいいんです。はい。

(11:39)
それにしてもさあ、せっかく気を遣ってメールにしたのに、バラしちゃうんだもんなあ。 ぬんてことだ!
(12:29)
オヤ? 今日は切れないぞ??

どうも昨日の実験がうめくいかなかった理由は英語の語尾変化にありそうなので、アンチョクにも Porter の stemmer をとってきて使ってみる。 すでに Python バージョンがあった。コードはださいけど一応動く。

(15:11)
オヤァ?? 今日は切れないぞォお?????

(場合によっては切れてほしい予感)

ミーチィンぐね。まーったく、どうしてあんなに説明が下手なんだろ。 というか、そもそもが、以下略。まあいいや。あんなのが毎週あったらやだな。

ところで、てくるで、あいかわらず実験うまくいかん。ヨクミタラ LREC じゃなかったね、論文ん

(17:08)
あああもう (牛) また落ちてたじゃねえか馬鹿やるお。
クンコク (訓告) ! クンクク (訓告) !
(01:09)
うげーーーーーーーーーーーーー。酔ってる。いま大学。トイレ寄りに。 これから nj に帰らなきゃ。あーめんどくせえええねええああああああ。 このままオフィスで明日まで寝ちゃおうかな。でもそんなことしたら絶対航海するからやんない。 帰るぞ、もう (牛)。

今日のトークはこれの開発者だ。いや、すごいよこれ。

http://jfli.sourceforge.net/

(02:30)
ようやく帰ってきた。いまは記憶がはっきりしているが、 電車の中ではほとんど眠っていたので意識がなかった。 それにしても喋りすぎてノドがいてえ。 酔っぱらうとほどんと聞きとれないのに、こんなに喋っていたとは 我ながらオドロキである。

今日は lispnyc の主催者である heow というあんちゃんと意気統合? してしまった。 「お前はオタクなのか?」「ああそうだよ」「オレもだ! (握手!)」というぐあい。 しかし新山は自分がオタクであるとは思うが、「平均的なオタクと差をつけるべく努力している」と 言っておいた。平均的なオタクとは何か? 思うに、たいていの日本のオタクは虐げられているのだが、 そのうちの何人かは自分をわざとオタクっぽく見せなくするために、本来大して好きでもない ファッションに凝ってみたり、映画や音楽について興味があるふうなそぶりを見せたりするのである (そしてそういうのは端からみていてとてもイタイ)。しかしオレにいわせれば、 浅い方へ動くのは簡単なのだ -- 新山はむしろ、ますますオタクっぽくなる方へ 向かうことによって差をつけようとしているように思える。といっても、こうなったのは米国に来てからのことだ。 はっきりいって新山のような根がオタクっぽい人間が米国に来て唯一学ぶべき強力な メッセージは何かというと「未来永劫オタクのままでいいんだ!」ということであった。 もちろん、オタクのままでよいといっても、人生は得なければならない (get a life)。 挨拶もできないようなヤツはここでは論外である。ここでいう「オタクっぽい」というのは、 アニメオタクとか、そういう非生産的な (断言!) オタク消費者のことではない (とーぜんプログラミング言語をネタに飲み会ばっかやってる人々のことでもないぞよ)。 こっちでは大学教授や企業の技術職はみんなオタクである。 日本の大学教授も元々はオタクであった風を感じさせる人々だが、 かれらは世間に叩かれたあげくすっかり勢いがなくなってしまっている。しかしこちらの教授連中は そうではない。そして、企業でもそうだが、こちらではオタクが堂々と上のポジションにいて バリバリ現場仕事をこなしている (あくまでコンピュータ関連の業種を見たかぎりでの印象、他は知らない)。 つまりここは「オタクが必要とされており、その貢献がきちんと評価されている国」なのだ。 このような傾向が (計算機科学における) 米国の技術発展を支えているのではないかと思える。 もちろん日本でもオタクは必要とされているが、表向きはみんなオタクなしでやっていけるような ふうをよそおっており、いつかそのツケを払う日は来るであろう (いつになるかは知らないが、それとももう来ているのか?)。 中国でさえ日本よりはまだそういう傾向がましなような印象をうける。 そう考えると、日本からマトモな仕事が一向に出てこないのもうなづけるし、 日本がさしずめ「文系の連中にいいように搾取されてる国」だというのもわからなくはない。 ま、ここでこんなこといったって何も変わらないんだけどさ。

(03:44)
いやーー、オレこんな時間になに熱く語ってんだろうなあ。ねむいのに。 もうバカだね! ただのバカただのバカただのバカただのバ

Oct 11 [Mon]


(08:24)
ダジャレだ〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜
ダジャレ王国!!
(09:39)
きょうは風がつよい。またネットワーク接続が切れたらしい。 まあたかが家庭用向けプロバイダーに四六時中 24時間切れるな、というのは ここでは無理な話だとわかっているのだが。
(10:02)
出るクイは引っこ抜く。
出るファイは引っこぬかれる。
アリクイは蟻食。

またもや (まあ此の場合は“またもや的”ですが) ニベアが手放せなくなる季節になりました最近はもう
そうですまたもやですが、ぞもぞもなぜ肌は荒れるんでしょうね?

肌荒れと海が荒れることにはなにかしらの共通点があるのか。
だから「荒れる」と呼んで (呼ばれて) いるの
か。それはだからそれはそれはz.

ぞもぞも

(12:40)
今週のころきあはこれ。
Friday, October 15, 2004 - 11:30 a.m.
Room 1302 Warren Weaver Hall
251 Mercer Street
New York, NY 10012-1185

Speaker: Yale Patt, The University of Texas at Austin
Title: The Microprocessor of the Year 2014: Do Pentium 4, Pentium M, and Power 5 provide any hints?

あした: 13:00 からうちのミーティング。 19:00 から LispNYC 。

木曜日: 13:00 からセキネミーティング。

(13:45)
本日 (ほんづち) はコロンバス・デーだが大学的にかくも休日ではなき。
だからどうした? でも他の人々はみんな来てないので (Ralph はきていたが) 新山もこれからヒルネしちゃうぞ云々。来ててもするけど。15分。5分5分。かけて25分。
== 45分。分? 時間?? うん、うん、そうそう。
(15:03)
また大々的に落ちてやがったチクショウ。 1時間に一回ぐらいはおちてるような気がする。 ラーメン大大。まあそれはそれとし。

て。

docstring の英語でなにか言うことあったと思ったけdo忘れた。

ああそうだ。 「docstring の動詞は 3認証 (third-authenticative) にするのがいいのか否か?」とゆうことであった。 たとえば以下のようなコメントで:

# tokenize
def tokenize(s):
  '''Splits string s into a sequence of primary tokens.'''
  w0 = ''
  for (w,z) in TOKENS.findall(s):
    if w0:
      yield w0
    if w.endswith("n't"):
      yield w[:-3]
      w0 = w[-3:]
...
ここで "split" は命令形 (原形) にするのがいいか、叙述 (3認証) にするのがいいのであるか? Python 付属のライブラリを見てみると、ほとんどが原形であるが、たまに 3認証にしているやつもある。 これは、どう違うのだろう? 感覚的には、なんとなく、たとえば "Return the value." と 書いてあれば「値を返します。」という週末的(?) な様態 (aspect) であるが、 3認証で "Returns the value." と書かれていると、 これは直前に主語があることを感じさせるので 「値を返します。」といった雰囲気の様相 (modal) を呈して来るるる。 まあ、実際は、どっちもどっちでもないのだが。いんちき!
(15:38)
おもろしいサイトをおそわった:

http://rafb.net/paste/

(19:58)
ふんげあ。きょうは午後ずっと落ちていたらしい。 さすがにアッタマにきたので Comcast に電話。 すると「ただいまあなたの街でメンテナンス工事中 *かもしれない*」とのこと。 ざけんな。明日も問題が起こるようなら来てもらうことにして、 とりあえず今つながってるのでガマンする。 たしかに日中に起こるあたり、メンテナンスっぽくはあるな。 それにしても事前にアナウンスぐらいしろよ! あいかわらずこの国のインフラはひどい。
(20:29)
さふいえば、今日ひさびさに Wikipedia 日本語 を 見てみたのだけどさ、なんか、つまんなくなってた。見た目は「ちゃんとしてそう」に見えるのだが、 ようするにこれは無意味に規制が増えて硬直化してしまったように思える。 まあ、こういう全員参加型の作業ではよくあることだが、 という流れになっているのだ。似たようなことはメーリングリストでも起こる。 とくに日本ではこういうことが多いような気がする。おまけに根っからの 規則好きな人々なので、誰もこの傾向に待ったをかけられない。つまんないよなー、 こういうのって。「アホを追いだしつつ、面白さを保つために適度にルーズにしておく」というのが、 新山もふくめて日本人は非常にヘタだ。 たぶん完璧主義がそうさせるのだろう。 「臨機応変に (ややルーズに) 規則を適用する」というのを集団でやっているのを見たことがない。 これをやるには、結局個人ひとりがその場を仕切るしかないのだ。 なんか、日本ってガチガチの法家の国だよね。いったん規則をつくったら何がなんでも 守らなければならず、おまけに 100% 平等主義なので、例外はいっさい認めない。 韓非子が生きていたら泣いて喜ぶだろう。

そのてん、こっちの ML なんかだと、みんなそのへんはよくわかっているように見える。 たまにフレームが起こることもあるが、そういうときはたいてい「まあまあ落ちつけよ、人生そういうこともあるさ」 という内容のことを誰かが言う。それでもまだ騒ぎつづけている奴がいると、モデレータの Peter がスレッド終了宣言を出して強制的に終わらせてしまう。それでも誰も文句をいわないし (これは彼が人格者なためもあるが)、みんな引き際をこころえてるよな。 アホみたいに規則に固執するやつがいない、というのは、いいことのようにも思えるが、

(以下りゃく)

(21:02)
さいきん (最近)、とても健康的 (けんこうてき) なせいかつ (生活) をおくっ (送っ) ている。 健康的すぎてヘドが出そうなくらい健康的だ。 ("too healthy to hedo")

これじゃちがうじゃん。

(21:39)
キク科であることは確実なのだが。。。
(23:53)
ぼくは
このごろ
ふしあわせ

(ぼこふだ)

声が割れています。

(ひさびさの!) けんきゅう日誌
けふは似たような話題を扱ってる記事のクラスタを獲得しようと思い、 セキネ・ノヴァタ論文の追試を英語でやってみたのだが、うまくいかねー。 記事中から固有名詞とストップ語を全部とっぱらって (といっても英語だったから 単に capitalized 語を除くだけ というお手軽さ)、 敷居イング (thresholding) してみたが、なーんか、ダメ。 そもそも元の論文にやり方があまり詳しく乗ってなく、ただ Dice coefficient を 使った、としか書いてないのだが (LREC だから、手続きそのものよりも資料が重要なのだ…?)、 本人に尋いてみても「いや、実際たいしたことやってない」とのことで、 なーんも考えずに dice coeff. をとってみたのだが、どうもアレだなー。 もしかしてこれは seeds の選び方がマズいということだろうか?? とゆうのは、新山は「とくにドメインを指定せずになんでもイケイケ主義」という 方針でやってるために、ほんらいとってもクラスタになりそうにない記事まで 余計に種にしてしまっている可能性があるのだ。ま、なんにしても、 なんか隠してる見落してる可能性もあるので、あした尋いてみよう。
Yusuke Shinyama