2005年 10月 (1)。

Last Modified: Tue Oct 11 08:12:32 EDT 2005 (10/11, 21:12 JST)

Oct 11 [Tue]


(08:12)
あのー。何かが激しく違うように感じるのはボクだけでしょうか?

しかし、それが何か言えない時点で終わってい
る。

Oct 10 [Mon]


(15:44)
ゆうべ久しぶりに emerge -u world して 今朝リブートしてみたら立ち上がらねえ。くそったれ。 今日はこれの原因追求で 2時間ちかくつぶれた。

ところで、日本ではあまり知られていない家具メーカーの IKEA だが、 こっちの人間は IKEA のことを「あいけあ」と発音するが、FAQ によれば 「アイケア」と呼ぶのは間違っているそうな。

(21:10)
きょうのノルマ (ノルミィー) 結果:

あしたのノルマ (のるミスト):

(23:47)
呪われたキーワード。 いま、

google://人間として終わって/

を検索した途端、部屋の電気が

- + ぷっつん + -

…約1秒間だけ。しかし当然のように計算機はもたず。e2fsck。 (自宅はまだ reiserfs じゃないのです、なぜならいまだに RedHat 7.3 だから!)

くそーーーー。ぜったい UPS を買ってやる。

(00:21)
世の中には 2種類のシャイな性格がある。 ひとつは“根っからのシャイな性格”で、もうひとつは“計算されたシャイな性格”だ。 思うに、日本人は (海外では) シャイである、などと言われるが、 実際には根っからのシャイな性格というのはどの民族でも割合はほぼ同じだと思う。 かわりに、日本では「計算しつくされたシャイ」が多いのである。 しかし、そういう計算はたいていどこかでぼろが出るもんだ。
(01:43)
ブックレビュー: Perl Best Practices (NewsForge)
日本語訳: NewsForge がダミアン・コンウェイ氏による『Perl Best Practices (Perlの規範)』をレビューしている。 「『Perl Best Practices』 は“パラパラめくる (ブラウズする)”のに向いた本である。 10分かそこらの時間があるって? 本書のページをランダムにめくって、コンウェイ氏の書いた 2、3のガイドを読もう。 本書の中でコンウェイ氏もいっているように、ほとんどの人は自分が正しいと思っているスタイルを確立する。 こうして身につけた習慣はこわすのが難しいので、きちんと座って、最初からストレートに本を読んでいくのは あまり利点がない。むしろ一度にすこしずつ規範をみにつけて、(必要があれば)それらの習慣をなおし、 前に進んでいくのがよいのだ」

この本、Perl だけど作者のいってることはまともだな。読んでみようかな。

(02:23)
いまふいに思いついた「盆栽言語」という考え。 実用にはならないが、ミニチュアとしての美しさを楽しむためにある言語のこと。 新山の知っている代表的な盆栽言語は Scheme と ML だ。 盆栽言語はそのシンプルな審美性だけが売りなのであって、 やたらと拡張した盆栽言語などは本来の美しさを損っており、したがって本末転倒もいいところである。 盆栽言語はプログラムを味わうための言語なのだ。 「8-queen をつくったよ!」「おおー…いいねえ…この map の使い方…」 などと見せっこするのがいいのである。 「生産的な Scheme プログラミング」などという表現は 「盆栽を砂漠に植林しよう!」というのと同じくらいバカげている。

Python もまた、やや盆栽傾向のある言語である。 共通するのは「優雅」ってことだ。 でもまだ Python は辞書とかがあるから多少効率主義の匂いがする。 ほんとうに優雅にやるならやはり Scheme で配列も辞書も使わずに、 cons と alist だけでちまちまやるのがいいと思う。 (cons と閉包で B-tree を実装するというのも味わい深い) ハッシュテーブルとか socket とかの汚ないモンは CommonLisp にくれてやればいいんだ。

Oct 09 [Sun]


(14:42)
きのうほど悪い天気ではない。

きょうの空はどよーんと曇っており、かすかに霧雨のようなものが ふっている感じがする (かもしれない)。五番街を通ると ESB は 下のほうしか見えておらず、遠くはまっしろで見えない。 オレはこういう天気が大好きである。なんだか微妙にあの世っぽい景色だからかもしれない。

(17:33)
やべー。やべーよ。このやばさ!

…とぞ思はむ。

(21:12)
天気予報に告ぐ:

きょうがサムかったからって、明日から一週間の予想気温をいっせいに下げるなよ、ベキャロ!

明日やること一覧。あすなろ (って書くとなんか微妙に弱気な雰囲気 (←←ふいんき)):

(22:56)
ふと、イヤなことを思い出してしまい落ちこむ。 秋になるとときどきこういうことがある。といっても、秋は好きな季節だが。

こういうときはどうしようもないので、 なにか書いて気を落ちつけるしかないわね。 といってもそんな個人的なことをここに書きつけるわけにはいかないので、 たいていは非常に! 婉曲された! 歪曲された! 言いまわしを使うことになるが。 多くの抽象的な意味不明的な文章はこうして生まれる。 というのは、それは結局のところ「自分のせい」であるからで…。

まあ、あれは誰んな (=どんな) 人にきいても、10人が 10人、きっと 「そりゃ新山が悪い」と言うだろうな。 友達 10人もいないけど! (≒ 自虐的。)

てくるでニュウ・ヨーカァーが "VPN" のことを何て呼ぶか知っているかっ。 「う゛ぷぉん」だ。「う゛ふ゜ん」ではないぞ。「う゛ぷぉん」なのだ。 ウソはここまでにしておいて、いやこれからも続くけど、 アメリカ国には URL のことを「ぉあ〜る (ur を“ぉあ〜”とそのまま発音する)」 と呼ぶ人が本当に存在する。あと "vi" を「う゛ぃー」って言ってるのもきいた。 あと "ftp" は「ふとぷ (ウソ度 50%)」。"dtd"は「どとど (ウソ度 80%)」。 "pygame" は「○゜○○゛○ (ウソ度 100% のため検閲しました)」。などなど。

死にたくなったので、自分の身体を賽の目のようにこまかく切りきざんて味噌汁にいれる。 この世界では、オレは豆腐だ。しかし問題は、この味噌汁をいったい誰が食うのだろうということである? みそりす (味噌リス)? みそるし? mssr だね、とにかく。MSSR つ USSR ぬ缶食いゑ現在之所不関係。ぞんぞん違。

てくるで、こんなことはどこかの SF ではもうとっくに書かれているだろうが、 デジタルな情報を何億年にもわたって保持しつづけるメディアとして、DNA のほかに 言語がある。そういえば何かバクテリアの DNA の塩基配列を 2次元にプロットして、 じつはこれは宇宙人が残していったイメージなんではないか、といっていた 学者がいたなあ。これはなかなか賢いと思う。しかし、同じように、言語にも (少しずつ変化はすれど) 似たような機能があるはずだ! したがって日本語を詳しく調べれば過去に宇宙人が来た形跡があることがわかるのである! 電波、電波。

今日はオレなんでこんなこと書いてんだろ? しかし、あにはからにゃこのページは本来こうゆう事を書くための ページなのであ
る。甘くみてはいけない。こうゆう事ってどうゆう事? それはお
前のセリフ

だ!

(暗転)

(23:30)

てくるで、秋といえばビッグバードだが、

と、 と口にだしていうのでは、前者はなんでもないのに、 後者はどうしてもニヤついてしまう。発音が同じだと? バカヤロウ! 改行が入ると違うんだよ。それに漢字が入っても違う。 こういうことはちゃんと区別できないと困る。 吉田戦車だってカタカナ様の日はカタカナで喋らないといけないと書いている。 ちなみにフォントが違っても違うね。 ふだん新山は丸ゴシック体のような声で話すが、ときどき極太ポップ体になることがある。 そしてある日わたくしはリュウミンライト-KL (1600dpi相当) で話す美しい女性を見たのです…。 となると私小説的になるね (いや、ぜんぜんならない)。 ちなみに、たぶんジャイアンはきっと Osaka 9ポイントのビットマップを 3倍に拡大したようなギザギザ声で話す:

…と、いうことをいま考えてあまりにウケて一人で大爆笑していたので、 思わずここに書きつけておく。

Oct 08 [Sat]


(13:29)
外に出ると、雨のにおいがした、
外に出たら、雨のにおいがした。

かうもの: せんざい。

(16:24)
今日は一日中暗かった。。。 (心理的にではなく、物理的に。雨がふっているため)
(23:09)
いろいろ書きたいことがあったが、それらはすべて 1バイトに圧縮されてしまった。

忘れることと圧縮することはどう違うのだろう?? それらはみなおなじだ。おんなし。

(02:15)
すでに一度床についたのだが、考えているうちに目がさえてしまったので、 のこのこと起きてきて書く。

テクノロジー、こと計算機に関する言説のなかで一番気にいらないのは、 これが「人間の能力を高め、拡張してくれる」というような考え方だ。 たしかに、一部の人々についてはそうだろう。計算機はおそらく 障がい者や、情報を得にくい人々の生活を助け、いい意味で向上させるだろう。 実をいうと、新山がほんとうに興味のあるコンピュータの使いみちというのは それしかないといえる。しかしこれらの機械が、人間のもともと持っている欠点、 たとえば軽率な判断や、ケアレスミスや、差別や偏見まで消してくれるというのは大きな間違いだ。 どうも、そのことに気づいてない人が多すぎる。

オレも気づいていないけどね!

Oct 07 [Fri]


(06:18)
なぜか意味もなく早起きする。

研究者になることの是非について。 おととい、去年 5月まで NYU の学生だった OB と話したのだが、 彼は久しぶりに NYU の授業をうけて「学生な感じ」を味わい、 非常にエキサイティングだったという。そんなもんかね。 新山はまだ一度もまともな社会人になったことがないので、 社会人の側から見た学生の印象というものについてはっきりしたイメージがない。 まあ、でも、おおむね「怠け者」というふうに見えるんじゃないかな、とは思う。 実際、そうだし。少なくともオレに関していえば確実にそうだ。 でも同時に「学生はひたすらアホなことに挑戦できる」というイメージもあるらしい。 で、やっぱりまともな研究をするんなら企業の研究所に就職するんではなくて、 大学などの機関に就職したほうがいい、というのだ。 ここでいう「まともな研究」というのは「十分にブッとんだ研究」というくらいの意味である。

そうなのかなあ。実際には、オレ自身は企業の研究所にもべつに興味はないので その可能性を考えたこともない (それに、企業の研究所の採用は年によって かなりバラつきがあるらしいから、運が悪ければ働き口があるかどうかもわからないそうな)。 しかし大学に就職したらしたで、たとえ新山が米国のもろもろの欠点 (飯がマズイなど) にすべて耐えられたと仮定しても、研究者になってほんとうに「十分なキチガイ性」を 確保できるのかどうか、あやしいのである。いまはまだ自分で自分のことを 「それなりにキチガイ的」と思っているが、もしかすると、大学に就職したら自分はすぐに 「フツーな奴」になってしまうんではないか (はっきりいって、たいていの研究者は 「フツーな奴」だ…彼らは事務的に研究しているだけであって、とりたてて面白いわけでもない)。 そして、「どこかの大学かなんかでのうのうと生活している自分」というものを いとも簡単に想像できてしまうのである。 たぶん、新山は環境をキチンと整えられて「さあ、研究しなさい」といわれて できるような体質ではない、と直感的に思う。抑圧が必要なのである。 もって生まれた貧乏症というか。 なんの悩みもなく、ただ自分の研究に向かって爆進しているという自分の姿は ちょっと想像できない。新山の場合だと、たぶん悩みがなくなったら、 研究もしなくなるだろう。それに「なんとなく研究者になる (なってしまう)」というのが嫌いである。 人生には選択が必要である。 このまま職業研究者になっても、「なんとなく」感から抜けだせそうにない。 そのためにも一度、研究的なものからきっぱり離れてみる必要があると思う。 それで戻ってこれないようなら、そもそも自分は最初から資格がなかった。

もちろん米国も食い物という点では 非常に抑圧されているのだが、ここで言っているのとはちょっと違う。 なんらかの生涯にわたる研究テーマがあるとして、もしちょっとの障害で 研究ができないとダダをこねるならば、そんなものは最初から生涯の研究テーマでも なんでもなかったのだ、と思う。新山はそうしたテーマをひそかに決めているが、 まだほとんど人に話したことがないし、まだ非常にぼんやりしたものなので、 そもそもそれが本当に (たとえ一部でも) 「ものになる」かどうか 正直いってまだ自信がない。そして、これまでの経験だと そうした問題というのは、すぐに全力でとりかかっても解けるというものではなく、 すこしの間、自分の中で「遊ばせておく (あるいは発酵させておく)」のがいいらしい。 それで本当にものになりそうだということがわかれば、 そのときは職業研究者になってもいい (なれれば、の話だけど)。 それが何年間かかるのかわからないが、その間つねに問題を意識していれば、 いつかはっきりその形が見えてくるようになることもあるだろう。 こんなのはひどく幼稚な考えといわれるかもしれないけど、 これがダメだったら、研究者などという他人様の資源をムダ使いする職業には 就くべきでないと思っている。(新山はまだ PhD をとってないからエラそうなことは言えないが、) たとえ PhD をとったからといって、自分が研究者としてやっていける資格があるとはまったく思わない。 ほんとに研究者としてやっていけるかどうかの基準は、他人に決めてもらうのではなくて、 自分のなかにしかないのだろう。たぶん。 まあ、こういうふうに思えるようになっただけでも、留学する価値はあっただろうね。

てくるで (ところで)、「資格」ってのは誰が決めるんだろう?

(追記) いわゆる「職業研究者」の中には、出世街道を気にする方々がいる。 つまり「どこそこの大学の教授になれれば本望」というような目標をもつ人々が。 名より実をとるタイプの新山としては、こういう動機はサッパリ理解できない。 べつに偉くなったからといって何ができるようになるわけでもなし、 雑用が増えるだけのように思える。研究費がたくさん使える? といっても、分野にもよるが、ほとんどの研究はそんなに大量のおカネは必要ない。 ボス顔をして威張りたいという欲求も理解不能。とにかく理解不能。

(15:11)
きのうの state-of-the-art な自然言語処理技術の一のつづき。 その後の改良により、さらにプログラミが簡単に、しかも精度が向上しました! いまや USA Today にも完全対応!
TRIMPATS = [
  re.compile(ur'^.+ (-+|\x97|\u2014) [A-Z`"]'),
  re.compile(ur'^[A-Z][A-Z][A-Z ]*, [A-Za-z\.]+\. [A-Z`"]'),
  re.compile(ur'^\([^\)]+\)[^A-Z`"]+[A-Z`"]'),
  ]
def trim(s):
  s50 = s[:50].replace(u'\xa0',' ')
  for pat in TRIMPATS:
    m = pat.match(s50)
    if m:
      return s[len(m.group(0))-1:]
  return s

(注: 一日じゅうこればっかやってたわけではない)

しかしオレは、米国の国家予算により行われたこの研究成果を こんなところにやすやすと書いてしまっていいのか、ということに対して、 罪悪感なぞまったく感じない。さてこれをもとに論文でも書くか。

それにしても Java はなんでこんなにバカメモリを食うんだバカヤローーー

(17:38)
なあ、ふつう fopen したら返り血チェックすんのは当たり前だろ? ヤツのプログラムはどうあっても使いたくないな。 しかし、考えてみれば、他人が書いた自然言語処理のツールで 「これは使える!」と思ったものは今までの人生のうちひとつもない。 ひとっつも。これは何かどこかで重大な誤算があるようの気のするである
が、そんなことはもはやどうでもいい。
(21:47)
いやーー、ブッシュはほんとーにスゲエわ。神だね! (笑いの)

ブッシュ、「神がイラクとアフガンを侵攻しろと言われた」

日本のマスコミでこのニュースを伝えるところは何紙あるのか?

Oct 06 [Thu]


(12:36)
ふんげあ。ひどい夢だった。どこかの学会発表で、 自分のノートパソコンが動かなくなるという最悪の事態が起こっていた。 起きてからしばらく「あ〜、夢でよかった」と思はめ。
(13:57)
きょうは自然言語処理の最先端技術の一をご紹介しましょう…。

いま、あっちこっちの web から (英文の) ニュース記事を集めているのだが、 新聞によっては、最初の 1文に記事のクレジットが入っていることがあり、 これが構文解析をミスらせる原因になる。たとえばこんなかんじだ:

(CBS/AP) Jessica Simpson and Nick Lachey are ...
FORT BRAGG, North Carolina (AP) -- Three people who taught ...
LONDON, Oct 6 (Reuters) - British Prime Minister Tony Blair said ...
MEXICO CITY, Oct. 5 - Federal prosecutors in New York ...
WASHINGTON -- The Bush administration is beginning ...

新聞記事の最初の 1文というのは、ふつう非常に重要なことが 書いてあることが多いため、これをとり逃がすわけにはいかない。そこでこのようなノイズを あらかじめ削除することが必要になる (、ということがわかった)。 しかしこれはどの記事にも現れているわけではないので、下手に切りすぎると以下のような文に支障をきたす:

Both groups -- DeLay's and Blunt's -- were ...
このための超ハイテク・最先端技術ともいえるプログラムを開発したので ここにサラしておく。コレじゃよ。
import re

PATS = [
  (re.compile(ur'^"'), False),
  (re.compile(ur'^[A-Z][a-z]+ +[a-z]+'), False),
  (re.compile(ur'^.+( -+ | \x97\xa0| \u2014 )'), True),
  (re.compile(ur'^[A-Z][A-Z ]+, [A-Za-z\.]+\. '), True),
  (re.compile(ur'^\([^\)]+\)[^A-Z"`]+'), True),
  ]
def trim(s):
  s50 = s[:50]
  for (pat,trimmed) in PATS:
    m = pat.match(s50)
    if m:
      if trimmed:
        return s[len(m.group(0)):]
      else:
        return s
  return s

関数 trim() には最初の 1文の文字列 (unicode であると仮定している) を与えると、 その最初のクレジット部分をトリムして返す。いまのところ正解率は 98% ぐらいである。 ちゃんと測定してないけど、たぶん。でもこれは米国のメジャーな新聞にしか通用しない。 変な unicode 文字 (―) が入っているのは ABCNews やロイターの記事がダッシュに そういう文字を使うためだ…。

いやーーーー自然言語処理ってほんとうにサイエンティフィックですね!!

(追記) この分野でムカつくことのひとつは、このようなアドホックなアプローチをとっておきながら、 数パーセントのエッジケースに対しては「複雑すぎるから無視」という態度をとらされることだ。 本質的に「マイノリティは切り捨てよ」という立場なのである。 このやりかたに嫌悪を覚えない人がいようか (いや、ない)。 これはエラー処理やセキュリティの考え方 (少数のエッジケースにこそ注意を払う必要がある) とは 正反対だ。このため自然言語処理に結局なにが起こっているかというと、 「むずかしいから」といっていろんな部分をだんだん切りすてているうちに、 最後にできあがるのはまったく使えないガラクタになっている。 切り捨てたところに実は何か重要なものがあったんではないのか? と考える人はほとんどいない。

(14:40)
おい、抹茶フラペチーノの液体をぜんぶ吸い出してしまった後、 中身のクリームをストローでどうやって食うんだ?? だれか田舎者のオレに教えてくれ。
(15:04)
ハイボッキブなことに、 日本の省庁なのに「Ministry of Internal Affairs and Communications」が日本語に訳せなかった。 しかも訳語の「総務省」を見ても、そんな省があることすら知らなかった。
(18:01)
ぬぬぬ、こんなメールが転送されてきた。 さいしょは「なんでケーサツが大学院生に用があるんじゃ…」と 思っていたら、NYPD じゃなくて NYPL だった。 一体何のイベントだろう? しかしタダ食させてもらえるならどこにでも行きまっせ。
GRADUATE STUDENT  RECEPTION & ORIENTATION@ NYPL
Trustees' Room (206, 2nd floor)
Humanities and Social Sciences Library,
Fifth Avenue and 42nd Street

The New York Public Library Research Libraries cordially invite you to join
us for drinks and hors d'oeuvres, and to meet fellow graduate students from
other metro-area schools. Learn more about the rich and unique collections,
the scholarly opportunities and services available to you in one of the
world's great research libraries. Please see below  for RSVP details.

Tuesday, October 18th,  6:00 PM - 8:00 PM
Thursday, October 20th, 3:00 PM - 5:00 PM

まあ、正直にいって、ニューヨークではこういったレセプションから、 あっちこっちの大学やら美術館での講演やら、ワークショップやら、 「好き者のためのイベント」が毎日のようにそこかしこで開催されており、 そういうところは結構好きだ。情報収集を熱心にしていれば、 こういうところで沢山のことが学べるだろうし、知り合いもできるだろう…。 もっとも新山はヒキコ森なので、ぜんぜんそんなことには熱心ではないけれど!

どうでもいいけれどオレは Guggenheim の会員になるべきかどうかについて、 いまだに迷っている。いちばん安い位の "Friends" という会員 (会員には、出すカネに応じて、いろいろ階級がある) になると、 学生は年に 5回以上行けばモトがとれるわけよね…。でも、そんなに行くかあ?

(20:31)
あーー。帰ってきてから実はテロ警告が出ていたことを知ったが、 そんなもんいまさら何にもならん。 「ひさしぶりのテロ予告じゃな、ワハハハ」とでも言えばいいのか。

Oct 05 [Wed]


(10:20)
そしてまた寝坊した。…ウンターネット
(11:29)
Python の「なんでも名前空間にする」という考えは気に入っているが、 関数内で定義された辞書的変数 (この呼び方、なんとかならんのか) にアクセスするときには この概念が崩れる。関数は名前空間を構成しないので、関数内で定義された変数は ふつうのドット表記でアクセスできないのである。 辞書的変数が導入されたのが 2.2 からで、比較的遅かったせいもあるだろうけど、 いっそのこと辞書的変数も階層的な名前空間にしてしまったらどうなのか、と考えた (Python内部ではぜったいそうしているはず) :
def f():
  x=1
  def g():
    f.x = 2
    return
  return x
このように、g() 内から f の変数 x に対して、 f.x でアクセスが得られるようにしたらどうか (現在の仕様では x は参照のみ可能で、代入はできない)。 ただしこの場合はちょっと注意が必要で、f.x へのアクセスが有効なのは、 関数f() の内側からだけである。f() がまだ実行されていないうちから f.x にアクセスすることはできない。しかし f() がジェネレータとして生きている場合には アクセス可能だ…。でも、そうすると f() の文脈が複数存在することになってしまうな。 そうすると Singleton なクラスしか実装できないということになるのかな。 いや、それとも「オブジェクトは continuation である」ということにすればいいんだ。んか?? 頭がこんげらがってきた。

しかし、これがうまく実装できれば、クロージャとオブジェクトの違いはほとんどなくなる。 f.g() のようにすれば f 内の g() をじかに呼び出すこともできるので、 ほとんどこれはメソッドと同じになるではないか。でも、そんならなぜ最初から class を使わないの?? いや、この方法には「オブジェクトの存在時間が明示的に定まる」 というメリットがある。オブジェクトは関数が呼び出されてから return するまでしか 存在していないので、オブジェクトの時系列の動きがよりはっきり記述できるようになる。 ただし通常の関数では f() の外に制御が出ることはないから、 ふつうは yield かなんかを使わなければならないだろうけど。うーん、結局、わけわかんない。 でも状態遷移機械のようなものを実装するのにはいいと思う。でもやはり概念が複雑になりすぎるのか。

(11:57)
わーお。 BBC が P2P TV クライアントのテスト版をリリースだって。 BBC は間違いなく技術的に一番とんがってる (というか、一番まじめな) TV 局だよな。DIRAC の開発なんかもそうだし、 ニュースは 43ヶ国語に対応してるし (日本語はなぜか入ってないけど…)。ほとんどすべてのページでテキスト版を用意しているのもいい。 こういうチャレンジ精神って、米国にはないよな。いや、米国の場合は、企業がカネをもうけるという 点では非常にチャレンジ精神があるが、あくまで企業を軸にしてしか物事を考えていない。 基本的に米国人というのは政府を信用しないようにできているので、 「民間企業が利益を追求することが、社会をよくする」と本気で 信じているようなところがある。この信念のせいで世界中から嫌われているのにね。

どうでもいいけど最近、Slashdot の RSS に URL の重複 (というか、記事の重複。 Traiss は URL の md5 で記事を判別しているんで URL の重複は関知できない) がやたら 多いんだけど、これは向こうがなんかアホってるのだろうか? それともオレが悪いんだろうか?

(13:29)
昼食 (じっさいには、新山のけさ朝食はコーヒーとクッキー 2個だけだったので ほとんどブランチに等しい) 後に眠くなるのはやはり避けがたい自然の摂理というものなぬだろうか。 ところで、へれんの部屋は空調が非常に寒い。しかし彼女が無理してそこにいる理由は あまりに寒すぎて眠くならないからだという。 いや、オレはそれでも寝る自信があるね! そして風邪をひく。此宇宙的摂理也。宇宙シュートとは関係ない。
(15:18)
うがああああああああああああああああ! この仕様は腐ってる!この仕様は腐ってる!この仕様は腐ってる!この仕様は腐ってる!

…はあ。はあ。

よし、これは何としても言ってやらなければならない。 「こんなんではダメだ、ダメだ、ダメダメだ!」と。 いうぞ。よし。いうぞ。

(16:57)
さて? Google Earth で台湾が「中国の一部」と呼ばれているのを 台湾が抗議した ことについて、うちの台湾人 (← Google 大好き) にきいてみたところ、 「個人的には今回の Google の措置には反対だが、 政府がこんな問題に抗議するのは馬鹿げている (一般人が抗議するなら OK)」 という。しかしこれを「Taiwan」にしたらしたで、 今度は中国政府からもっと公式な、もっとヤバい抗議を受けていただろうよ。 中国政府はどうでもいいくだらないことに対して国をあげて「公式に」抗議する国という印象がある (司馬遼太郎の本に書いてあったが、中国は以前、文芸坐の劇を中止するように大使館を通じて 申し入れてきたことがあったらしい。いつの話だ?)。 けっきょく、Google はデカい客の機嫌をとっただけだ。 ところで新山は知らなかったのだが、調べてみたら、 google は日本海に対しても同じようなことをしていたんだと。 これもどうでもいいな。こんなの気にするのは日本と韓国だけ (もうちょい正確にいえば、韓国だけ) だよ。
(17:50)
H嬢と技術的な問題について話すと、かならずいつも 「だいたい C++ なんか使うから悪いんだよ!」「いまさらもう遅いわよ!」という 会話の応酬になてしまう。しかし彼女はホントーーに C++ を使うのをやめるべきだと思う。 彼女はいつも UTF-8 と GB2312 の文字コードに悩まされているが、おそろしく ダサい方法で解決している。たとえばコード変換をするためにファイルを 一度 Windows のエディタで手で開いて保存したりとか…。そのためにわざわざ 「複数のテキストファイルをひとつにまとめて、ふたたび分割する方法を教えてくれ」など 本末転倒な質問をするはめになっている (なぜか iconv ではうまく変換できないらしい)。 そんで今度はコード変換したらバイトオフセットがずれたとかうだうだ…そりゃ当然だ。 おまけにこのコーパスがおそろしくアホな設計で、すべてのタグがバイトオフセットの値をもとにつけられている。 いつもこの手のことを目にするたびに思うのは、おまえらは自然言語処理なんかやる前に まともなエンジニアリングをやれ! ということである。 Boost とか ICU とか、その手のおそろしい非互換性かつ暗号的エラーメッセージの brave new world に 入りこむ気があるんなら話はべつだが、そうでないかぎり C++ で言語処理をするのは (とくにアジア系言語の場合) アホとしか言いようがない。といって、Perl で Unicode を使っている人もかなりアホっぽいけど…。 Java か? Java なのか? うん、やっぱ Java だね。Java 最高。 (まあ、すくなくとも Prolog よりはましだ、すくなくとも。タナカ先生ごめんなさい)

ところで、C++ のコンパイルエラーは「暗号のようにわかりにくいもの」の例えに使うのに有効である、 と思う。

(23:43)
結論: slasxhtod の rss は腐っている。いや、最近腐りはじめてきた。 これはこれはあした直してやるぞ。チクショウ。 でも今日はもうねむういので、このまま寝留。おやす3
(00:57)
げーーーっもうこんな時間じゃねえか。 今日は west village にあるという伝説の(?)ラーメン屋を探すべく じつにアホらしき努力をした。そして我々は勝ったのである。粘り勝ちといってもいい。 意地の勝利だ。新山は日本食のレストランにまったく行かないので、 ニューヨークへきてから、はじめて(外食の)ラーメンを食いました。味はまとも。以上。

Oct 04 [Tue]


(11:18)
さいきん、wwwcvs のほうにアホみたいに spam がくるのだが…。 しかもなぜか日本語ばっかり。

新山は「プログラムを、それを走らせてるあいだに変更する」という危険なことをよくやる。 これは、その「プログラム」はだいたい非常に時間のかかるものであるので、 それが終了するころまでには変更は終わっていて、次のテストの準備 OK、 という状態になっていると期待しているからである。ところが (てくるが)、 シェルスクリプトではこれができない。なぜならシェルスクリプトは ファイルから動的にコードを読み込んでいるからで、ファイルを実行中に 変更するとオフセットがずれておかしなことになり、あらぬ部分を実行してしまったりするのだ。 これはじつに危険だ。しかしなぜ、ファイルを一度ぜんぶバッファに ためこむようにしなかったんだろう? これは「無限に長いシェルスクリプトを実行する可能性がある」 ってことだろか?

ところで、新山はまだ「シェルスクリプトを書くときの流儀」というものをよく知らない。 おそらくみんな自己流でやっているのだと思うが、これはけっこう奥が深いと思う。 シェルスクリプトの場合、たいていは実行に時間がかかるうえに、 途中で予期しないエラーが起きると最悪の場合システムをぶっこわしたり他人様の マシンに大量のメールを送りつけたりなど、恐しい結果になることがある。 まあだから楽しいといえば楽しいのだが…。

(12:10)
新山は、ふだん画面をロックしないが (どうでもいいけど CRT がほとんど死滅した現在、スクリーンセーバーはもはや過去の遺物だよね?)、 xlock をつかうときが一箇所だけある。それはキーボードの掃除をするときだ。

どうでもいいけど、psyco を使っていると pychecker が落ちるよね。

(15:15)
あれ、google map の左右が入れ代わってんだけど、オレだけ? なんでこんなことするんだかわからん。

フリーソフトウェアのホスティングサービス比較

Berlios ってどうなんかね。ドイツ政府から金が出ているらしいけど。 まあ、sourceforge がよくないことは認める。 もっと謎なのは sourceforge.jp だ。 インターフェイスが日本語であるという以外になにも特徴なし。 ホントか?

(17:02)
うーー。15分昼寝のつもりが 1時間近く爆睡していた。
(19:13)
きょうのこれからの目標!

文句あるか。
(20:08)
終わった…なんとか…。 しかし動いたら動いたで今度は目の前が暗くなるほどの問題が続出した。 とりあえず細かい調整は明日やろう。 ほんじゃね。
(21:11)
買い物して帰ってきた。これから米を研いでフロに入る。 ぼびっぼ
(22:11)
いっただきま〜〜す! (ほぼ予定通り)
(22:48)
うー。もう何もやる気おきん
(00:45)
やっと翻訳が終わった…。 もうねる

ブッシュが指名した最高裁判事は元マイクロソフト弁護士

Oct 03 [Mon]


(09:06)
ドッっ。
(11:41)
最近、JavaScript が前にもましてウザくなってきてない? NYTimes でも Amazon でも、勝手にマウスをスライドさせただけで パッパカ、パッパカなんか開いちゃうんだよ。もううるさくてしょうがない。 とくに最近のいわゆる「Ajax 馬鹿」はなんとかならんのか。 Google のインターフェイスがいいのは、あれが 「使うべきところで JavaScript を使ってる」からなんだよ。 通常の検索は JavaScript がなくても動くようにしてある。 本来 Ajax を使わなくても動くところでわざわざ JavaScript を使うやつはただのアホだ。 おおかた機能過多なコードを書くやつがインターフェイスもデザインしたのだろう…。 結局のところ、これは「ユーザの心理」に関する問題であって、 技術の問題ではないのである。 プログラミングは社会的な行為だということをきみは知っていたかっ。 “わかってない”プログラマは、プログラミングをしているときに自分は 計算機に向かって話しかけていると思い込んでいるのかもしれないが、 本当にプログラマがコミニュケーションしている相手はじつはその向こうにいる人間なんである (あるいはもしかすると自分自身かもしれない)。 こういう問題意識のないやつがインターフェイスを デザインするとだいたいろくなことがない。 これは差別的発言かもしれないが、たとえば自閉症の人が一般受けする インターフェイスを独力でつくることはまず無理だろう。 しかしマイクロソフトなんかはインターフェイスの専門家を何人も雇っているはずなのに、 その MS でさえアレだからな。世の中は暗いね。 ところで、 (てくるで、) Google は本気でワープロや表計算を JavaScript でつくる気なんだろうか? そしたら見直すね、ある意味。(使いたくないけど) いや、それよりまず JavaScript で Python インタプリタをつくるべきだろう。 そのうえでアレすると…。
(12:35)
COMPUTER SCIENCE COLLOQUIUM

Friday, October 7, 2005 - 11:30 a.m.
Room 109 Warren Weaver Hall
251 Mercer Street
New York, NY 10012-1185

Speaker: Philip Rosedale, Second Life Inc.
Title: Building a World with Digital Atoms

な〜んかあやしいトークだなあ。 トぁ〜くね、トぁ〜ク。

(15:08)
くそ、オレはお前らの TA じゃねえ〜〜〜っ! 彼らのいる部屋へいくと質問ぜめに会ってしまう。 「Adaの宿題がわからない」 「コード変換はどうやるの」 「この素性を(機械学習で)使っていいと思う?」 など。新山がとうに忘れた、あるいはまったく専門外のことだけを尋かれる。 これはいじめか何かか? それにしても、みんなとうに忘れた(はずの) Ada の文法をまだ覚えていた。オレってえらい!!
(16:59)

病気だ…。

(21:10)
うんうん、病気だね。いまいじっているのは Python なのだけど、別種の病気だ。 その名も「うごかないよ病」。

音楽を大量で聴いていると誰かに自分の名前を呼ばれたような気がしてふと後をふり向く。 するとそこには (部屋の電気をつけず、スタンドだけで作業しているので) 暗闇のなかにひとすじの空間が… (本当に呼ばれていることも結構あるので油断できない、 何に? いや、あれらの存在にである。あれらだよ、あれら。 キミにわはからなゐのか。)。()

ここは地上 78階です。(あるいは、さういへば)

大学にいるあいだにこういう意味不明な日記を書くことはめったにないのだが (まあ、最近は)、なにかときどき非常に論理を虫したい時があるのだ、オレが人間の場合は。 なぜなら、バグっているからである。?? それはうそだね! それはうそだ。嘘つき。→ → ・ ←

(23:34)
牛今日は歯約ね♪だ空菜
(もうきょうははやくねるんだからな)
(00:13)
世のなかにはポカーンとすること以外にやることがあるはすた

Oct 02 [Sun]


(13:45)
新山もそうだが、日本人はよくアメリカンジョークがわからないと言うが、 考えてみりゃ日本のボケとツッコミの笑いだって他国の人間にしてみりゃよくわからんのである、きっと。 なんしろ笑いってのは「お約束の世界」だからな。
(19:14)
うんうん、早起きせにゃあダメだねえ。それも毎日。

へれんに PhDの漫画を教えたら 「知ってるよ。超有名だよ。知らなかったの? 理系の学生はみんな知ってるかと思ってた」 といわれ軽くガーソ。と、いうか、アレを読むと「学生は怠けるのが当然」という 意識がますます加速されそうで困る。べつに困らないけど。

どうでもいいが、彼女はインターンをしてから平日と休日の区別が きっちりつくようになったという。オレはいまだにきっちりついてない。 しかし平日は人が多くていろいろとウザいので、どちらかというと人のすくない 週末にオフィスに来て一人で寂しくコツコツやるのが好きなのだが…。 こんなんじゃダメだああぁぁ! しかしいまだに彼女はオレと同じように寝坊魔なので、 そのナマケ者ぶりにはたいして差はないと思うが…。 しかし、彼女の場合は某コンテストの締め切りがあと 1ヵ月しかないので大変そうだな。 オレはそういうしばりがなくって楽だな (というかそのためにより堕落しそう)。 このあいだ、日本人の人々でちかくの店に『ニューオリンズ・料理』を食いにいったんだよ。 ニューオリンズ料理といってもようするにナマズをはさんだサンドイッチを食っただけだが。 なまずってのは英語で "catfish" というのだけど、この名詞については日本語より英語のほうが インパクトあるよな。…えーとなんでこんな話はじめたんだっけ? ああそうだ。そこで、研究についていろいろ言われましたのです。 つまりお前はへれんと違って余計な縛りもないんだからその分しっかりやれというようなこと。 へいへい。そのとおりでごぜえま。

ちなみに新山は H嬢のことをよく「彼女」「彼女」といっているが、 ここでいう「彼女」はあくまで代名詞であって、一般名詞ではない。 これはもしかすると読者を混乱させるのかもしれないが、 どのみちここの読者なんていねえからどうでもいい。 以下同文。

(22:12)
なぜか日曜なのにオフィスに来ている H嬢とポルトガル人の女の子 (…つーか、あきらかにって歳でもないと思うので、ポルトガル人のおねーさん、 としておこう) と晩飯を食いに行く。とーーーぜんのように中国料理ですよ、 こういう場合は。しかし St. Marks にある例の中国料理屋はホントに味もサービスもいいので、 あそこで中華料理が食えなかったらどこでも中華料理は食えないと思う。 まあそれはいいとして。

今日の占いクッキー:

The days you work are the best days.

Lucky Numbers: 25, 36, 14, 47, 5, 19

なぜこのラッキーナンバーは昇順になっていないのだろう? 気になるじゃないか。ちなみに裏側はこうなっとル:
LEARN CHINESE: Birthday

Sheng-dan-jie 生日

ちなみに、また発音が間違っとるよ。しかも、2重に間違っているそうな。 「Sheng-dan-jie」は「生誕日」の発音だが、へれんによれば中国語で 「生誕日」というと、これはキリストの誕生日のことで、ふつうはクリスマスのみを指すのだそうな。 つまり固有名詞ってわけね。知らじよ! (メシを食っているときでもこういう話題はのがせない、職業病か)

(23:37)
帰ってきた。くいすぎだっ。

♪んぷ: べりべりすり〜ぴ〜〜〜〜〜〜〜 べりべり
おん♪

さふいえばけふは途中から星占いの話になって、 正直、ついて行けなかったのだが、だれも「十二星座」の英語がわからんかった (まあ、日本人と中国人とポルトガル人の会話じゃあね)。しかし帰りの電車の中で 思い出した。"Zodiac" であるっ。まあだからどうしたってこともないのだが。 ちなみに新山の誕生日はすでに彼女らに知られていたが、 それでも新山はしつこく「オレは“ふたご座 (Gemini)” だっ」と主張していた (注: 本来、双子座とはぜんぜん別の星座なのだが、「ふたござ」という語感が好きなので、 オレはつねに自分がふたご座であると信じるようにしている)。 われながら、自分の星座にコンプレックスのあるような気のする。 ええ、ありますよ。 これではまるで逆転ではないか。

Oct 01 [Sat]


(15:18)
きょうは朝はやく起きたため RUSSIA!展 へ行ってきた。 混んでた。 つうか、オレはこの美術館にやたらとよく行ってるよな。ここは学生でも 10ドルで、そんなに安くない。 もしかすると会員になったほうが安かったんじゃないか? 帰りに 96st. から地下鉄に乗ろうと思ったら、今日はその駅からは downtown 方面が動いてなくて、 しょうがないから 125st. まで上がって、快速で Astor まで帰って来ただ。さてこのあとは研究しなくちゃな。

ところで、こないだスズキさんから (あっちの鈴木ではない、べつの鈴木) PhD という漫画 を教えてもらったのだけど、 これ、いいわ。なんつうか、笑える。それもマゾ的に。 かなり内輪ネタだけど…。 ここしばらく、どうも夏休みが終わってからというもの、 自分が博士学生だということを忘れていたようなかんじだが、 これを見て自分の置かれている状況を再確認した。 いやあ、どこの学生もみんな似たような状況なのよねえ。

(23:24)
ふーーー。 遅く帰ってきて家のちかくのフライドチキン屋に寄ったら 黒人のガキ集団が店の中でたむろしていて、あやうくサイフをすられそうになった。 店内の鏡はああいうときの予防に役に立つのかもね。
Yusuke Shinyama