2005年 1月 (2)。

Last Modified: Thu Jan 20 23:47:17 EST 2005 (01/21, 13:47 JST)

Jan 20 [Thu]


(09:56)
今日はとくべつな日だ。

どうでもいいが、うちのカレンダーが OLIVIA (子ブタ) だということは前に書いたが、 まえにウチの親に「OLIVIA のカレンダー買ったよ」といったら、かれらは息子が オリビア・ニュートンジョンのカレンダーを買ったと思ったらしい。 「息子にしては古い趣味だなあ…」と思ったらしいが、そんな奴、顔も知らんて。 うちの母は児童書にくわしいので、 「OLIVIA」というだけでわかると思ってたが甘かった。あとで本人に聞いてみると「そっちの OLIVIA も 知ってはいたが、まさかそっちだとは思いもしなかった」とのことで、 うちの親にとってはブタの絵のカレンダーを買うよりも、往年のあいどるの カレンダーを買うほうがまだありうるようだった。ところで OLIVIA (ブタの方) って 日本じゃあんまり有名じゃないのかな。こっちでは B&N の正面にいきなり売ってる。 こいつはアメリカンの作ったキャラクタのわりには、かわいい。

ちなみに、新山はアイドルのカレンダーやポスターを部屋に貼るという発想が ほとんど理解できない。理由は以下のとおり:

これらはすべて 33% ずつしか真実ではない。したがって全部あわせても 99% である。 あるいは 3.5937% というべっきなのか。まあ、だぅーでもいいけど。
(11:03)
まーーーーーーーーーー
(12:19)
オフィスに来たら花がしおれてた。きのう買ったばっかなのに、がっかり。 やっぱりこの部屋は乾燥しすぎだと思う。
(17:30)
COMPUTER SCIENCE COLLOQUIUM

Friday, January 21, 2005 - 11:30 a.m.
Room 1302 Warren Weaver Hall
251 Mercer Street
New York, NY 10012-1185

Speaker: Frank Tip, IBM Research

Title: Efficiently Refactoring Java Applications to Use Generic Libraries
なんか似たようなトーク前にもあったな。
(19:58)
こうするとなんかでんの? あーなるほどな。そういうわけか。

  

(22:13)
あふぁf
(23:21)
なーんとなく、SFS (self-certifying filesystem) を試してみようとして、 むかしコンパイルしたバイナリを動かしてみたら、うごかん。 そのうちに絶対 kill するなといわれていた nfsmounter を kill ってしまい、パニックになる。再起動し fsck のため数分何もできず。 原因は portmapper を上げていないことだった。ちなみになぜこんな気になったかというと、 Mazie`res せんせいの授業をとったからである。そんだけだ。しかし公開の SFS サーバって sfs.sf.net (じっさいこれは *.scs.cs.nyu.edu だ) 以外にどこにもないのな。…と思ったら、 いまは Knoppix が SFS で公開されているということが判明した。 スゲーじゃん! しかし、これ、大丈夫なんかね? まあ彼はセキュリティの専門家だから、 そのへんは堅牢につくってあると思うのだが、いかんせん普及率がまだ低いというのが なんともあやしい。でも実はこれは便利なので、いずれ大学の home も sfs 経由で 自宅から直アクセスできるようにしようかな、と思っている。rsync で同期したり VPN 使うより こっちほうが簡単でいいよね。 SFS はパス名を公開鍵 (のハッシュ) が含まれており、正確なパス名を知っていること自体が、 そのサイトに到達できる証明になっている。もうちょっとインストールが増えてくればそのうち 流行るかもな。

しかし実は新山は Coda filesystem にも興味がある。 切り離し環境でログを記録してあとでリプレイできるってのは、とってもよさそう。 しかし新山の場合は MacOSX で動いてくれないと意味がないんだが、いまのところ まだあまりちゃんとは動いてないようだ…

Jan 19 [Wed]


(07:48)
早く起きすぎた。また寝てやる。でももうお米といじゃったから。さ。
(08:25)
ふと気づいたこと。
>>> bool(0)
False
>>> bool((0,))
True
>>> bool((0,0))
True

さて、Python の話と 1500% 関連している話だが、 世の中の誰にとっても「こいつは自分より下だ」とみくだして安心を得られる人間が世界のどこかには存在する。 それを有向グラフによって表現すると (各ノードは人間を、矢印は「見くだし→見くだされ」の関係をあらわす)、 どうなるだろう? おそらくいろんなところにサイクル (循環) ができると思われるのであるが、 どいつもこいつも必ず in-link と out-link の数が 0 ではない。 なんていったっけ、これ? 度数だっけ? フン、まあいい。そして以下のような式が定義される:

その人間の価値 = (in-link の数) × (out-link の数)

つまり、世界でもっとも多くの人から「下だ」と思われ、 同時にもっとも多くの人を「下だ」と思っている人間の価値がもっとも高くなる。 って、それは、誰かな。ゲイツとかブッシュは近そうだけどな。 しかしとにかく…、これによってゲイツやブッシュは優秀な人間であることが 科学的に計算できたわけだ! うん!!

(訳注: 「科学的」…数式と専門用語をつかった議論のこと、論理は必要ない)

ワーお! これでオレもトンデモ本を書く資格ありだ! PhD とったらやろっと。めざすは計算機科学における竹内久美子だね!

(14:23)
18時間40分。
(15:52)
雪ふってやがるぜチクショウ。
(21:41)
St. Marks にある中華料理屋「グランド・四川 (というのが英語の直訳だが、 なぜか中国語の店名は「故郷味」となっている)」にいってきた。 ここはおすすめだ。あーーーーーっ占いクッキーの紙持ち帰ってくるの忘れたあああ!

ダモンネ

おいskimmingとschemingはちがうのか???
??

(23:06)
事実を知らなくても真実をいうことはできるさ。

by ろーかりーローカロリー

(01:34)
翻訳だけやっててプログラミがぜんぜん進まなかった。恨んでやる。

Jan 18 [Tue]


(08:36)
サムくて目がさめる。なに、今日の最高気温は -6℃だって?
けんきゅう日誌
この数日間ずっとコーパスを見ていて、ひとつの着想を得た。 それは「言いかえ表現の間には、ある特定のレイヤーで等価なレベルが存在する」ということである。 ここでいう「レイヤー」というのは恣意的、人工的なものだが、 おおざっぱには以下のように分類できる: しかし、これが 1次元的なものなのか、 あるいは複数の独立したレベルがあるのかは (こっちのほうが自然だろうけど) まだわからない…。

ここからもうひとつの疑問 (というか仮説) がでてくる。 それは「レイヤーが抽象的になればなるほど、2つの表現間で共通な情報量は少なくなるんじゃないか?」 ということである。あきらかにオレはこの「共通な情報量」を気にしている。 なぜならこれが少なすぎると (非常に抽象的な言い方になるけど) 人は「意味的な等価性」というものを 疑いだすだろうからだ…。でもそれは本当か。

そして、その「共通な情報」なるものがもしかりに定義できるとして、 それはいったいどのように表現される (べきな) のか? おそらくひとつの単語では無理だろう。 というか、抽象的な意味とは複数の単語 (語義?) の共有部分によって表現されるのかもしれない。 ここまでくると統計屋が好きそうな話と結びつけられるんかな。 も、も、もしかして、これは、う゛ぃとげんしゅたいんのいう「家族的類似」ってヤツか!? わたわた

そしてこのことと、記事の "focus" (これは Sidner 的な照応の focus とは無関係) についての関連はどういうものになるのか? IE との関係は? 疑問ばっかり出てくる。

(10:22)
うちの電話には spam しかきません。

まだ半分しか終わってねえよチクショウ

というか、オレは mood, modality, aspect, tense の区別について もっとちゃんと勉強しないとだめだな。tense はなんとなくわかるが mood と modality についてはまだよくわかってないみたい。

(11:27)
あー、外にでたくない。こうクソ寒いとヒキコ森になるよ

「局」について再考。「一局集中」という言葉があるように、 「局」には何かを中央集権的に制御するというような意味があるのかもしれない。 (しかし大辞林にそういう意味は乗っていない。

局 - (1)官庁・会社などで、業務の内容に応じて機構を分割する場合の単位の一。普通、部・課より大きい。
とあるだけである。たぶんこういうのは緩和時点をひかないとだめだな)

とすると、郵便や放送や水道はなにか集中制御できるものだが、 警察はそうでないということか? (それはあるかもしれない)

それから「おツボネ様」というのは、なにかを中央集権的に制御しているということか? (それもあるかもしれない)

(12:57)
うー死ぬかと思った。お昼なのに外気温は -11℃で、 今夜の最低予測は -11℃とのことだが、ウソつけ! これ以上下がらないわけねーだろ!

てくるで。

Art / Science Collision:
Robotics in New York

T H U R S D A Y,   F E B R U A R Y  17TH 7:00pm

Many New York-based artists are using robotics to explore what it means to be
human.  This evening includes demonstrations illustrating the wide range of
robotic expression and discussions with some of the leading individuals and
collectives including Chico MacMurtrie, Artistic Director, Amorphic Robot
Works; Eric Singer, founder of LEMUR (League of Electronic Musical Urban
Robots); and Eva Sutton and Sarah Hart, who will present Sumi-ebots.

Program Code: EL021705
$15 ($13.50 Members, students,  senior citizens)

Linder Theater, First Floor
Enter at 77th  street entrance, between Columbus and Central Park West

For tickets: 212-769-5200
Information: 212-769-5315 or www.amnh.org/programs
AMNH, Central Park West at 79th Street New York, NY 10024
(15:58)
http://homepage2.nifty.com/kurosio/main/tagengo.html より:
> 機械翻訳が発達すると、語学教育はいらなくなりますか?

オイオイ。こんなこと質問するやつ本当にいるのかよ。 ならない、ならない、絶対にならなーーーーーい! 機械翻訳の研究者はいったい何をやっとるんだ。 誰だこんな誤解を与えたのは。こんな認識をひと様に持たせちゃダメじゃないか。 いいとこだけデモするからこうなるんだよ。「ゆるしてください機械翻訳は全然ダメです!」ということを、 (壁にガンガンと頭をうちつけながら) 声高に主張しなきゃいかんだろうが。

(21:35)
ふーー。やっと緊急な (と新山が考える) ページは翻訳したぞ。 errata とか ftp はつねに最新になっていなければユーザをなめていると思われても仕方ない (てゆうかまだ 3.5 になってた)。あとは order だな。しかし、言っちゃ悪いが、 なんか機械翻訳にかけたかのような訳だった。あまり手を出すのも悪いので適当に手を引こう。

で、こんどは (寒すぎて) 家に帰りたくないんです。

(22:46)
どうやら生きている。これはぜったい -13℃とかいってるよ。。。
(23:30)
おフロに入ろうとしたら蛇口からツララが下がっててお湯がしばらく出なかった。 シャワーはでた。ああもう。

てくるで、あやしいビジネス書名を勝手に生成する方法を思いついた。つぎのテンプレートを使うのだ!

ふたつ合わせて「〜的発想が日本をダメにする」とか書くとおもしろいかもしれない。 「〜」の部分にはなるたけ具体的な名詞を入れること。

ててくくるるでで、きょうはアホってる人から年賀状がとどいた。 ちなみに、もっとアホってる人からの年賀状は料金不足のためまだ届いていない。 つうか、20円切手貼れよ児島。じゃあな。

Jan 17 [Mon]


(13:38)
DVD が「Digital Versatile Disk」の略だったとは。V は Video かと思ってた。
(16:12)
うう、カレー食いたい…
(17:53)
How to Write Unmaintainable CodeInterface Hall of Shame は古いページだが、マジで笑える。 個人的にとくにウケたのは「MS Word 97 のスペルチェッカが『"worldwide" は辞書にないから "world-wide" に直せ』と 警告してくるので、直してもう一度チェックすると今度は『"world-wide" は複合語だから "worldwide" に直せ』と警告する」 というやつだ。落語っぽい。 こういうページはもっと広まってもいいはずだが、広まらないのには理由がある。 でも、それはここには書かない。

(余はその驚くべき証明を考案したが、この余白は広すぎてここには書ききれない以下略)

(21:28)
それらの意味不明性はもうとうの昔に知れ渡っている!!
(22:22)
ただいま。

途中で (と中で)、くだらないことを思いついたが、 それはあまりのくだらなさのために、 0ビットで言いつくすことができてしまう。 だからそれはもう書いた。つまり書いた場合も書かない場合も同じ状態ということだ。 つまりその情報はどこにでも存在する。いまこれを見ているあなたの右手の薬指のツメの間にもね。 おしりの下にもいますよ、いま何かあったでしょう。あっ、鼻の奥に入った! 左の穴。

そこらへん。

(23:32)
なぜ、「郵便局」「電話局」「放送局」「水道局」と言うのに、 「警察局」とか「刑務局」とか「ごみ焼却局」とか「火葬局」とかはいわないのか。

どうでもいいが、ipadic-2.7.0 には「水道局」が固有名詞として入っているが、 これは普通名詞だと思う。この手のバグはいくつか発見しているのだが、いずれお伝えせねば。

ところで、ゆで卵とブラックコーヒーはなんでこんなにあうんだろうね? 合いすぎるよ!

Jan 16 [Sun]


(09:11)
けさは早起きたので (←これもおかしな日本語)、みそ汁をあっためて久しぶりに正しい朝食をした。 しかしタマゴかけご飯ができないのがつらいところだ。 それにしても、NY ではたしか州法で生タマゴをレストラン等で出すのが禁止されていると 聞いたことがあるが、Times Square にある吉野屋はどうして生卵が出せるんだろうか?? あすこで卵だけ注文して持って帰ってくればタマゴかけご飯ができるのかいな。

てくるで大阪が外国だというのは、あそこで納豆を食うと非人間扱いされるらしいと聞いたからである。 おなじだ!

(10:10)
センタァー試験の英語をやってみたが、さいしょの発音問題を 2問ともまちがえた。ダメじゃん…

で、この後におよんでこんなことを書いてもしょうがないのだけど、 大学受験について。新山は浪人したクチだが、現役のときはまるで成績ダメだったのに 浪人したら偏差値が 45→65 ぐらいに上がったのだが (最後には全国模試で成績優秀者のリストに 名前が載るところまでいった)、こういうのって稀なケースらしい。 しかし自分としてはたいして勉強したわけでもなかったので、 この「偏差値」というやつは非科学的だといまでも思っている。 ちなみにオレは予備校には行っていたが、うちは地方予備校で、 高校と同じように「担任」というものがあり、よくみんなで先生のところに 質問におしかけては「お菓子ちょうだい」などといってスナックを拝借していた。 ミツイシ先生元気かなあ。いま考えても、よくあんなんで成績上がったな。 しかし、自分の性格のかなりのアホ部分はこの浪人生活と大学生活をとおして形成されたので、 そのせいか新山は高校時代の友達よりも予備校でできた友達のほうが仲がよかったりする (ついでに大学の友達もなぜかみんな浪人した奴ばっかり)。

そーいえばこの予備校ではひとつムカつくことがある。 ここでは高校時代に成績優秀だったやつには授業料が免除されるというハラだたしいシステムがあるのだが、 そんなもんにはトンと縁のなかった新山は最後まで全学費を払わされた。 しかし、オレの知ってる so-called 優等生は授業料免除されてたにもかかわらず、期待された結果になってなかったぞ! いっぽうオレは予想外にも東工大に合格してしまい (と書くと大したことのようだが、 新山のいたクラスからは異例だったらしい)、 勝手に広告に顔写真までのせられる始末なのに謝礼はたったの図書券 3000円。なんでええ?? それっって論理的じゃないじゃないですか。 やつから授業料を奪いとってオレに返金しろ! つーかそもそも許可なく写真載せんじゃねえバカヤロウ! しかしいざ自分が特別扱いされることになったら絶対拒否するだろうkedo。 たぶん、「エリート扱い == 悪の根源」という思想はこういうところでも強められていると思われる。

(11:08)
「ずーずーちゃんねる@ゾプニチ」の雰囲気はかなり好きなのですが、 新山にはあのような慣れ合いはできそうもない。思うに、新山が 掲示板に書きこむのはほとんど「情報交換」のためか、そうでなければ 「文句を言う」のが目的であって、挨拶するためではないような気がするが、 ここで重要なのは「相手のことを気づかわない」ということだ… (ああ、ごくたまに例外として、そのページの 1ファンとして書きこむことはあるな)。 相手のご機嫌を考慮しなければいけないようでは、 まともな議論やら情報交換というのはほとんどできないだろう。 web 上にはただでさえそのようなノイズがあふれているのに、このうえ自分が でていってそういうのを増やす必要もないと思う。しかし、いまある形態としては、 web というのは情報交換よりも慣れ合いのほうが向いているようにも見える。 「慣れ合いを放送してほしい」人がたぶん沢山いるのだ。 そういう感覚って、ほとんどオレには理解不能なんだけど。

もっとも、ユニキャストでなれあっている人々 (メールとかIMとかで) も 同じくらい理解不能だが、それについては、

…いま思いだした。

(11:46)
Courier や Shinonome などの等幅フォントはコードを書くときに使うが、 0 と O、1 と l のような文字が区別しづらいのはきらいだ。 セキュリティ的にいっても、URL やメールアドレスなどをあらわすときのフォントは これらをきっちり区別できるものにすべきだと思う。 こんなに短い文字列がこれほど重要になったことは今までになかったので、 たぶん、
(16:57)
OpenBSD翻訳ページの数々が (日本語に限らず) どれもこれも古いので、 Theo 師匠がたいそうお怒りです。まあ最終更新が 2ヵ月前じゃなあ、 こりゃおこられてもしゃあないわなあ。オレも連帯責任か。

しかしこの人のメールはいつも厨房っぽくてほほえましい。

そんで翻訳版の見た目が悪いことにも怒っているらしく、 Wim (翻訳チーム代表) からメールがきて「それでだ… 彼は firefox を使っているから、 これからは firefox で見栄えがよくなるように手直ししよう、 変更点はすべて彼にメールして承認をもらってくれ…」とのこと。 キョーーフ政治! そもそもヤツはちゃんとフォント入れてるんか? と思ったら、 「デフォルトの firefox でよく見えないとダメだ! China はさらにひどい! (おそらく Chinese と言いたかったと思われる)」だと。 Wim いわく「あれあれ、いま彼は何も耳に入らないみたいだからしばらく放置しとこう、 数日たってから言うことを聞きゃあいい」

ついでに「revision が 2つ以上更新遅れたらその言語は廃止!」とかいうので、 急拠 openbsd/ja/ のほうのページも commit する。オレ、こっちはやったことないんだけどなあ。 おまけにあまりにも大量のドキュメントを修正せねばならず、どっから手をつけていいかわからない。 ほかの日本人翻訳者はなにをやっとるんだ! つうか、代わりの犠牲者いないの?

(18:38)
つかれた。こんなことやってたら研究も趣味もできねえ!
(20:47)
あージャスミン茶うまい
(22:06)
オレはすこし待つことを覚えなければならない、とも。

そういえばすこし前のことだが、Lei からおもしろいことを聞いた。 日本で「明朝体」と呼ばれているフォントは、中国では「宋体」と呼ばれているというのである。 考えてみれば、といっても、いままで考えてみもしなかったのだが、「明朝体」というのは 明の時代に日本に伝来したからこう呼ばれるのだろうか。 とすると、中国ではそれより前の宋代にすでにこの字体が開発されてたんだな。

ちなみに「楷書」「隷書」はそれぞれ「楷」「隷」で通じた。

(22:17)
panix.com はどうやらもとに戻ったらしいが、まだもとの DNS レコードが拡散するまでに時間がかかる模様。 やっぱりこわい話。それにしても Panix、いまだに 128k ISDN を提供してるところがスゲエよな。 地域によっては DSL が (電話局から遠すぎて) ないという米国の事情。

www/ のツリー全体を cvs get してきたら、ウギェ〜なんだこの分量は! (新山はいままで www/openssh/ のところしかいじってなかったので、 他がどうなってるかほとんど知らなかった)

(00:58)
さむい一日だった。きょうはさいしょ Christopher St. でおりて 大学まで歩き、かえりはチャイナタウン経由で WTC から乗る。

(01:21)
うちの学科の MIMEDefang が送られてきたシェルスクリプトを勝手に削除しやがった。 むかつ

本日のJargon File: Wintendo … ゲームにしか使われてない Windows マシンのこと。

Jan 15 [Sat]


(14:28)
そるそる起きなければ。
(16:20)
つぎの海外旅行はぜったい大阪にする!

…というか、ニューヨークよりもはるかにコワそうな街、という印象があるのだけど、 このイメジーは一体どこから植えつけらるたのんだろうか。

(17:26)
北海道おさかなマップ。 これほど「北海道スゴイ!」と感じさせる絵ってあまりないと思う。(よく見ると同種のサカナがけっこうあるけど)
(20:26)
駅前の時計はいつも 7時 5分をさしている。

はいはいどうせオレはバカですよ。。。

(21:23)
日本で自殺がへらないのは、けっきょくのところ死人に気をつかいすぎなんだよな。 「死んだ人間 → ホトケ」という考えがまだ暗黙のうちに生きてるような気がする。 だれかが自殺したら実名公開で「やーいやーい死にやがった、ばーかばーか」と 言うようにしないとだめだと思う。実際、米国での自殺者の報道を見ているとそんな感じだ。

生きてる人間を悪くいうのはよくて、死んだ人間を悪くいうのはよくない、という考え方は あまりに理解できない。どっちもよくあるべきだ。

そういえば祖父が死んだころ、本人が死んだあとにあわてて通夜や葬式に来て キレイ事を言っている人々を見て、新山はムカついていた。 人は生きているうちにホメておくべきだ。鉄は熱いうちに打て!

(00:52)
てくるで、きょう買った大根は「スが入っている (鬆と書くんだってさ) 」の逆なのであるが、 こういうのはなんて言うんだろ? 「稠密である」あるいは「密っている」とでもいえばいいのかな? ウマそうだがなかなか茹だらない。っていうか密度が高いから茹だったあとも透けないのか。
(03:14)
NANOG ML より Panix.com がドメインジャックされた というニュース。DNS 的にやられたのではなく、いきなりドメインのレジストラが変えられてしまったらしい。 Panix (現在 panix.net で暫定運用中) は NYC では いちばん古いプロバイダの老舗で、いまだにユーザに伝統的な UNIXシェルを解放しており、 nylug でもここを利用している人が何人かいる。プロバイダ自身にとってもユーザにとってもこれは致命的だ。 なぜならかれらは日頃から @panix.com のメールアドレスを利用していたからだ。 新しいドメインにはすでにメールサーバが立っているので、知らずに @panix.com のユーザあてに 送られたメールは全部合法的に (まだこれが合法的に移行されたかどうかは不明だけど) ハイジャックしたほうのメールサーバに行ってしまう。乗っとった相手はオーストラリアのだれかだ、 ということしかわかっていない。panix.com のもとのレジストラである Dotster もこのことは 知らされておらず、寝耳に水だったとのことだが、なんで秘密裏に移行できちゃったんだろ? Verisign は助けてくれないそうだ。新山はドメイン移行の手続きってぜんぜん詳しくないんだけど (こないだ tabesugi.net を Register から GoDaddy に移したが、ただ言われたとおりにやっただけ)、 これってかなり怖いんじゃないかな。ある日自分のドメインが知らないうちに勝手に他人のものにされてる 危険性があるわけだ。とーぜん日頃使っていた URL やメールアドレスは全部ダメになる。 これは孤立した事件なのか、あるいはさらに大規模な攻撃のまえぶれなのかはわからないそうな。 ネットにこれほど依存していながら、ドメイン名の管理というのはまだかなりいい加減だ。 こわいねえ。

(追記) Slashdot にはすでに記事が投稿されている。

前にも似たような話があったらしい。 Wired News の記事。 ようするにドメイン名のデータベース管理がずさんだってことだろう。 このあたりの仕組みをよく知っている人間なら、ある日いきなり google や hotmail や microsoft.com の ドメインを変更して、世界をパニックに落とし入れることができるのかもしれない。 そして、インターネットというのはその程度のたよりなさだというのに、 それに依存する傾向はますます強まっている (とくに米国では)。 そして「サイバーテロ」といえばあいかわらず連中は「どこかの省庁に侵入される」ことばかり 考えているのだろうか。そのまえにこういう構造的な問題をなんとかしろよ。

Jan 14 [Fri]


(09:35)
そっこらフェンの

てくるで weather.com が改悪されたんだけどなんとかして。

どうでもいいが HTMLParser は決してエラーをだすべきではない。 どんなにコワれた html でもガンバるのだ!

(10:24)
しょうがないので CNN Weather にした。

ひさびすりに emerge -u world を実行したら mysql をクロアチアかどっかから 持ってこようとしてて、5時間たっても終わってなかった。

(12:27)
写真つづき。
(12:38)
うげゃ!
(16:48)
ふと、Google でトップに来たページをつかって名詞句の照応解決ができないかなあ、 というキチガイ的なアイデアを思いついた。 が、いろいろ試した結果ダメそうだ。"the miserable failure" なんかは成功するのだが、 "the search engine" で検索すると、あろうことか AltaVista がトップに来てしまう。 これではダメだね…
(17:24)
google://ぬすっと もうもうしい/ (177県)

まけた。。。

しかも、ツウちゃんねるばっかり。

こういうときに自分の言語センスが 2ちゃんねるのそれと類似しているのを見るとガッカリする (これはもとからのもので、べつに影響されてこうなったわけではない)。 これはいいのか悪いの
か。

(19:44)
きのうのつづき。さしあたっての研究においては学問としての面白さより有用性のほうを重視したい。 ここでいう有用性というのはどれだけ生活が向上するか、あるいはどれだけ 人命が救えるか、あるいはどれだけカネが儲かるかということであって、 「研究者のための有用性」ではない。なぜなら、 前から何度もいっているように、自然言語処理は全体としてみれば学問としてオワッテいるからだ (断定)。 ここは「科学的な」という形容がまったくあてはまらない分野で、さしずめ株価予測なんかに似ている。 単なるノウハウのかたまりというか、いいかげんな手法のよせあつめでしかない。 これに対して言語学はまだ立派に科学している (もちろん、だからといってまともな研究ばかりとは限らないけど)。 しかし、昔からこうだったのかな? かつて AI がまだ生きていたころ、それは役には立たなかったが、 言語学や天文学などと同じように inspiring なものだったはずだ。 どこかでこれをおかしくした奴がいるのである。たぶん AI 研究が人気なくなってきたころから、 だれかが (おそらくは身の保全のために) この分野を切り離して「安定した」研究領域として 生きのびさせたのだと思われる。でも正確には「生きのびた」わけではなくて、 ただ「ゆっくり死ぬ」ようになっただけだ。そしていまの新山やほかの学生が 見ているものがその老後のプロセスである…

そうして、オレもまたその延命措置に荷担していることになるのか。 この調子だと、おそらくあと数十年は生きながらえることだろう。 まったく、やだなあ牛 (もう)。だれかすごいヒーローが突如として現れて この世界を活気づけてくれる可能性は 0.003% くらいである。 そもそも、ある学問分野全体が流行によりまるごと 現れたり消えたりするというのが異常なんだよな。 人間なんてそんなモノか!

(22:29)
モジュールをあっちこっちにコピーするとワケわかんなくなるのこと。 以前に書いた S式を読むところのパーザである sexpr.py を検索してみたら、 異なるバージョンが 5種類もあることがわかった。いずれもすこしずつ拡張したり削られたりしている。 しかも、さらにその前に sexp.py という名前で作ったモジュールもあって、 それをあわせると合計 8種類になった。アホかおれは。

いまでは python の自前ライブラリを入れる専用のディレクトリを用意しているのだが、 ちょろっと作ったモジュールが、真の汎用性あるライブラリとして「認定」さるるまでのあいだには やや間がある。このすきにこいつがあっちこっちにコピーされ増殖しちまうわけだな。 とカいうと、いかにもこいつが勝手に自分自身を複製しているかのようだが、 実際にはコピーしているのはオレなんだけど。だからアホかおれは。

(23:04)
なんとなく独りごとをインディアン語 (?、なぜか助詞が欠落する) でしゃべっていて、 ふいに「インディアン語(?)変換フィルタ」というものを考えた。 そういえばむかし大阪弁変換フィルタってあったよなあ、sed で。 だから sed でやってみる:
s/を/、/g
s/で/、/g
s/に/、/g
s/は/、/g
s/が/、/g
s/も/、/g
s/と/、/g

こんなんじゃダメそうだが、やっぱりダメでござした:

午前中、そのこ、、ずっ、費やされた。今日、そんなヘボ、しないよう、しなければならない。
ほん、、いい加減 kterm から、離れよう、思っているのだ、、いまだ、ふみきれない
(新山、 screen 、使っているの、 Xresources 、多大な設定、加えております)。

形態素解析を使えばこんなんは簡単なんだがなあ。それを使わずにやるところに味がある。

(00:03)
ふと思いついたリサーチ。

オレとしては「碍」という字はあまりきれいに見えないので 「がい」はひらがなで書くほうが好きなのだが、「障がい者」ってのもなんかお役所的だ。 べつに PC について文句をいうつもりはないが、これって検索するとき困るんだよね。

(01:56)
あなたは笑うだろうが、オレには笑われるすべはもうどこにもない。

この時間はつよかった。

(06:16)
てくるでさー、
これはフレームを直接きりとるので、音質の劣化なく切り貼り可能だる。 たぶん似たようなソフトはもうあると思うけど、わずか 97行じゃ。 配列 f にすべてのフレームが入ってるので、コマンドラインから式を渡して f[100:200]+f[300:700] なんかを eval させればその部分だけをくっつけた mp3 を標準出力から吐く。 何の役に立つかは知らんが、オレとしては mp3 ファイルの構造がわかったんであとはどうでもいい。 ここまでくるとただのファイル形式おたくだな。しかし Word ファイルや Excel については学習する気ありませんので ご安心お。

なぜかこんな時間まで起きていたら今度は逆の意味で時差ボー (それはもう時差ぼーーとはいわない) になりそで。

Jan 13 [Thu]


(03:59)
↑賞味期限

やばい。まだ時差ボーだ。

さういへばきのうは Kernel-2.6 に上げたらついに kterm が立ち上がらなくなってしまい、 午前中はそのことでずっと費やされた。今日はそんなヘボをしないようにしなければならない。 ほんとはいい加減 kterm からは離れようと思っているのだが、いまだにふみきれない (新山は screen を使っているので Xresources に多大な設定を加えております)。 mlterm を使ってもいいんだが、また設定をゼロからやるのに時間がかかりそうだし、 複数のマシンにインストールしなきゃいけなくて面倒くさいからなあ。でもいつかやんなきゃ、。

と、いうか、そもそも 2.6 を使う理由などないのだが、/proc のファイル構造がどう変わったかを 見たいだけであった。

小海線の車窓からみた景色:

(09:44)
いちど作ったら絶対消せない web ページってのがあったらどうだろうなあ。 archive.org などを使えば原理的にはこれは可能だし、winny なんかのファイル共有は ある意味いちど放流したら消せないという意味でこれに近いかもしれないが、 さいしょから「絶対消せない」ことを前提に作るのである。 web を見ていてよく思うのが「オマエら勝手に消したり改竄したりしてずるいよ」ということだ。 ま、それ言ったら新山もこのページの過去数日まではたまに変更するときがあるが、 なるべくそのままを残すようにしている。「書き手の責任」がどうこういうやつは ちゃんと自分の書いたものが永久に参照可能であるようにしているのかな。 それとも、ある時点までしか責任もたないよ、という言明が許されるんだろうか? だとしたらこのページの内容の有効期限はあなたがつぎの読点を見終わるまでです→。
(11:28)
CMUCL と GCL と CLISP と ACL と LispWorks をどれもインストルーしてみたが、 ちがいがわからん。つうか、違うのだが、だから、なんなの? って感じ。 この手のやつぁ、参っちまうよなあ。CLISP はコンパイルできないみたいだが (executable にすることで、.fas とは別)、どのみち今回の仕事では必要ない。 と、すると、一体ドレがいいのよ?? Scheme でもそうだったが、 実装がたくさんありすぎてワケわかんない。しかも CommonLisp 標準は OS-specific な部分を定義していないため、run-program とか ext:*args* とかの部分は重要なのにもかかわらず実装依存である。 ちっくしょうめ。
(11:56)
なんでこの業界にはこうまともに makefile とかシェルスクリプトもかけない奴が多いのか? ぶつくさ つうか、ここまでひどいと「本当にちゃんと結果の正当性をテストできてるのか?」と心配になる。 論文に書いてある数字はいったいどうやって出したんだ。まさか手で数えたのだろうか。 そんんなアホな
(14:43)
また研究のことであれこれ話しこんでしまい落ちこむ。 きょうの議題は「ヒトはいったいどれだけ難しいことをやれば PhD に値するのか」という、 これまたアレしそうな話である。「お前は頭がいいんだからもうちょっとがんばれ」とか 言われても (どうせお世辞だろうけど)、「ホントに頭がいいんだったら なおさら自然言語処理なんかに人生の貴重な時間をついやす暇ないでしょ?」と言いたかった。 ほどほどでいーじゃん。でも、口にだすのはやめておいた。 まあ、オレが頭いいにせよそうでないにせよ、どっちにしろ 人生修行は必要だってことだ。イヤなことでも我慢してやりとげるという修行がね…。 オレとしては、こんなことやってる暇あったらきちんとプログラマしてたほうが よっぽど世の中のお役に立てそうな気がするのですが、そういうこと言ってると 哀しくなるから言わない。何事にせよそんなに甘くないだろうし、誰でも隣の芝は青く見えるという可能性もあるし、 それに、やりかけたことを途中でやめるのは好きじゃないのだ。でも書いておくぞ。

まあ、アメ国の税金もらって NY でフラフラしてるという 時間が与えられただけでもラッキーなのかもしれない。こう書くと PhD 学生って ニートとまるっきり同じじゃん。一体なにがどう違うのよ?

(追記) すこし前までは、言語処理という分野から、より自分が関心をもっている分野 (言語処理とは異なるが微妙に関連している) へ向かう道があるんではないかと思っていた。 でもそんな道はちっともないことがわかったけど、もう選んじまったんだから あとはハラ決めてやるしかねえ。だけど困ったことに、もう全速力でやるのはアホらしくなってしまっている。 あとはこの分野で得た知識をいかにうまく利用するかということだけだ…。

そもそも、新山が論文を学会に出すわけは、研究が楽しいためではなくて、 「オレはある程度、言語処理の研究のマネごとをしました」という証拠が 欲しいだけなのだ。努力賞のようなものとして。自分としては、そんなの全然意味ない とわかってはいるのだが、職業研究者にとっては一種の資格として PhD や論文数が必要なのである。 自分が言語処理の研究者に向いているとは思えないんだけど、 せっかく「養成所」に入ったんだから、まあ、とれるときに資格はとっておかないとね。 もったいないsi。でも、この分野にはすでに見切りをつけているので、 「発展に寄与したい」などという殊勝なことは毛頭考えてない。 そこまで考えなきゃ phd くれないわけ?

とにかく、オレはこんなに長期のスパンでものごとを打算的に考えることに慣れていない。 世の中にそういうのが得意な人がいることは知っているけど。

(02:15)
ワオー! そりゃ新しいね新しい

今日かったリンゴが激ボケの激マズだった。 オレはこういうことにはすぐ腹を立てるぞ。直情的に! なぜならオレにはその権利がある! 権利、権利! きみたちがそれをすでに奏でているあいだに、オレは急速にその資格をうしなった。

てくるで adobe によれば Acrobat Reader 7.0 の Linux 版を出すそうだが、 いつになったら出るんだろ。

Jan 12 [Wed]


(08:14)
特殊な
(08:51)
ガーソ! iLife'05 が出ていたなんて…。でもまあいいか。 とりあえず iPhょto のスピードが確保できればよいのだ。 だいたいカメラもないのに iMovie なんて何に使うんだよ? オレはそんなに暇人じゃない。
(09:29)
荷物着いたってさ。ヨカタネ

ねんねこねんねんねこねん

ちなみに、うちの親に HomestarRunner を 見せたときの第一声:
「なにこの子? ダウン症!?」

(14:05)
あzzzzもうこんな時間じゃねえかzzzzz
(15:03)
ああ眠い眠い。ネムいと散歩でもしなければやってられなくなるが、そういうときは 外出したときにすませておくべき用事を忘れてるので これからはメモにかいておかねばならないな。
(15:14)
ねむくないのでハイテンソン

…曲がらないのに合図出すんじゃねいよ、あの馬鹿野郎!!

でもよく見たらそこわ one-way でムリだった

one-wayなのに合図出すんじゃねいよこの野郎!!

つーかその前にオレが気づけ
なんで気づかないんだこのオレわあああああああ〜〜〜!! (壁に打撲! : 頭 → |壁 、頭 → |壁 、  )

打撲と敗北は違うけど違わないよ。

(15:35)
宇宙はカフェインに満たされており、光はその中を伝わる。
(15:58)
GMail に脆弱性発見だって。 http://dump.hbx.us/gmail_bug_hack/

ヘッダのみからなる (本文なしの) メールを送り、ヘッダの最後を From: にして、アドレス末尾の > を 欠けた状態で送ると、GMail 内部でのバッファスキャンがオーバーランして、 送られたメッセージに次の人のメール (だれかは知らないが、とにかくそのバッファの次にあったメッセージ) が含まれてしまうというバグである。GMail はすでに対策していて、 今はもうこういうメールを受けとらなくなっているようだが、意外とダサいね。 これはまえに就職パーティーに行ったあたりから感じていたことだけど、 Google は羽振りがよくて目立つのでだまされている人が多いが、じつは 結構チープでいい加減な会社という印象だ。スゴそうに見えるのはその秘密主義のせいで、 いざフタを開けてみるとセキュリティもこの程度ってことだし…。きっと他にもボロが出る部分は 山ほどあるだろう。この程度の技術力をベタホメする奴ってどういうアホだろうな。そういう方々は Amazon にふりまわされ、Yahoo にもふりまわされ、そして今は Google にふりまわされているのだろうか。 まあ、Livedoor とかに比べれば多少はマシなのかもしんないけど。

(22:55)
nytimes の料理評にはつくづくあきれるね。 やつらには白米に醤油かけて「日本食です」って言っときゃいいんだ。

しかしひるがえって、スーパーで売るタマネギの形にまでこだわり、 「輸入してまで食べ残す」国とどっちがましなのかと言われれば答えられない。

いつも米国の食い物の悪口ばかり言っているけれど、 一方でこの国には日本なんかがあと 100年たってもたぶん真似できないような いい特徴 (現場主義や、個人の意志の村長など) があるのも事実だ。 でも気になるのは、これらのいい面と悪い面が、実は奥深くでは互いに不可分なものかもしれない? ってこと。つまり米国人の食い物に対する感覚がアホいのは、 かれらが個人の意志を村長するために不可避的に生じた結果なのであって、 決して独立してとりだすことはできないのだろうか。そんなことぁないと思うけどな。 でももしかしたらあるかもしれない。だとすると、どっちかを選ぶかぎりもう片方からは どうやっても逃れられないことになる。だからオレはどっちも選ばんってことだけど。 米国にきてわかったことのひとつは、オレにとっては理念やなにかよりも自分の胃袋のほうが大事だってことだ。

Jan 11 [Tue]


(07:23)
おはようご財鱒。
(10:10)
ふと、ある種の法則を思いついた:
  1. 現実 (ネット以外) の有名人が必ずしも自意識過剰であるとは限らない。
  2. ネット上の有名人はほぼ必ず自意識過剰である。

これは、ネット上にマスコミのようなものが存在しない (というか、ネット上の有名人が「自己マスコミ化」している) ことを考えれば 理解できる現象ではある。しかしここらへんのマスメディア化は着実に進行しているので、 いづれ「誰でも情報発信できる」などというネットの特徴がただのお題目になるのは そう遠い将来でもないだろう (たとえそれが原理的に可能であったとしても、 それなりの知名度があればネット上で大声を出して、あの手この手で 発信された情報を無効化することなぞわけないことだ)。 けっきょくのところ、ほとんどの人は自分の感覚など アテにしていなくて、あらかじめ誰かに選んでもらった情報しか見たくない。 だから「情報を選んであげる人 (つまりマスコミ)」がどこかで成長し、 やがてそれが支配するのは、ある意味必然といえる。

(14:05)
最近ノロノロウイルスうるせーな。

tekuruで。

http://www.aamt.info/localportal/japan/japan.htm:

MT SUMMIT Xは2005年9月12日〜15日にプーケットで開催されます。
開催されるんですか? 個人的にはどうでもいいんだけど。

「MT SUMMIT X」って名前はカッコいいね! 省略すると「MSX」だ。

(15:16)
てくるで、昨日帰りの飛行機の中で Python2.4/Lib/email/FeedParser.py のバグをひとつ なおしたが、CVS をみるとこれは 12月 5日に fix されており、また先を越されたのだった。

こんなことぐらいナンデモないぞ! ViewCVS はともだち。

(15:56)
爆笑メモ。いま鈴木からピッツバーグに着いたという連絡が入ったが、見事に 荷物をロストしたらしい。だーかーらー、事前に「手荷物持ち込みにしたほうがいいよ」って言ったじゃん! 今まで何人もこうなった人を知ってるんだから! (これで 4人目? か? オレのまわりでは。) おまけに成田では手荷物オンリーだとチェックインも早くなるというのにさ (航空会社によっては、専用のカウンタがあるのだ)。ばーかばーか。人の忠告はちゃんと聞くもんだ!

こういうときに、不本意ながら「都会でよかった!」と思う。 直行便を使うという手もあるけど、NY ならともかく、ピッツバーグじゃこれは難しい。 しかしだなあスズキ、ふつう、こういう時は 1、2日分の着替えは分けて持ち込みにしておくもんなんだよ。 ちなみにアメリカ人はデッカイ荷物でもむりやり手荷物持ち込みにしているのをよく見るが、 それにはこういう理由があるのだ。

(17:58)
ふうーー、Adam のコードがやっと CMUCL で動いた。 これで ACL に依存しなくてよくなる。ところで、今年はやはり ACL に論文を出せないが、 へれんはなんと 2つも! 出したらしい。負けた。ところで、Squid の ACL って書きにくいと思う。 なぜなに?
(18:20)
そして clisp のほうが速かった。readline も使えるし、こっちのほうがいいや。

で、とくに関係あるわけでもないが、これから lispnyc のミーティングがあるのである。

(01:45)
ifoto4 をインストルーした。 $30 だったので衝動買い (だが、秋葉原へいけばこんなモン 500円くらいで叩き売られてそうである)。 たしかに動作は速くなったが、こんどは起動と終了に時間がかかる。 きょうは時差ボーだったので大変。もうねる おやみす
Yusuke Shinyama