2006年 4月 (1)。

Last Modified: Sun Apr 16 19:45:37 EDT 2006 (04/17, 08:45 JST)

Apr 15 [Sat]


(15:10)
ジャムとピペがまだ続いていたとわ知らなかった。 ちなみに、新山はこの路線で 「ニャッキ」 「キップリングJr.」 「パクシ」が 非常に好きです。いちばん好きなのはキップリングJr.かな。 雰囲気としては「ぼのぼの」第1巻に近い。 この 2つに共通しているのは、読者や視聴者に「理解させる」ということを目的とせず、 純粋に「楽しませる」ことのみを追求しているところにあると思う。 一般的な映画やアニメでは、ユーザは意味を理解できねば楽しくないと思っている。 ところが、実際にはこの 2つは独立なもので、 意味などなくても「楽しい」ものがあるんだよなあ。

ほんらい「悲しい」とか「腹が立つ」などの感情は、 意味を理解しなければ出てこない。しかし「楽しい」という感情は、 意味を理解せずとも成立する場合がある。これはよく考えてみれば すごいことだと思うんだけど。

(17:02)
いや、それにしても ATSUI ね。 今日は (こんにちは)。

今日の Broadway + 8st.

(21:39)
よぅーーーやく Condor が動くようになった。 これは unix 用のお手軽な分散処理スケジューラであるが、 いやはや、ひどいしろもんだ。まともに動かすのに数時間もつぶしたよ。 ようするに原理は NFS でディレクトリを全部共有して (あるいは ssh でファイル転送して) condor 権限でリモートにプロセスを実行するってもんだが、まずこれを理解するまでに 非常に時間がかかった (ドキュメントは沢山あるのだが、いくつものケースを説明しているくせに、 おおまかな仕組みは説明してないのである)。そして設定ファイル (すげー長い) を あっちこっち変更しなければまともに動かない。とくに ssh でログインして 作業しているといつまでたってもジョブが開始しない。端末が使われていると、 そのマシンが「ユーザによって対話的に使用中」であると判断されてしまうのであった。 いや、これは計算専用マシンなんだからいいんだってば。原因が Keyboardうんたらの 設定にあるとわかるまでに非常時間かかる。ML の膨大な議論も役に立たず。 そのあと今度は glibc のバージョン差異によりマシンごとに微妙に異なる設定をしなければいけない。 おいおいこれじゃー設定ファイルが一元化できんじゃないか。これはきったない方法で解決。 そしたら次は Java Universe が動かねええ。ようわからんが、マニュアルに 書かれてない細工をしなければだめらしい。ふざけんな。 おまけに、バイナリ配布しかないのが気に入らん。FreeBSD の ports もない。 くそったれ。しかし他に何も代替品がないというのがつらいところだ。 本当は正攻法では PVM とかを使うべきなんかもしれないが、そのためにはコードを書き換えねばならず、 そんなことやれる人はこの周りにはいない。まあ JVM が自動的にチェックポイントしてくれれば、 少なくとも Ralph が書いているコードについては十分なのかもしれない。 しかしまだ本当に大規模な実験をこれでやっていないので、いまいち信用できんなあ。 管理もタイヘンだし、おまけにセキュリティ的に非常に不安な設計なんだけど。
(00:42)
くそーーー。ssh の翻訳めんどい。 微妙に過去の訳が利用できないぐらいに変えられていやがる。 まあ、どうせ英文を修正するやつは、これを翻訳しようとしてる 人間がいるなどとは考えてないんだろうなあ、ちくしょうめ。 そしてこの roff 形式というやつがまた人をムカつかせるようにできてるんだ、こんなろ。 もう次回からは全部 HTML に直しちゃおうかな。不毛だよ。
(01:38)
ssh(1) は…明日やります…。

Apr 14 [Fri]


(13:19)
今日のはつまんないトークだった。 今回もプログラム検証系だが、前回の 2つにくらべるとあきらかにわかりにくい。 まあ「わかりにくい」 == 即つまんないかというとそれは問題だが、 今日のねーちゃんの講演にはまったく「遊び」というもんがない。 し、楽しそうでもない。Ralph は途中から論文を読みだした。 ACL論文を査読してるのかと思ったら、新山の論文を添削してたんだそうな。
(16:59)
今日もういっこのトーク (NYCNLP) のほうはアラビア語の形態論についての話が聞けて、面白かった。 途中から svm をつかって形態素解析をうんたら…という部分はドーーでもよかったが、 アラビア語の語形変化ってすっげーカッコいい。前にもちょっと書いたけど、まず3つの子音列からなる 根 (root, triliteral) があって、それに母音のパターン (pattern) を組み合わせて形態素 (lexeme) ができる。 それでこのパターンっていうのが複雑で、単純にひとつながりの文字列になっていない。 つまり子音が各母音のあいだに「はさまる」ように置かれる (くわしくは Wikipediaを参照)。 しかも lexeme のあとの語形変化もすごい。副詞やら助動詞やら接続詞やらがぞろぞろつながって、 一個の単語になってしまうのである。それにしてもアラビア語とヘブライ語ってかなり近いのに、 民族はあんなに仲悪いんだもんなあ、まったく世の中わかんないよ…。

トークが終わってからアラビア語の固有名詞について質問したのだが、この話もおもしろかった。 機械翻訳では外国語の名前処理はつねに難問であり、これだけでいっこの 研究分野になっている。 アラビア語では名前もやはり root と pattern からなっているのだが、 アラビア語ネイティブの人は外国の名前もまるでアラビア語の root からできているかのように 活用させるらしい。ちなみに英語圏におけるアラビア語の名前には、 従来から 「カダフィ問題 (カダフィ大佐の名前が Qaddafi, Gaddafi, Kadafi, Kaddafi ... などと表現されて一定しないこと)」 というのが存在していたが、同じようにアラビア語圏には 「Schwarzenegger 問題 (シュワルツェネガーの名前がアラビア語の綴りで 10通り以上にも表現されている)」 があるそうな。どうでもいいけど、英米人に「Schwarzeneggerって綴りを書け」というのは、 日本人に「憂鬱って漢字で書け」といっているのと似てんじゃないか。細かいところはみんな覚えてない。 そういえばむかし (中学生ぐらいのころ) 新山は「疑」の字をよく「ヒ」と「マ」の部分を逆に書いていた。

さて、論文の直しも終わって、あとわ提出するダケだ… と思っていたら、おいコラぁ! オンライン提出のためのサイトが落ちてるじゃないか! このバカめ。

(17:26)
だうでもいいが (どうでもYR)、新山の使っている銀行がいつのまにか 「三菱ナントカうふじ (UFJ) 銀行」という名前に変わっていた。 ついでに店名も変わっていた (が、暗番号はさすがに変わっていなかッタ)。 それにしてもこの新しいドメイン名はどうだろう?? mufg.jp だと? 『むぅふ.jp』ってなんだよ? 『むぅふ.jp』って!?
(00:58)
ようやく何かに追い立てられるような生活が終わった。 原稿もほとんど終わったし、もうひとつの原稿もあとは提出するばかりだし、 明日は 1ヵ月半ぶりに晴れてノビノビと休めそうな感じである。 Traiss の翻訳も再開した。というか、たまっていた趣味仕事 (?) をまず片付けないとな。 OpenSSH の man をいーかげんにさっさと訳さなくてはいけないし (ssh のところでつっかえている)、 あとバージョンあっぷした webstemmer の説明書も書かなきゃいなんないし (プログラムはすでに完成して使っているのだが、新山はちゃんとした ドキュメントができるまでリリースしない主義なので)。vnc2swf もいろいろやんなきゃいけないし。 なんか、雑用っぽいことが多いなあ。趣味のハズなのに…。 そんなことよりオレは作りたいモンがまだいっぱいあるんだよ! しかしなによりもカニよりも、今の目標は、寝よう、 とこういうことである。

明日は暑くなるようだ。ひさびさに図書館か美術館か本屋に行こうかな。

Apr 13 [Thu]


(16:42)
さて。
(18:21)
今日は 2回も FedEx のサポートに電話をかけることになっちまった。チクショウめ。

FedEx のサイトはすごいとは思うが、非常に使いにくい。ついでに言うと 電話サポートはさらに使いにくい。音声認識を使ってるんだが、 ちょっと受話器にノイズが入っただけでも「Sorry, I didn't quite get it. Your option is ...」と繰り返される。おまけに、さらに進展 (?) すると 「問題を口頭で説明してください」とかいって文章を入力させるんだぜ。 音声認識相手に。で、言ったところで結局わかってもらえず、 customer representative (=人間) に forward されて、 もう一度アカウント番号やらなにやらを全部最初から言い直さねばならない。くそったれ。 なんとかなんないのか、あれ。

(21:05)
ワオ! またも有名人が!
From: Heow Eide-Goodman
Subject: [Lisp] Lisp Meeting, May 9th 7:00 at Trinity

Please join us for our next meeting on Tuesday, May 9th from 7:00 to
9:00 at Trinity Lutheran Church.

Peter Seibel presents: "Practical Common Lisp"

    "Should we vacation in Bali or Monaco?"  ....is the query
    put forth to Miss September.  "Well Peter," she says with
    perfect lips "Bali has better food, but Monaco has the
    'Sushi-Girl Backrub Team'".

べつに有名人が好きなわけではないが、なぜ Heow のアニキはいつもこんなに濃い人ばっか連れてこれるのか 不思議でしょうがない。

それはそうと、5月5日は Courant に David Freedman がくるらしいよ。 かれは統計学者なので、アカデミックなトークはとても 新山にはついていけなそうだが…。

(21:31)
TeX で 2人の著者の住所をまとめて書く方法を発見 (はっけそ) した。こうやるのだ:
\author{
Yusuke Shinyama \hspace{2in} Satoshi Sekine \vspace{8pt}
\\New York University\\715, Broadway, 7th Floor\\New York, NY, 10003\\{\normalsize \tt \{yusuke,sekine\}@cs.nyu.edu}
}
バカっぽーーーーー。もう新打法が飯ですね。

Apr 12 [Wed]


(12:00)
あ、あとすこしだ…。あとすこしでこの苦役 (といったら悪いけど、もう飽きた) から解放される…。

てくるで (とこ)、「愛国心」の定義が話題になってるようだが、 「自分の生まれ故郷を、世界の他の地域と同程度に尊重する態度」 ってのはどうかな。あえて「国」って言葉は入れない。 なぜなら新山は「国」ってのがなんだかいまだに直観的によくわかっていないから (というか、最近なおさらわかんなくなってきた)。 しかし「他の地域と同程度に」という部分は絶対ほしいところだ。 ここからは、なんとなく 「自分の故郷を含めて、世界のどの国 (地域) も差別・逆差別しないこと」という ニュアンスがくみとれるから。 そして、そういう態度が最終的にはもっとも「自国を愛する」ことになるのだ、という、 どことなく禅っぽくて逆説めいた主張を誰かが言う必要があるんじゃないか? そしたらすげーカッコいいし、独自性が出ていいと思うんだけど…

そもそも本当に日本人にとって問題なのは、 つねに「自分を (相対的に) 落とす」ことが美徳とされてるってとこだろう (といってもこの美徳は表面上だけのもので、ほとんどの日本人は 内心非常にプライドが高い、というのが新山の印象だけど)。 日本が中国やアメリカに対して及び腰というのは、たいてい 「自分を落としすぎ」なのが原因なんであって、なにもフツーに対等に接すりゃいいのよ。 しかし他人の目を気にするよう骨の髄まで鍛えられた人間にとって、これは簡単なことではない。 「愛国心」をうんぬんするセンセー方がいつも「自分の国 (地域)」というような意味の言葉しか使わないのがムカつく。 日本には内省的な人間が少ないらしいので (←もちろんこれは、新山の勝手な推測)、 「自分」を基準とした絶対的な価値観というのはいつかかならず暴走するに決まっている。

(15:04)
xterm で遊ぼうシリーズ・その 439147:
  1. xterm のスクロールバー機能をオンにし、ウィンドウを画面いっぱいにする。
  2. yes を実行する。
  3. すぐさま Control-C を実行し、止める。 スクロールして最初のプロンプトがまだ上のほうに残っていたら成功。 失敗したら首くくる。

xterm の saveLines 属性やフォントの大きさにより難易度が変わるという画期的な遊びです。 資格は一切必要ありません。ちなみに新山はビットマップフォント使用で saveLines = 1024 で、 3回に1回成功する、といった具合。

(18:25)
某学会の KameLa-ready version を書く。 いちばんの問題は、すでにフルフルだった状態のところに、 謝辞を入れてどうやって 8ページにおさめんのか、とゆうことだ。 まず table の引数やら位置やらをあれこれ調整して、 同時に単語が 1コだけはみ出してる部分をなるべくけずって 行数をかせぎ、それでもだめなのであっちこっちの図表を小さくして なんとか 8ページにおさまった。 ある図などはこれ以上縮めると改行位置がズレて 逆にページ数が増えてしまうという現象がおこっている。 フモーーーーーーっ! 不毛どころか無毛であるが、 これらはどっちのほうが毛が少ないの? 「非毛」というのは ポリシーとしてやってるような気がする (何が? 何を?)。 H嬢はこういうときに最初のタイトルと本文との間のスペースを縮めるといってたが、 おいおい、そりゃ禁じ手だろ。 それから、複数の著者の住所が同じときイッカショにまとめるやり方がわからん。 ふたつ並べて書くとおそろしく間抜けに見える。 とにかく TeX は不毛なソフトウェアだ。原始的なわりには 意味もなくデッカくて複雑だし、おまけに亜流がいくつもあって互換性ないし、もう最悪。 いつ脱却できるのやら。研究者をやめれば脱却できるだろう…が、 脱却する先が Word じゃなあ。この状況を比喩的に表現すると、 ということになる。どっちも最悪。

てくるで日本では Xbox360 は「弥勒王」と呼ばれていたりするのか?<br
しないな、やっぱ。

(22:24)
くら
  くら

…してきたので、回転するイスにのってぐるるるるるるうるっるるるっっrるるっと廻ってみる。

くら
       くら
(07:10)
オレってはやおきーーーーーーーーー

Apr 11 [Tue]


(09:46)
じっけそのけっかがでた。しかし、よくない。しかも、自動的評価がやっぱできない。 というのは、クラスタされた事象の種類を手で判定する必要があるためで…。 ああ、でもそれは必要ぬいのか? よくわからぬい。

都合の知るかぎりでは、ワシントヌ・スクワーには 4箇所、計 7〜8本の染井吉野が生えている。 いま、ちょうど満開だ。実際には満開をやや過ぎたあたりかもしれず、葉っぱ出ている。 しかしけれども周囲に櫻の花びらがゼンゼン落チテナイので (このようにカタカナで書かれた部分は 「落チナイ」のように関西風に発音する)、しごくつまらない。 ひどく。ああ、ひどいね。今日の夕食はピザの予定。

ところで (てくるで)、「バカスカ」とか「ギャースカ」の「スカ」って何だろう?? これもぜそぜそ関係ないが、長野の方言に「タークラター」という、他人を罵倒するときに使う形容詞があるが (用例. 「ったく、あいつはタークラターだで!」)、これもじつは意味コ不明だ。

追伸: devious (ヒネた) と dubious (疑っている) は混同しやすいから注意。

(15:35)
FFFalafel を 2つ買ったので、夕食にピザを食う必要は泣く鳴った。でんぐりん。

ところで、ふと思ったのだが、

である。Weird ではないので注意。 ちなみに、ぜんぜん読んでないけど slashdot.jp はたぶん東スポ以下。
(17:45)
404 になると別のページにリダイレクトするサイトのムカつき性について。 URL 入力を間違ったときにタイプして直せねえだろ、ばか!

たとえば、 こんなの

(01:48)
仕事したくなくなったので、今日は 10時ごろになってから lispnyc みーてぃんぐに出かける。westside ぶるわりー。 しかし新山が着いたら一同はすでに店を出るところで、 「おめーらつぎは CITRUS へいくぞぉー!」という展開だった。 で、そっちえ移動して Frozen Margarita とかオゴられるままに飲んでいたら、 やたらとアルコールがきつくて酔った。帰りの電車ん中はほとんど沈没。

てくるで (ところで)、きょうはようやく H嬢が "#!" の意味を理解したらしい。 よくやった。これでようやく「なんにもわかってない UNIX素人」から抜け出して、 「さっぱりわかってない UNIX 初心者」のレベルの仲間入りである。 ちなみに現在の新山のレベルは「まるでわかってない UNIX 初心者」といったところ。

Apr 10 [Mon]


(13:47)
てくるで、すこし前の話になるけれど、 Apple が Mac 上でも Windows が走るようにしたというニュースにはがっかりしたよ…。 Apple は Windows のようなアホなソフトウェアからユーザを護るべきじゃないのか。 新山はあの OS が本当に世の中に害をなしていると思う。 いい思いしてんのは MS とその手下だけじゃん。
(15:08)
ころきあのお知らせう。(tyypo) 個人的には興味のないテーマなんだけど、自分の研究には関係があるかもしれない (= つまり新山は現在、自分の研究テーマにあまり興味がない) ので出ておく必要があるか。も。な
SPECIAL SEMINAR ANNOUNCEMENT

Time: Thursday, April 20, 2006 at 11:00AM

Place: 719 Broadway, Room 1221

Host: Yann LeCun

  Affinity propagation for combined bottom-up and top-down clustering

  Brendan J. Frey, University of Toronto

Clustering is a critical task in the analysis of scientific data and in
natural or artificial sensory processing. Existing techniques either are
bottom-up and make pair-wise decisions when linking together training cases,
or are top-down and represent each cluster using a parametric model, while
alternately assigning training cases to clusters and updating parameters.
I'll describe an algorithm that we call `affinity propagation', which for
the first time combines complementary advantages of these distinct
approaches. Affinity propagation can use sophisticated cluster models, but
operates by propagating real-valued messages between pairs of training
cases. Because affinity propagation replaces the estimation of model
parameters with a step that considers many potential models and many
possible cluster assignments, it can find better solutions than strictly
bottom-up or top-down methods.

HRgHRmST (はらがへりました)

(23:02)
PATH の JSQ 駅周辺にはデカい岩肌がのぞいている部分が多い。 ところでプラットフォームから見える黄色い花があるのだけど、あれはなんだろう。 いまの季節はまさに岩にそって「咲きみだれている」というかんじだ。 近くまで行けないのでこまかい特徴がわからないが、色は山吹のようだけど、 山吹ではないうよな…。 あんなところは別に誰も手入れしないだろうから、自生してんだろうけど、ほかではあまり見たことがない。

Apr 09 [Sun]


(15:31)
ところでふと考える。新山はあまのじゃくだと思っているが、 じつは「あまのじゃく」って言葉は日本でしか通用しないんではないか。 あるいは、日本での効果がもっとも高い。 というのは「その他多勢と違ったことをしてみる」というのは、 べつに米国では普通だから。「あまのじゃく」が存在するためには、 まず従順な集団がいないとできない。

どうでもいいが、ブラジャーのサイズがデカくなるにしたがって A, B, C, ... と呼ばれるが、 Z を超えたら台風と同じようにギリシャ文字使用で「γ-cup」とか呼ばれるようになるのか。

(追記: 服のサイズも S, M, L, X, XX, ... ではそのうち XXXCVI とかになることは目に見えている。なぜ A からにしなかったのか)

google://転向/

(17:15)
すんげーーーいい天気。360度、雲ひとつなし。

Apr 08 [Sat]


(23:26)
ふと思ったんだけど、オレの英語学習の目標っつうのは 「アメリカ人と口論できる程度の英語力」って感じがする。 しかしここで口論というのはべつに悪口の応酬なわけではないので (まあ、5% ぐらいは悪口かもしれないが)、そんなに難しい語彙を知ってる必要はない。 むしろ人と口論するさいに必要なのは、筋を通すことと、 自分の意見をズバっと簡潔にまとめる能力だろう。 最初から言ってることがわからない人とはそもそも口ゲンカさえできないかんな。

Apr 07 [Fri]


(11:05)
ころきあ。
Refreshments will be served at 11:15 AM
Friday, April 7, 2006 - 11:30 AM
Room 1302 Warren Weaver Hall
251 Mercer Street
New York, NY 10012-1185

Speaker:  John Whaley, Stanford University
Title: Program Analysis with Binary Decision Diagrams

(12:59) …いまこのトークから帰ってきたところだが、いまだに興奮冷めやらない。 ひさしぶりに大当たりのトークだった。 基本的なテーマは先週の人と似ており、 プログラム解析 + バグ発見のツールについて研究している若僧 (新山とたいして歳はちがわないと思う) だったが、 いや、ああいう研究者になりたいもんだと思う。 まさに「脱帽」である。なにがいいって、まずプレゼンがしっかりしてるのがいい。 背景説明のところでも既存の研究がどういう流れで、自分の研究は その中でどういう位置づけなのかということをきっちりわかりやすく説明している。 新山はこの研究でおもに使われていた BDD (Binary Decision Diagram) というものとその最適化を知らなかったんだけど、それの説明もポイントをついてるし、 Datalog については知らなかったが、どうやら Prolog の一種らしいことはわかった。 それにほとんどの説明に図がついているのに好感がもてる。 メインのアルゴリズムの説明も、あっちこっち飛躍して可能性を探りつつ 足場を固めていく感じの説明ですんごくわかりやすい。 この人はとにかくいろんなアイデアを思いついてそれらをみんな 実装しているので、それらをいっこいっこ説明してるだけで場内からは 「そこまでやるか!」という笑いが起きていた。 今回のトークではジョークは全然なかったが、基本的にお茶目な人なんだと思う。 そしてそしてついでにこの人、後頭部の毛がハネてるのね。 これがなんか知らんけどいい味だしてるのである。 いや、ごちそうさまでした。あとでファンレターでも送ろうかな。

ちなみに彼の一連のツールは SourceForge で公開されている: http://bddbddb.sourceforge.net/

ところで、きのうとおととい 2日続けて Washington Sq. 周辺で大量の映画トレーラーが停まっているのを見かけた。 20メートルぐらいのトレーラーが 10台以上、牽引するコンテナ 20台ぐらいが ずらーーーっとあちこちの通りに並んでいる。よほどの映画らしい。 しかも、夜まで照明つけてずっと撮影してた。どこから電源を確保してんのかわからなかったが、 歩道のそこいらじゅうにぶっとい (3cmぐらいの) 電源ケーブルが何本も這っている。 あと、あのコンテナみたいなのは、一度ドアが開いてるのをのぞいてみたことがあるのだが、 中はリビングみたいになってた。つまりあれは役者の控え室用か? もしかして 1俳優 につき コンテナ 1個が必要なのか? そして彼らは夜になるとサっと撤収する。すげえよ。 ああいう光景を見ると、映画を一本撮るってのがどれくらいカネのかかるものかがわかる。 とーぜんこんな撮影は警察の許可も必要だろうし。そこまでカネをかけて 架空の世界を演出するってのがオレにはわからない。そしてそれが売れる! というのがなおさらわからん。 文字でいいじゃん、文字で。

というかオレは映画を見る感覚で他人の研究発表を評論してるような気がするんだけど、 これはどうなのよ?

(18:18)
Baruch のカンファレンスで見たいものがあったんで、ちょっと顔を出してくる。 したらすげー聴衆が少なかった。人気ないのね。

どうでもいいけど (どうれもよろ)、さいきんやたら肌や唇が荒れているのは (寒くもないのに!)、 花粉症の薬を飲んでいるせいなのだろうか?

Apr 06 [Thu]


(20:30)
ニューヨークからボストン行くにもメンフィス通る、それが FedEx。

それにしても FedEx の overnight 便ってのはすごいね。 きのうの夕方カリフォルニヤから送って、けさニューヨークに着いちゃうんだよ? FedEx ってまさにアメリカじゃないと実現できなそうなシステムだ。 そもそも日本では必要がない。 わざわざ航空機なんかを使って大量運送しなくても、 クロネコやら日通やらの運ちゃんがガンバってくれるんだからさ。 つまり住むなら小さい国に住めと、こういうことになる。

東証や銀行関連のシステムプログラムは死んでもやりたくないが (あと航空機と原子炉も)、 やっぱ物流ってのは情報システムの花型だろうとと勝手に思っている。 なぜなら、これらはどんな世界であっても必ず必要だから。 しかもこれはコンピュータだけではどうにもならない、 間に人間や物理的なモノが介在する、本当の意味での「システム」である。 これに比べると検索エンジンなんかチャチいもんだ。 クロネコや JR の情報システムを設計する SE というのは、さぞかし幸福だろうなあ。 あと製鉄所とか半導体工場とかもかなりスゴそうだね。

ちなみにメンフィス大学には FedEx 技術研究所 があるって知ってた?

Apr 05 [Wed]


(11:32)
げーーーーっ!!! 雪だよ?? 雪ふってるよ??? 一体なんなんだろうな (ぬんぬんづ) 、この世界は。
(13:54)
あることを書いたが、まだここに載せるのはやめておく。 でも「たしかにこの時に書いたぞ」という証拠を残すために SHA1 ハッシュを書いておこう: e50194631365d97c91f0da5d0c6d8fb7495ca69a

非常に落ちこんでおります。

(17:42)
とどす (todos):
(21:14)
キミは CD に歯型をつける方法を知っているかっ。簡単だ。ただ思いっっっきり噛めばよい。 ただし CD はデカイから、よほど口のでかい人でないと奥歯では噛めないので注意。
(21:51)
CD-R を焼いた後に、
$ rm なんとか.iso
とやるつもりで、うっかり
$ vi なんとか.iso
とやっちまった。うわーうわーーー助けてーーオレが悪かった。 こういうときは Control-\ が役につ。
(23:32)
ふと、「精神的 DoS アタック」というものを思いついた。

方法: ターゲットにした人間に向けて、そいつが普段 (仕事などで) 受けとっていそうな 内容のメールとほとんどそっくりの (しかし自動生成したデタラメな) メールを日に 1000通ぐらい、 ランダムな間隔で送る。そうすると、そいつはほとんど仕事ができなくなる。

この攻撃に対処する技術は今のところない。 現在の spam フィルタは、「真に悪意のあるspam」は最初から考えられていないから (「悪意ある」というのは、こうした spam に広告の目的はなく、 ひたすら個人を苦しめるために送られるため)。 spam というのは、ふつう他のメールと内容的にかなり目立った違いがあるのが普通だ。 だから人間がざっと読めばある程度 spam だということがわかる。 しかし「真に悪意のあるspam」は、それがわからない。むしろ受け取り手の普段のメールに できるだけ似せようとして作られているから、 spam フィルタではとうぜん判定できないし、 人間が時間をかけて判定するしかない。にもかかわらず、こういうランダムな文章を自動的に生成するのは、 それを判定するほどむずかしくなく、機械的にできる (可能性が高い)。 だからこれは本当に強力な攻撃になる。 いまでもたぶん特定の個人に恨みをもつ人間が 20〜30人ぐらい集まれば、 この手の攻撃はできるだろう。

もしこのために特定のアドレスやメールサーバがブロックされたら、 複数のアドレスやサーバから出せばよい。「精神的 DDoS アタック」である。 たかが TCP のレベルでさえ DDoS 判定は難問なのに、 これがもっと高度な知識を使わないと判別できなくなったらいったいどうするよ?

こうなるといずれ人はメールを DomainKeys などで認証して 「知っている人」からしか受けとらなくなるだろう。すると、ある日どこかの見知らぬ他人から 電子メールが来て運命の出逢いが! 、といったことはもうなくなる。 電子メールの「開放性」というものは、おそらく永久に失われることになる。

ちなみに、個人の手にできるネットワーク帯域が広がったことによって、 こうした個人攻撃はこれからますますやりやすくなるだろう。

とうぜん、電子メールじゃなくても精神的 DoS は可能だ。 ツウちゃんねるなどで特定の個人 (あるいは組織) に対する誹謗中傷が ずら〜っと並んでいるスレッドなどは、ある意味、この精神的 DoS 攻撃の 原始的な形態といえるのかもしれない。ビル・ゲイツなんかの有名人も 彼は世界一 spam が多いらしいから、すでに精神的 DDoS アタックを 受けているだろう (でもこの場合、個々のメールを出してるのは人間の集団であって機械じゃない)。 google に対しては、(google がランクを下げたがっている) 大量のゴミページがこれに近い。けれどもこれらのページというのは現時点では まだ「広告」がしたいのであって、 google の性能を落とそうとして悪意で作られているわけではない。それに 複数のページ作者が協調しているわけでもない。これがもし「悪意のあるゴミページ」が 協調して世の中に増えだしたらおそろしいことになる (少なくとも、google にとっては)。

こうした攻撃も、これから P2P などの通信が普及するにしたがってやりやすくなるだろう。 「ネットの出現によって個人にもパワーを!」と言いつづけた結果は たぶんそういう世界である。新山はそもそもネットがいいとも悪いとも思っていないので、 どうなろうと文句を言うつもりはない。だけどこういう危険をまったく考慮しないで ネットとかブログロを礼讃してるだけの人間はほんとうに罪深い。

Apr 04 [Tue]


(15:13)
こないだ、メモリが原因で動かなくなったと思っていたマシンだが、 じつは放熱が原因だったということが判明した。 メモリを変えてもあいかわらず落ちるので、「こりゃーもう破棄しないとだめかな」と 思って部品あさりを始めようとしていたところ、 CPU のヒートシンクがガクガクしてることを発見。 レバーをきちっと固定してみたら動い他。なんだ、これが原因かよ。 もっと早くに気づくべきだった。しかしこれでマシンを捨てなくてよくなり、 もったいないおばけの呪いに悩まされることもないので大変うれしいです。
(16:58)
バグとれねーー。もう死んいたい。
(21:27)
午前中は研究をやって午後は別のシゴトをやる。 あーーーーーー。シュラシュラだこと。
(00:38)
また今日もこれしかできなかった。いったいいつになったらオレは…

Apr 03 [Mon]


(23:34)
きょうは ssh の設定をアホっていたせいで、大学からログイんできなかった。 思うに、日記というものは、そのバッファオーバーフローで思い立ったときでなければ書けない。 あれ? ああ、「その場で」って入力しようとしたんだ。 新山の skk 辞書では、「ば」で変換すると、最初の候補に「バッファオーバーフロー」が出てくる。 ちなみに「ぜ」は「脆弱性」である。 「いちじ」は「安全でない一時的ファイル」だしな。まあどうでもよろ。

ところで (てくるで)、キミは Capricorn Technologies の PetaBox を知っているかっ。 1PB (ペタバイト = 2^40バイト) のストレージが 2億円だそうな。 しかも消費電力は 50kW (= 500A) なんだと。ふーん。何個のクラスタなんだか知らないけど、 場所代と電気代と人件費あわせたら合計いくらぐらいなんだろう? 1PB もいらないが、80TB ラックがいっこあれば、セキネさんも しばらくはハードディスク容量でうだうだいうこともないだろうに (もうこの手の話にはつくづく嫌気が差した)。 いっこ 2000万円ぐらいで買えるわけ? Cisco のルータより安いじゃん! そういえばかつて (10年ぐらい前に) 東工大の情報処理センターに 1TB のストレージが入ったときは 学内の機関紙 (「東京工大クロニクル」っすよ) に載ってたような気がする。いまじゃ 1TB っつったら 日立の HDD を 2コ買ってくりゃ終わりだもんな。

研究の話。いままで 4時間かかっていた実験が 40秒で終わる! … つもりであれこれ改造してきたが、たしかに速くはなったけど、いまだにバグがとれない。 つうのはデータベースの mappings が複雑になりすぎてワケわかんなくなっているからで。 やばいなあ。コードは python で 1000行もないんだけどね。

「Python 1000魚ぅ」はいつも新山がアルゴリズムの複雑さを判断する基準になっている。 メインのアルゴリズムだけで 1000行こえたらそいつは複雑すぎだから没。 しかし、最初の段階で 1000行超えていても、ダイエットしてるうちに ドカンドカンと激ヤセして 200行ぐらいになることもあるので油断ならぬい。

tinaminiSin'yama ha... あれ? オフってた。ちなみに新山は速さよりも 単純さ (コードの短さ) を重視する傾向があるようだ。単純さはメンテナンスの容易さにつながり、 ひいてはコードベースを長生きさせることになる。計算時間のオーダーが 変わるんなら話は別だけど、たかだか 2〜3倍のスピードアップで コード量が 2倍になるよりは、遅くても単純なほうがいい。 そんなにスピードが重要なら C で書けってことで。

Apr 02 [Sun]


(14:49)
5w1h

どこよりも早く!
誰よりも速く!
いつよりもハヤク!
何よりも歯屋苦!
どのようによりも889?

あれ? 5つしかないよ? あっこれ

なぜよりもhyk!!

(16:48)
久しぶりに「氏ね」と思った HTML。JavaScriptをオンにしてないと 「JavaScriptをオンにしてね!」とだけ書かれたページに勝手にとばされる。 しかも JavaScriptを入れたところで、しょせん大したことはしていない。 こういうときに勝手に従う Firefox も悪い。Lynx 万歳。
<NOSCRIPT><META http-equiv="refresh" content="0;URL=no-js.html"></NOSCRIPT>
(19:36)
今日からまた世界が 1時間速くなったので、フロアにある壁かけ時計 3つと ラウンジの電子レンジの時計をこっそり進める。 どうせ誰も気づかないだろうが、世界宇宙の平和はこうして保たれるのだ!
(03:14)
まあ、ヤレることを、ヤレるときに、ヤルしかないよな。 月並みだけどよ。
(05:07)
毎日味わうこの敗北感は、自分の仕事に対する見積り能力が激しくダメなところからくるのだ…

寝る。

Apr 01 [Sat]


(12:49)
きょうは亜津井デス寝。

きょうが 4月1日ならあしたは 10月1日だ!

(13:07)
google://いたしまーすドン/
(22:41)
ほぅ、一日はなんと早くたってしまうものか…って、あの火災報知器のバカヤローーー!! うるせーーんだよ! だまりやがれ!
(23:53)
年々ツマんなくなる某社の 4月バカネタについて。
(03:34)

結論: 日本では欧米よりも約 20倍 荒らしが多い。


Yusuke Shinyama