2006年 11月 (6)。

改行するまでが遠足です。

保存するまでが編集です。C-x-

Last Modified: Thu Dec 21 23:20:49 EST 2006 (12/22, 13:20 JST)

Dec 21 [Thu]


(12:40)
またウィキッペか!

ところでみなさんウィキッペに寄付はしましたか? オレはした。雀の並だケド。 まあ、かなり暇つぶしさせてもらったからな。しかし今までに読んだ記事が ぜんぶ書籍になっていると仮定して、これくらいの額なら払うだろう、 という程度の金額なぬで、実をいうと全然 (ぞんぞん) すくない。 しかもコメントは「wikippe!」。まいったか。

(23:13)
経験値がたまるとレベルアップするのがゲーム、
経験値がたまっても一生同じレベルなのが現実。
(23:19)
ところで、google 日本語で 「crap」を検索すると、 よく知っているページが出た。…

これか?? これが crap なのか???

あれまあ。

Dec 20 [Wed]


(11:53)
今朝はバッコリと寝坊した。そのためすこぶる健康である。 アタマの働きもいいし、その結果このような無駄な文章もどんどん進む! イエイ!

で、今日は何がどうなるの?

隣の人がクシャミしてるのを聞いて、ふと指紋や声紋や笑紋と同じように クシャミにも「くしゃみ紋」があるのだということに気づく。

(14:03)
きょう聞いた話によると、むかしはニューヨークにも秋葉原のような、 パーツ街が密集している地域がダウンタウンにあったのだという。 しかし 70年代にそれらの店は全部とり壊された。 そしてその場所に World Trade Center ができた。
(16:22)
さいきん、google で何か検索するたびに「またウィキッペか!」といっているようの気のする。 これが web から得られる品質の最大値だと思われてるんだろうなあ。 まあ実際そんなもんだが。
(19:50)
あす javier にプレゼントする超クールな Tシャツのよせがきを書いていたら、 こんな時間になっちまった。いやーそれにしてもこれ、オレも一枚欲しいくらいだ。 あまりにクール! なのでおもわず写真を撮ったがそれはここには載せないよ。
(22:07)
あんまり劣等感や罪悪感をもってはいけないと思う。 この世の一番の悪事は、劣等感や罪悪感をもっている人によってなされるからだ。
(22:30)
電車の中で、PC や携帯モノその他の「ガジェット類」をいじりまわしてる人は、 なぜいつもあんなにカッコ悪く見えるのだろう。新山もときどき 必要にせまられて PC を公共の場でいじっているときがあるが、 なるべくそういうことはしないようにしてる。短かい答えは、おそらく これが「機械に使われている」ように見えるからだが、 具体的にこれがどういう場合にどうカッコ悪いのかはまだうまく説明できない。 いずれ時間のあるときに考えないとね。

Dec 19 [Tue]


(05:21)
めづらしく激早起きした。 そしたらなんか Adam からメールが来た。 彼はこんな時間から lisp をいじっているらし。 なにやってんだ、このおっさんは? (いやオレもだけど)
(06:57)
ふーー。ようやくカード類を書き終わったが、 スズキと児島の住所がわからね〜! アイツら、たしか引っ越してたはずなんだが、 年賀状がみつからん。ということで、朝っぱらから郵便物をひっかきまわす。くそったれ。 やっと見つかった。ホコリでかなりクシャミでる。それにしても児島、 勤務先がバレバレの住所だな。 あいかわらず Java ってんのか? (中略) まあどうでもよろ。

さて、私は

  1. 郵便局が開くまでこのまま時間をつぶす (途中で寝そう)
  2. サッサと大学へ行く (それも寝そう)
(09:52)
ねむいdes.

結局のところ、ユウベン国は 7:30 からやっていたので、 さっさと大学に来てしまった。久しぶりに朝早くにデリへ行って 気づいたことがある。冬になるとよくスープを買うのだが、 まだ新しいスープは (Italian vegs. なぞは) 具が水面近くに浮いていることが多い。 これが時間がたってくると沈んでくる。と、いうよりは、 たぶん表面にある具をみんなとっちゃって下のほうにあるのしか残っていない 状態になるのね。ああ眠い眠いもう寝ちゃおうか。

こういう「朝早く起きすぎて困る状態」というのは 何がいちばん困るかというと、身体は起きているのに 脳はまだ寝てるんである。だからなんとなくフワフワした状態になっており、 大学に出てきてもヤルキー君がまったくない。 だからもうこのボケ〜っとして時間だけが過ぎていくというこのあのアレきわまる状態になってるわけでして、

ケッキョキ (結局)。

(15:05)
睡眠を、さむなくば死を!

まあどうでもいいんだけどよう、 …だめだ。書くこと忘れた。

ところで今きたメール:

Subject: 在ニューヨーク総領事館]【緊急メール】病原性大腸菌O157感染の流行、終了

            <<<緊急メール>>>
在留邦人の皆様へ
                             
    当地における病原性大腸菌O157感染流行の終了について

                       2006年12月19日
...

いまだにこんな懇切丁寧な連絡をくれる国の領事館がどこにある? すばらしい日本国。きっとオレがイクラで遭難しても自衛隊を出して助けてくれるにちがい

ない。

どうでもいいけど、今日だったらしい。 というか「中国では日付が進んでいるので昨日になる」という理屈。 なんだそりゃ。

(16:46)
grande eggnog latte

これは何であるか。

Dec 18 [Mon]


(16:06)
えー、今日じゃないの??
(17:14)
えーー、今日じゃなかったの?? ?
(17:17)
PQR (Python Quick Reference) って、どっか使いにくい。なぜだろう?
(17:58)
自分だけが真実を知っているか、あるいは自分だけが騙されているかのどちらかだ。

どっちもありえないが。

ウソくさい真実と、
真実くさいウソ

(19:05)
おぉぅ、いつのまに SBCL-1.0 になってたんだ?

Dec 17 [Sun]


(18:37)
電車の広告でみかけた enviga 緑茶味というのを試してみたら、 ようするにこれはむかし Pepsi から出ていた "JAZZ IN" だった。 もう 15年ぐらい前のことである。覚えてる人いるかな?

そういえば、米国では電車の「中吊り広告」というものを見たことがない。 これははたして存在するんだろうか?

(20:23)
うつ病とは:
  1. うつ病になると、生きるのに疲れます。(対人生性)
  2. うつ病は絶対に治りません。(うつ病の永久保存性)
  3. うつ病になった人は、来世でもうつ病になります。(転生の法則)
  4. うつ病にならなくても、生きるのに疲れます。(等価原理)

ってゆうか、オレは wikipedia なんか見てないで仕事しろ。たまの日曜に。 タマは関係ない。

(23:23)
ウドンを買ったのに、
卵も買ったのに、
長ネギも買ったのに、
しめじも買ったのに、
油あゲを忘れた!!

さて問題です私が作製しようと考えていたのはなん
でしょう。

  1. キツネそば
  2. オオカミうどん
  3. フェレット麺
  4. なん

うんねこねーん、うんねこねーん。(ネコ目ネコ亜目)

Dec 16 [Sat]


(12:41)
財布の中のカードを整理した。もともとオレはあまりカードを沢山持ち歩かないようにしてるのだけど、 またもや verizon の calling card が一回しか使わずに期限切れとなってしまった。 なんしろ公衆電話を使うのなんか半年に 1回ぐらいだかんな。 携帯電話をもっていないのにこれであるので、よほど電話と縁遠い生活をしているのだらう。

せっかくなので記念撮影。 左上から、保険証、guggenheimの会員証、nyplのカード、右上はキャッシュカード (クレジット兼用)、 MTA地下鉄回数券、PATH回数券、NYU の学生証。

(21:29)
ただ絶望するだけなら誰にでもできるんで、 優雅に絶望することが大事だと思う。人間、
(21:47)
自分が Python インタプリタ中でタイプしたものはすべて ~/.python_history とゆーファイルに残してあるのだが、1年前のものと比べてみた。 1年で 1325行。1日換算すると約 3.6行。たいしたことない,  ね?
(22:56)
Verizon (電話会社) からきたダイレクトメールをみて、あることに気がついた。 彼らが DirecTV のような衛星チャンネルをプロモーションしているのだ。 これはおもしろい。なぜなら彼らにとっては Comcast のようなケーブルテレビ会社を勧めると、 こうした企業は同時に ISP もやっているので、敵に塩を送ることになってしまうからである。 衛星放送であれば ISP の直接のライバルにはなりえないので Verizon としてはこっちを普及させたいわけだ。
(02:30)
「今回の判決は日本のソフトウェア産業にとって…」 とかいってる人にかぎって、じゃあ日本でできたすごいソフトウェアを挙げてみろ、と言ったら、ダメだろうな、やっぱ。 こういう人は結局のところ「すごいソフトウェア」を判断する基準として知名度しか使えない。 正直いって、何もしなくてもすでに日本のソフトウェア技術はだいぶ下だと思うけど (実際には「技術はあってもビジョンがない」という印象)、 世界での「ソフトウェア知名度」を上げることだけを目標とするなら、 外人の前に出ると急に弱気になって押しがヨワくなっちまう日本人にはどだいムリな話である (ruby はアメリカ人に広めてもらえるようになってよかったよね)。 やっぱり世界で一番有名な日本製のソフトウェアはゲームってことになるだろうが、 それは「すごい」のうちに入らないのかい? オレは入ると思うけどね。

↓ ここに、あなたのお気に入りの言い訳を入れてください ↓

[                                          ]

あーわかったわかった。トップダウン主義者にはもううんざりだ。

Dec 15 [Fri]


(12:50)
「書き直せない」というインターフェイスはひどい。ひどすぎる。
(18:45)
a-, まだカード書いてません。書かなきゃ。 誰に書くんだ? えーと、うちの親と、親戚と、大田区の下宿のおばさんと、 アホ1号、2号、3号、4号、5号、Aさん、Bさん、Cさん… これで全部だっけ? いつもいつもカードを買うときには それなりに相手とのマッチングを考えるのだが、 「どうでもいいカード」も何枚かあるので、最適な割り当てを考えるのは大変だ。 足りないこともあるし。といっても、今年は去年セット買いしたやつが まだ余ってるからいーけど。
(20:16)
カナダから CD が届いた。 カナダから。 でもまだインストールはおあずけ。 でも音楽 CD もシャレで一緒に買ってみたので、…うわー何これ。

Dec 14 [Thu]


(12:15)
こないだの話のつづき。「話し合い」が「対決」とみなされるのは実際には日本語だけじゃないと思う。 よく英語で、相手が答えにグっとつまるような質問をしたときに "good question" というけれど、新山はいままで「なんでこれが good question なんだ? またアメリカンお得意の強がりじゃないのか?」と思っていた。 しかし実際に "good question" を使う場面に何十回となく遭遇して、 あるとき気づいたんだけど、 英語ではどうやら「質問 == 攻撃」という図式があるんではないか。 こう考えると難しい質問を good question と呼ぶのも納得がいく。 この言い方はごく日常的に使われるが、ただワケわかんないだけの質問は good question とは呼ばれない。 筋が通っていて、「ああ、その疑問はもっともだが、そこまでは考えていなかった」というような質問を "good question" と呼ぶんである。あるいはこれはテニスの「球」みたいなものかもしれない。 大げさにいえば、英語ではふとした会話の中にもラリーがあって、 相手がパコーンと打ち返してきた球で 「おっ、やられた」と思うような感覚が "good question" なんじゃないか。 これは日本人どうしで会話するときの感覚とはけっこう違う。 とりあえず日本人と話すときは相手とナぁーナぁーナぁーナぁーナぁー…るので、だ。

でも、一般的にいって、 疑問をもつことは最大の攻撃だ。 何に対する攻撃? 何もかもに対して。 その意味で、オレも攻撃的な人生を送りたいもんである。 新山は疑問に対してはかなり粘着質で、 解決されない疑問をずっと「ためこむ」性質があるんだけど、 このぶんだとそのうち破裂すんではないかと心配。

(15:33)
グラタンとクダランの違いについて。

新山はたぶんきっとおそらくもって脳味噌が少ない。しかし「脳味噌少なめ」というのは政治的に公正でないので、 これからは「脳味噌がチャレンジドな人々」ということにしよう。

使用例:

(00:54)
ものすごーーーーーーーくムカつくことがあった。 Apple のバカ。Apple のバカ。Apple のバカ。

もう寝る。

Dec 13 [Wed]


(07:22)
有罪なんだって。なーんか、独自解釈。 しかし、この人も自由なソフト開発が阻害される…とかいってるけど、 あんなものを公開して、バージョンアップして、しかもそれを匿名でやって、 それで「実験です」と言いはって堂々としてるのはなあ。道義的にはマトモじゃないよ。 でも法的にはそれを縛る方法がどこにもなかったんだと思う。 ようするに、法律の負けじゃ。 でも実際には声が大きければ無理もまかり通る世の中なので、 企業なり業界団体なりが「それじゃヤダ」と言えば今回のような独自解釈なんだろう。 だけどさー、道義的にマトモじゃなくても罪に問われない人って 世の中に沢山いるじゃん (その逆もね)。そして、そういう人々は実際 罪に問われるべきじゃないのである。なぜならそれが放置国家のルールだから。 やっぱり日本は「話し合いで解決できない国」のように思われる。 かわりに「雰囲気 (ふいんき) で解決する国」なのだ。 まあ、それで社会がうまくマワってんだから文句ないんだけどさ、 それが日本の独自プロトコルだっつうことは、知っておいてもいいと思うのな。

しかし個人的には「自由なソフト開発」をしたけりゃ実名でソース公開しろと思う (そしたらツウちゃんねるでは敬遠されるだろうけど)。 というか、それまではコソコソやってたのに、 「裁判になったとたんに堂々としだす」ってのがなんかチグハグな感じすんだよね。 居直りと思われても仕方ないと思う。

(14:48)
カマキリの卵で積雪予想

ながのけん人にとって、false positive と false negative という概念は重要だ。

(20:10)
へれんが来て、これこれこういう仕様の (ある意味ミッションクリティカルな) プログラムを作ってるんだけど、と言う。 なんでもそのプログラムは入力として、 x="abc" y="def" z="pqr" ... というような文字列をとる予定らしい。

オレは abc の中に " 自身が含まれたらどうすんだ、と尋いた。 この入力は外部から (人手によるチェックされずに) 与えられるので、 どんなもんが来るのかは前もって正確には予測できない。 普通ならバックスラッシュでエスケープだわな。(これは解析しにくいんで個人的にはキライだけど)

だが彼女いわく、どうもしない。たとえそうなっても、パラメータの順序はあらかじめわかっているので、 x="abc"" というのがあっても次にくるはずの y= を 探せばなんとかなるだろう、という。

ダメだよ。もし x の中身が a" y="b でかつ z の中身が c だったら、その外部表現は x="a" y="b" z="c" になる。 これでは x="a" かつ y="b" かつ z="c" なのか、 x="a y="b" かつ z="c" なのか、 あるいは x="a y="b" z="c" なのか、 曖昧になってしまう。

…と言ったら、そんなことはまず起こんないから大丈夫だ、という。 あのねー。…たいていこういうヤツがブチこわしにするんだ。 ここは重要な部分なんでしょ? しかも人手を介さずに動くところだし。 ある種の感覚のない人々はこの手のシステムを設計してはいけない。

この手の話題では昨日べつの人と話してたんだけど、 機械の故障とソフトウェアのバグはぜんぜん違うという話。 機械はモノでできてるので、それはある日、必ず壊れる。 だから機械を設計するときは「ここは絶対にこう動くだろう」ということは 言えなくて、すべて確率でしか言えない。だから機械の設計ミスというのは、 その見積りが合っていなかったということになる。ところが ソフトウェアの場合は「ここは絶対にこう動く」と言いきれる場合があるのだ (CPU がちゃんと動いている限りは。もっともこれはたいして保証されているわけではないけどね)。 デカくなるとさすがにそれは難しいけど、単純なものだったらそのふるまいは 数学的に証明できるんで、非常に重要とわかってるコードでそれをしないのはアホだろう。

(追記) じつはこの形式を決めたのは Ralph だったらしい。 脱力〜。

(00:37)
今日買ったリンゴが、あまりにも蜜が多かったので、記念に撮影しておく。 でもちょっと甘すぎた、これ。
(02:23)
一度寝たんだけど、目がさめてしまった。

こないだの tar の話のつづき。 bsddb でも gdbm でも「なんか、気にいらない」のは、 レコードを書き換え可能にするために、領域管理を自前でやっていることである。 つまりレコードが伸びたから新しくファイルを伸ばそうとか、 このレコードが削除されたからこの領域を再利用しようとかいった話。 でも、ほんらいこういった領域の確保や解放はファイルシステムの仕事なんだよ。 何が哀しうてそれをまた 1ファイルの中でやんなきゃいけないわけ? そりゃスピードが非常に重要な局面で、システムコール 1回でも時間が惜しいっていうことはあるだろう。 じっさい、Oracle の人々はファイルシステムをバイパスしてディスクに直書きすれば もっと最適化できる思っており、「OSは余計なことしてくれるな」っていう立場だ。 でも、うちら一般人はすでにある枠組みでオッケーなことが多いんだから、 なにも同じことをまたいちいち繰り返さなくてもいいと思うけどなあ。

Dec 12 [Tue]


(13:31)
「外国人お断り」について。 この文句は日本好きの非日本人の間ではデンパ文句として有名であるのだが (ウケを狙った「外国人お断り」Tシャツまである)、なぜか日本では普通に受け入れられている。 これは結局のところ、日本人が「話し合いで解決しようとしない民族」だからに他ならないと思う。 ようするに日本ってのは基本的に「言わなくてもわかるでしょ? わかってよ!」という文化なので、 わかんない人にうまく言って聞かせるという状況に人はあまり慣れてない。 むしろ言って聞かせようとする行為を人は「対決」と見るので、 ケンカ売ってると思われて逆ギレされたりする始末。ニホンザルじゃあるまいし (ニホンザルは人間がその目を見るとケンカ売ってると思いこむらしいので、目を見てはいけないんだって)。 非日本人に銭湯とかでのマナーを丁寧に教えこむことは絶対にできると思うのだけど、 ガイジンと「対決」してまで相手にわからせようとするエネルギーのある人はそんなにいない。 ようするに「話し合い」ができないのである。だから 「もう面倒くさいから全部排除しちゃえ」って論理になる。 これは外人にかぎった話じゃなく、本来「話し合い」をすべきところで 一方的に排除されるケースは日本にはかなり多いような気がするけど、 一方でガイジンと仲良くなりたい「国際派」な人々はいっこうに減っていない。 おかしなもんですよね。
(16:53)
時計の文字盤を clockface とよぶのはいいよね。いいセンスしてる、と思う。
(23:38)
lispnyc 忘年会に出てきた。もうねる。

Dec 11 [Mon]


(11:02)
朝から (朝は関係ない)、どうも最近キーボぉーどが最近安定せず最近ガクガクしてるなあ最近、 と思って、キーボヲードぉをもちあげて下を見てみたら、ボールペンがころがっていた。

ぬっくり。(脱力する音)

(12:34)
またもファイル形式について。 メーラや掲示板や Wiki や CMS (何これ) などに使えるテキスト用の 汎用データベース形式について考えていた…。 で、検討した結果、けっきょくのところ (くッキョキ) 、 「tar でいいじゃん」という結論に達した。

制約条件は以下のとおりである:

  1. 単純であること。
  2. 堅牢であること。
  3. 書き換えられること。 追記できること。
  4. シークが速いこと。
  5. 数百万レコードまでスケール可能であること。
  6. 新しいレコードを追加するとき、そのメタ情報 (変更日時など) も同時に記録できること。
  7. 最悪の場合、UNIX標準のツールだけでもデータが読めること。

と、いうか、制約 g. はかなり重要で、 これを満たそうと思うと使える候補はかなり限られてくる。UNIX 標準ツールでなんとかなる アーカイブ形式といえば tar か、ar か、cpio か、あとは shar ぐらいしかない。 「ファイルシステムそのものを使う」という手もあるが、 旧来のファイルシステム (= ext3) ではファイル数が増えてくるとアレしてくる。 zip は標準とはちょと遠いし。で、最初は「書き換え可能」というのを目指していたのだが、 tar だと中のファイルを後から書き換えたり、削除したりはできないのだが、 別にできなくてもいーじゃん、ということにした。 なぜなら「中身はしょせんテキスト」というところが重要である。 つまり、どうせ Wiki やメールなんだから、書きかけだろうが書き損じだろうが、 ぜんぶ途中経過を残しておきゃいーじゃん。どうせ 1レコードは小さいんだしさ、 書き換えたら新しいレコードとして追記しちゃえばいいワケよ。 さらに、これは RDBMS である必要がない。文字列検索やその他のインデックスは、 本体ファイルとは別にあとから構築すればいいんである。重要なのは、 「この tar ファイルさえあればすべての情報を再構築できる」ということであって、 これ以外の情報はオプションでしかないようにするところだ。ようするに SQL ダンプみたいなもんだが、 データ記録用としてはこれは非効率すぎるので、tar というわけである。 さらにさらに、Python には tar を読み書きする tarfile モジュールがすでにある! とゆうわけで、tar をデータベースとして扱うような wrapper を書けばいい。 実際には他にも問題はいろいろあるのだけど、それらについては「外側」の解決策で なんとかなると思う。

大事なメールやら日記やらを BSDDB とか InnoDB に任せられるかってんだ。 そもそも、オレはどっちのソースも読む気しないぞ。 もっとも ext3 のソースも読んだことないけど、そこまでパラノイアじゃないんで。 …とはいえ、ext3 のほうが InnoDB よりはるかに信頼性は高い (と新山は勝手に思っている) にも かかわらず、どちらもソースを読む人はほぼ同じくらいしかいないんではないかと思われるが… これは問題さね。

(15:45)
「カッコよさそうだから」というのを理由にした研究は、芸術学科でやってほしいと思います。 でもそれじゃ勝負できないから工学部でやってるんだよね。
(17:27)
どえうでもいいが (どでもうよろ)、現在的日本にクッキョキリフトというのはもはや現存的生存しているのか。 椎名誠風にいえば、存在しているのであるか。「くッキョキ」という単語を書いたあとにふと思い出したのだ。 そもそも「く」っていう文字はいかにも「くッキョキ」な感じに見える (意味不明、つうか自己循環定義)。 そういえばミミズが再現できる文字は「し」と「へ」と「く」だという話があったけど (本気にしないように)、キョキな感じにミミズがクうしたv字型wwvg√, ぬ. 4g- m,)、 でもこれ全角だから平気 [全]。。

いしいですか?

(>_>)

(<_<)

(23:35)
lakshmi の授業のポスター発表会に行った。おもしろかった。 とくに面白かったのは中国が世界に誇る情報検閲系統 「中華ファイヤーウォール (The Great Firewall)」 に関する研究発表である。 これは知らなかったんだけど、中華ファイヤーウォールは中国外→内の接続だけではなく、 内→外 (米国) の接続も検閲の対象となる。たとえば、 www.baidu.com に行って、 "Falun Gong" を検索してみてほしい。 すると、現在米国からは、この検索は "Connection Reset." あるいは Firefox だと "Document contains no data." というエラーが出てブロックされる。 これは大学からでもそうなるし、新山の自宅からでもそうなった。 しかも、この後 5分間継続して www.baidu.com への接続がブロックされるのだ。 だからその間リロードもできなくなる。 80/tcp にtelnet すると、こんな感じ:
$ telnet www.baidu.com 80
Trying 202.108.22.44...
Connected to www.baidu.com.
Escape character is '^]'.
Connection closed by foreign host.

しかし本当に面白いのはここからである。 この TCP の接続切断は Baidu 自身がやっているわけではない。 じつは中継するどこかのルータで、Baidu からくる TCP パケットの直前に TCP の reset パケットが挿入されているのだ! Baidu が送ってくるもとの 検索結果をふくんだ TCP パケットは、じつはしっかり米国まで届いている。 しかしそれよりも前にクライアントは (中華ファイヤーウォールによる) TCP reset を受けとってしまうので、接続が切れたと勘違いして 以後の受け取りを拒否してしまうというわけである。頭いいね。だからクライアント側の TCP に細工をして (実際には clik というプログラム可能なルータを使っている) この reset パケットを無視するようにすると、まんまと Baidu の検索結果を 受けとれるらしい。なぜこんな仕組みになっているのかというと、 おそらく返りの TCP パケットぜんぶを中華ファイヤーウォール側で (選択的に) ブロックするのは コストが多きすぎるからだという。それに中国政府としては、あくまで検閲は 秘密裏にやってることにしたいので (バレバレだけど!) 「なるべくネットワーク障害のように見せたい」という思惑もあるようだ。 しかしこれはあくまで軽度の検閲であって、検索結果とサイトの組み合わせによっては 重度の検閲もあるらしい。その場合には TCP まるごとブロックの刑や、 24時間ブロックの刑も適用されるとのこと。それ以上の重罪になるとどうなんだかは知らない。

ほかにも、TCP パケットからストリームの再構築まではやっていないらしく、 「検索文字列がすべて 1パケットに含まれてないと反応しない」という制限があるらしい。 だから TCP のウィンドウサイズをめちゃくちゃ短くして、たとえば "falu" と "n gong" のように 切れるようにしてやるとひっかからないという。意外とアホね。このぶんだと gzip 圧縮された 応答もムリだな。しかし中国ではこのようにほとんどすべての情報が検閲されてるのだが、 たとえば google.cn のようなサイトは ふつうに検索可能である。 なぜならgoogle の検力は中国政府のお墨つきだからである。 しかしたとえ Baidu のように中国国内・国外のサーバが何も考えずに検索結果を返してきても、 中国政府はしっかりブロックできるようになっているのだ。毛主席万歳ですなあ (意味不明)。 こういったファイヤーウォールの さばけるトラフィックはどれくらいであるのか? …と聞いてみると、彼らによれば、まだはっきりとはわかってないものの、 すーんごく高性能らしい。ただ今のところ定量的に測定した事例がないので、 彼らは将来的に一種の“検索 DOS 攻撃”を米国側からしかけてこれを測定する計画だという。 前には、この研究のために、 もしかすると VPN かなにかで中国国内のマシンを使えるかも? ということだったが、 結局できなかったらしい。同様に中国内のマシンを使って検閲を調べる Harvard Law School の 「検閲確認プロキシ」も有名だったが、これも中国側のマシンが差し止められたのか、 いまでは使用不可能になっている。いずれにしても、中国がすんごいシステムを構築していることはたしかだ。 だから米国内のネットワーク研究者の間では、これは“悪のシステム”には違いないが、 悪ながらたいした業績と認めざるを得ない、らしい。 まあ原爆も悪だったが、たいした業績といえば業績だもんな。(論文いっぱい書けそうね。) 研究者というのはこんなもんである。 実際、こんなことが中国だけの技術力でできるはずはなく、ここにはさまざまな米国企業が からんでいる。たとえば、Cisco 様ですよ! 去年から今年にかけて、 中国は cisco のルータを少なくとも 200台ほど購入した記録があるらしい。 まあ、MS とか某 no-evil 社とかもそうだけど、 そこまでして市場が欲しいのかねえ。そしてここでは基礎技術として、ネットワークもさることながら、 『自然言語ショリ』とかいうのが大いに幅をきかせてるに違いない。 まあ、spam のフィルタリングよりは簡単そうだけどね。っていうか、 これはある企業のある人からオフレコとして聞いた話だが、ある企業では この手の技術 (ってどんな技術だ?) の応用として、メールサーバに設置して 社員がメールを私用に使ってないかどうか監視するシステムを売っており、 しかも高いのにそれが結構売れているらしい。ふうーん。 いやー自然言語ショリって儲かるんだなあ。

あ、ここでの企業ってのは日本の企業です。念のため。 ここで一句:

ふり向けば
みんななかよし
毛主席

Document ID: 349bec44c0d841e6cf0dcfd232595cc4

Yusuke Shinyama