2007年 -12月 (+1)。

Last Modified: Mon Dec 31 14:21:27 JST 2007

死んだあとは何も残したくない。 だって、ポインタが残ってたらリソースリークしちゃうじゃないですか…。

未来の人々のために reclaim 可能にしておくこと。

おしらっせ: tabesugi.net は中です。 現在 unixuser.org 様のサーバを間借りしております。

Dec 31 [Mon]


(14:19)
クリスマスまでには無理だったが、年内には公開でっきた。

http://www.unixuser.org/~euske/python/pdfminer/index.html

まだドキュメンテーションその他が全然できてないけど。 これからコツコツやろう。

Dec 30 [Sun]


(09:26)
12月も末だというに、このアッタカサは何? キヨーート・プロトコる!!!!!

さて、酒買って実家に帰るぞ。

(11:32)
迫害されているものがすべてイイとは限らない。

あれ、もうこんな時間?

(13:03)
おいおいなんだこの雷雨みたいな雨は、いきなり。 帰れんじゃないか。

Dec 29 [Sat]


(09:56)
またrantingですが…。

新山は、基本的にオープンな規格やソースコードというものがいいと思っているし、 事実この数ヶ月間は、そうした規格のひとつのために作業してきた。 しかしここにきて、ひとつの実際的 (というか政治的) な問題を考えざるを 得なくなった。

オープンなソースはともかくとして、オープンな規格はなぜイイのか? これについてわかっている人は、実はあんがい少ないらしい。 オープンな規格のいいところは、 「誰でも、どんな新参者でも市場に参入できる」ということである。 たとえば HTML がオープンな規格だとして、誰かが勝手に HTML ブラウザや オーサリングツールを作ったとしても誰もどこにも断りを入れる必要がない。 W3C から「承認」してもらう必要がないし、たとえあったとしても ライセンス料を払う必要は基本的にない。 この意味で、MP3 はオープンな規格ではない。 (それにしてもあの MP3 のライセンスを握ってる フラウンホーファー協会ってやつはいったいアレでいくら儲けてんだ? ちくしょうめ。) しかしオープンな規格にはまさに表裏一体の欠点があって、それは 「どこの馬の骨でも参入できてしまう」というところにある。

で、一部のアホな方々 (地位はエラいが、 あきらかにコンピュータをよく知らないし、 ついでにいうと日本語もよく知らない人々) は、 このことが気に入らないらしい。口ではオープンな規格がいいって 言ってるくせに、いざ実装を見てみると「オレの知ってるのと違う」 とか「勝手にやられては困る」とか言いだすのである。 アンタ、オープンな規格ってのは、規格に従ってさえいりゃ どう実装してもいいんだよ。そもそも、規格でソフトウェアのすべての ふるまいを規定するのは不可能なのだから (そんなことをするためには、 実装をまるごとコピーする以外に方法がない)、実装上の差異が出てくるのは トーゼンなのだ。しかし、彼らにそのことを理解してもらうにはあと マイナス 15年ぐらいかかるだろう。まあ、しかし、理屈がいかにもアレな 日本人っぽいので、笑ってしまった (でも彼らは日本語を話すとほとんど筋が通ってない)。 ムリしないで最初から閉鎖性が大好きだって言やいいのにねえ。

アホな連中の話はどうでもいいとして、実際に使う側の立場にたって 考えた場合、オープン規格のいちばんの危険性は「実装の差による非互換性」である。 たとえば HTML や CSS のブラウザ間による非互換性はよく知られている。 javascript はろくに標準化されてないから自業自得として、 HTML はずっと昔から標準化されてるにもかかわらずあの始末だ。 いっぽう、対極にあるのが Word 文書である。新山は大キライだが、 あれがなぜこれほど標準フォーマットとして普及しているかといえば それはひとえに Word が オープンなフォーマットではないことによる。 MS は今後もあれの仕様を公開する気はないだろう。MS がすべてを 牛耳っているということは、互換性という面から考えてみると じつはとっても安全なのだ。 (OpenOffice での細かい非互換性に苦しめられた人は何人いるだろう? 結構いるんじゃないか。) 米国ではいま ODF と MS 規格の対決がホットだけれど、 もし ODF が普及したら、ベンダー間の実装がいっぱい出てきて 「ODF文書対応!」って謳ってるのに違うじゃないか、というユーザが 沢山出るだろう。結局、ここでいちばん損をするのはエンドユーザなわけで、 ユーザの (短期的な) 利益を考えれば規格はオープンにしないほうがいい。 反対する MS にも一理あるのである。 Flash や WMV も同様。 (Flash は規格そのものは公開されているが、 サードパーティが参入できるのはオーサリングツールだけで、 プレイヤーを作っていいのは Adobe だけと規定されている。)

で、そもそもなんで実装の差が出るのか? といえば、 それはひとえに規格が複雑すぎるからである。 たとえばテキストファイルを考えてみよう。これはとてもオープンな フォーマットだし、どんなアプリケーションでも使える。 にもかかわらず、こんな単純な形式でさえすでに改行コードや文字コードの 扱いで実装上の差異があるのだ。それにテキスト形式が単純とはいっても、 各種文字コードやら BOM やら Unicode 拡張領域の文字を完璧に扱うのは かなり大変だよ。これがさらに複雑な規格になってくれば、 完璧な実装 (と、その検証) はもっともっとむずかしくなる。 それはもう、ほとんど指数的にね。その結果起こるのは以下のようなことだ:

  1. 各実装間の (より大きな) ばらつき。
  2. 体力のないプレイヤーの撤退 (もはや手が出せないほど実装が巨大化したため)。
  3. 大手プレイヤーの de facto standard による独占。
代表的な例が HTML である。現在、HTML レンダリングエンジンといえば 事実上 Gecko と KHTML、そして IEコンポーネントの、この 3つしかない。 新たなメーカーが PC ブラウザ業界に参入しようとしても、すでに これらのシェアが圧倒的で、あまりにも多くのサイトがこれらの (規格ではなく) 実装を考慮して作られているために、 新規参入者にとってはすごく不利である。MS は標準規格を勝手に歪めることで 悪名高いが、同じことは Mozilla だってやっている。 つまり HTML は事実上、非オープン化されてきているのである。 いくら規格がオープンであると謳ってみても、状況はもはや Word 文書と あまり変わらない。しかし、繰り返すけど、 そもそもなぜ大プレイヤーしか生き残らないのかといえば、 規格が複雑すぎるからである。

新山が複雑なシステムや規格を嫌いなのは、セキュリティ上の欠陥が多くなるという 理由だけじゃない。それは結果的に、オープンなシステムをつぶし、 社会の流動化を妨げるということなのだ。 ある規格や仕様をオープンにするかどうかは、技術的というよりも 政治的・思想的な問題で、これはエンジニアリングの範疇の問題じゃない。 しかし、複雑すぎる規格を設計してしまうのは間違いなく技術者が悪い。

…だが、こうした「善悪の判断」は、技術うんぬんの枠を超えた 新山の個人的な趣味だ。なぜなら、 オープンな規格がもたらす帰結は「新規プレイヤーの乱立」「競争の激化」、 そして行きつくところは「社会の流動化」だからである。 そう、オレはそれが好きなのだ。たとえそのために互換性で悩むユーザが 沢山出ようとも、オープンなほうがイイと思っているのだ。 オープンな規格を支持する本当の思想背景はそこにある。 だが、ドストエフスキーも書いたように、 そう思わない人が沢山いる (むしろそっちのほうが多い) ということも 知っている。ここで話は最初に戻るのだが、 「オープンな規格」を押してるおエラいさんは、 そんな流動的な世界がほんとうに好きなんですかね? ムリするんじゃないよ。あんたがたは大審問官 (= Microsoft) のいる世界が 大好きなんだ。

(11:00)
またもやコインランドリーで思ったこと。 日本で他人を見ていて、「ひと声かけりゃ険悪な雰囲気にならなくてすむのに、 バカだなあ」と思うことはよくある。新山が米国で学んだイイことのひとつは、 これであった。向こうでは見知らぬ人にも気軽に声をかけるので、 こうした意味もない衝突がほとんど起こらない。考えてみりゃ、 すべての人間を対等な個人として扱うという文化においては、これは当然のことだ。 日本において「空気の読めない」人々に対して文句をいっている連中は、 結局のところ (ケッキョキ)、他人とのコミュニケーションが下手なだけに すぎない。それはお前ら自分の責任だろ! と言いたい。 そういう人はこの国では (いい歳したオッサンでも) 本当に多そうだよなあ。 あと、もうひとつは「黙っていることがカッコいい」という日本的な 美学も影響しているかもしれない。オレは幸か不幸か 「よくしゃべる格好悪いバカ」であるという周囲の印象が 確立しているので、格好悪いバカでよかった!
(18:01)
新山の家には現在、音楽 CD が一枚もない。そこで今日は ダイソーで「浪曲名人選 その壱・三門 博」を 100円で (←当然) 買ってきてみたら、なんじゃこれ、すげーカッコイィーーー。 でも、何言ってるかよく聞きとれん。

Dec 28 [Fri]


(20:47)
会社のボウネン会が終わった。 うちの会社はきわめて健全であるので、5時すぎから忘年会が始まり 2時間後には終わってしまう。だからそのあと家に帰ってきても、 まだ 8時前だったという健全さ。すばらっし。

Dec 27 [Thu]


(21:47)
本日はとても興味深い法則を発見した:

  1. コミュニティ内における不和は、現実世界における争いと コミュニティ内における争いの和に等しい。 (コミュニティの第一法則)
    (不和なのに和! オ!!)

だが熱力学と同じく、本当に重要なのは第二法則のほうである:

  1. どんなに小さなコミュニティを見ても、 それらのコミュニティをさらに小さくしようとする動き (= 内部分裂) が存在する。 (コミュニティの第二法則)

これらは、しょせん熱力学の法則の焼き直しに過ぎない。 なぜなら、「コミュニティはつねに分裂する傾向にある」というのは、 そのまんまエントロピー増大のことをいっているにすぎないから。 おお、ボルちゃんを讃えよ!!

ところで (てくる)、ボルツマンと (マックス・) ボルンをなんかいつも間違えてしまうのは、 この宇宙すべての時間経路上でオレ一人だけだと信ずる。oh, my uniqueness!!

Dec 26 [Wed]


(22:31)
くそ、pdfparser.py が 2000行を超えちまった。 しかし、ようやくほぼすべてのテスト用pdf から正しく文字列を取り出せるようになった。 問題はつねに日本語である。CIDフォントのバカ。 まず、PDF 内の日本語文字列はたいてい既存のエンコーディングで書かれてはいない。 なぜか Identity-HIdentity-V が多いのである。これを解析して 文字コード (整数) の列にするのがひと苦労。ここで使用されている CMap を 解析せねばなんないが、 これは外部から提供されているファイルであり、例のエセ PostScript 文法で書かれている。 さて、文字コードをとってきても、この数値は JIS などの文字集合の文字を表してはいない。 日本語の場合は Adobe 独自の Adobe-Japan-1 という 文字集合なのである。ひどい場合にはこれは既存の文字集合のどれでもなく、 ToUnicode という属性による写像である。ちなみにこの属性値はデカい CMap ファイルそのものなのだが、こいつはなんと PDF内にバイナリとして埋め込まれている。 しかし、こんなことで驚いていてはいけない。もっとひどい ケースというのがあり、TTF フォント内のグリフ番号がじかに指定されているので、 そのフォントファイル (これまた PDF内にでっかいバイナリが埋め込まれてるんだ、これが) を解析して cmap テーブルの文字コード → グリフから逆写像を生成してやんなきゃなんない! (実際にはこれが unicode に写像されているという保証はないのだが…) 欧米系の文字列 (latin) の場合は 128 以上の写像がハチャメチャなことが多く、 これを正しい Unicode に変換するには Difference 属性を 見てやらねばならない。これには「文字 → 番号」の写像が書かれている。 これは HTML entity みたいなものなのだが、おそろしいことに この「文字」というのは、(これまた Adobe独自の) 名前で定義されていて、 各文字名から Unicode 番号を得るためには glyphlist.txt という外部ファイルを 参照しなければならないのだった! (自然言語で書いてもなんだかわかんない仕様だろう。) いやはや。オレの疑問は「なぜだ…」ということである。 なぜこれほどアホなのか? この仕様は、わざと PDF の解析をメンドーくさくするために 仕組まれた罠なのだとしか思えない。

基本的に、印刷技術というのは複雑なもんである。とくにフォントや文字組みの機構の 理不尽な複雑さは、自然言語における理不尽な複雑さと似たところがある。 人間が CG で生成した風景や機械生成文の「なんか不自然だな」感をすぐに 見抜けるのと同じように、人間の目は「レイアウトがなんか不自然だな」というのも すぐに見抜いてしまう。文字組みってのはこの不自然さをカバーするために 複雑化してきたようなもんだから、Adobe が「その理不尽な複雑さ」を 忠実に再現しようとしているのは、ある意味理解できる。 (Adobe が異体字の指定できない Unicode なんかを使わないのは、 まったくもって正しいことだ。) しかし…機械が扱う文書構造まで理不尽に複雑にするこたあないだろう!!

todo:

Dec 25 [Tue]


(19:09)

かつて、 スティーブ・ジョブズはこう言った:

…人類がほかの霊長類ととりわけ区別されているのは、 我々は道具を作る種族であるということだ。 まえに一度、地球上のいろんな生物の移動効率について読んだことがあるんだが… 1キロをもっとも少ないエネルギーで移動するのはコンドルだった。 残念ながら、人間はそこでは一覧表のはるか下、かなりがっかりする位置にいた。 万物の霊長として栄誉ある結果ではないよね。ところがサイエンティフィック・アメリカンの ある著者がひらめいて、自転車に乗った人間の移動効率を調べた。 すると人類は圧倒的にコンドルを抜いてしまう。断トツになってしまうんだ。 これこそ、ぼくらにとってコンピュータが相当するものだと思う。 ぼくらにとって、コンピュータというのはもっとも驚くべき道具だ。 コンピュータは知性のための自転車に等しい (it's equivalent of a bicycle for our minds)。…

で、この発言自体は非常にカッコいいのだが、 はたして「コンピュータ == 自転車説」はどこまで本当だろうか。

いっぽう、 アラン・ケイは こう言っている (抄訳):

…現在のコンピュータは自転車というよりも、むしろ乗用車のようなものとして売られている。 もしこれが自転車だったら、そんなにひどくはないだろう。 なぜなら自転車というのは人間が本来もっている力を利用して、それを増幅するものだから。 しかし乗用車はそうではない。 現在のコンピュータはすべての解法がパッケージとして提供された 状態で売られているので、これはちょうど乗用車が人間の歩く力を削ぐように、 人間の考える力を削いでしまう。私は、 コンピュータが自転車のようなものであると確信できないかぎり、 これを子供の教育に使うようなまねはしない。…

「コンピュータ」を「インターネット」に置きかえてみても (あるいはこの 2つを合わせてみても)、この言明は成り立つ。 だからといって、そのために世界が滅びるとも思わないが。

それから、コンピュータを自転車と比べるのは環境面からみても ふさわしくない。自転車はエコな雰囲気を感じさせるが、 コンピュータは作れば作るほど環境が汚れていく。 さらにいえば、そもそも自転車がそれほど効率のよいものかどうかも疑問だ。 ロードレーサーのような効率のいい自転車を使うためには、 よく整備されたアスファルトの道路が縦横無尽に走っている平地でなければならない。 そしてそのためのコストは莫大なものになる。 オフロードの山道のようなところでは、自転車はまったくコストに見合わない。

きょうの教訓: 一番悪いのは、信じこみやすい奴だ。

(21:50)
お。今日もまた見回りの時間か。
(22:17)
Christmas Adam (クリスマス・アダム) : クリスマス・イブの前の日。

Dec 24 [Mon]


(12:05)
きのうのドタバタのせいでカサをどこかに忘れてきたかと思っていたら、 今朝おきてみたらちゃんと玄関の先にかかっていた。エライ俺。

しかし、今日は天濃誕生日の振替だったということを知らず、 てっきり会社があるのだと思ってしまった。アホだ俺。

さて、掃除・洗濯も終わったし、どうしよっか。

(18:50)
きょうは何カ月ぶりかに dosa を食った。屋台じゃないけど。
(00:17)
やっぱり今日じゅうに完成しなかった。チクショウ、 いったいいつになったらリリースできるんだ。 やればやるほど仕様でカバーされていないところが増えてくるような気のする。 とりあえず、今日のところはおやすみ。

Dec 23 [Sun]


(06:35)
世の中には、推測する人がいる。 つまりそれは推測しすぎる人ってことだけど、 mere mortal としては推測するしかないこともある。

doudemoiikedo (tekulde), きみは 地球上でバージョン管理システムをもっとも活用している人々を知っているかっ。 彼らはプログラマではない。政治家だ。

公約を
ロールバック
(21:26)
今日のイベント (イベンタオ) がようやく終わった。 来てくれた方々、ありがとうございました。 それにしても、またもや立ちっぱなしで疲れたよ。 もう寝ようかな。

Dec 22 [Sat]


(10:34)
朝からサムいうえに雨降ってるし。

ところで (てくるで) 新山はよく言うのだが、 ウェブサイトなり図書館なりの情報貯蔵システムで、 ユーザが「全文検索が必要だな」と感じるようになったら、 それは行きとどいた管理という面では終わってるのである。 全文検索はあくまで情報がまるで整理されてないときの最後の 力まかせの手段にすぎない。それよりも使いやすいリンク集や カタログをナビゲートするほうがずっとスマートだ。

たとえば、プログラムのコードを grep することを考えてみればいい。 これは今でも新山が他人のコードを読むときに使っている常トウ手段 (くそ、「套」の字が覚えられねえ) なのだが、 そもそも、なぜこんなことをやる必要があるのかというと、それは たいていのコードにまともなドキュメントが含まれていないからだ。 とくにプログラムの全体的な見通しを記述する文書がないので、 「この関数は何だ? どういうときに必要で、どこから呼ばれてるんだ?」 というときに、ソースコードのあっちこっちをひっくり返してみる必要が でてしまう。しかし、好きでやってんじゃねえんだよ! 読みやすいドキュメンテーションがあってくれれば、 そっちのほうがずっといい。にもかかわらず、多くのプロジェクトで、 そういった文書を残してあるところは絶望的に少ない (少なくとも新山の経験からいえば)。 いったいなぜみんなそういう文書を書かずにやっていけるのか、 新山には理解できないが。

人のコードを読むときにいちばん重要なのは、 まず、おおまかな全体像を把握することだ。各メソッドの 細部がどうなっているかとか、そんなこたどうでもいいんだよ。 とくに各モジュールについて、以下のような説明が必要だ:

(18:39)
えーと、今日はナニをやったんだっけ? 服を買った。 しかもドンキホーテで。ついでにドライマンゴー (フィリピン産) と あやしいスパゲティ (ドバイ産、1kg 198円也) も買ってきた。 レジのねえちゃんが、客の 1円玉が足りないときに 勝手に (レジの横にストックしてある) 1円玉をとってチョッキリ会計する ワザをみたときは感動した。日本では新しく生活を始める人間がぜひとも 行くべき店というのがあり、それは次のようなもんだ: これが米国だと、 といったあたりになると思われるが、 米国ではこれらの店が (たとえニューヨークでも) 歩いて行ける場所に集中していることはまずない。 それに比べて、ここでは歩いていける! (といってもベッドとか注文して持って帰ることはできないので、 配達してもらう必要があるケド、どのみちこんなもんは普通の乗用車でも無理だ。) なんてスバラしいんでしょ、日本。 ちなみに、うちの近くにあるのはニトリじゃなくて 島忠だったですけどね。 ダイソーにしろドンキにしろ、こういうディスカウントショップへいくと、 基本的に殺伐とした雰囲気で、しかも外国人や貧乏人が多いので、 どことなく NJ にいたころを思い出してしまう。 新山がいた地域では、周囲のほとんどの店がこういう店だったのである。

そのご、近所の商店街でお茶屋に寄って、世間話をしつつお茶を買う。 お茶とコーヒーあわせると月 4、5千円使っているような気のするが、 酒タバコと比べてどっちがいいのか。

今日いちばんツラかったこと: 帰り道の途中にあるタイヤキ屋の前で自分の欲望との 格闘に必死で苦労した。 しかし堪えた。 yeahhh---- i made it!! つうことで帰ってくる。 ちなみにドライマンゴーは癖になるよ。 糖分高そうだケド。

Dec 21 [Fri]


(21:33)
いま、家の外で、火の用心の見回りをやっている。 その意気は買うけれど、どうも音が頼りないよ…。 拍子木を「かん、かん、かんかん」と打つのだが、 どうにもへっぽこな打ち方だ。 窓の外をのぞいて見たら、老人連が 5、6人ほど群れて歩いていた。 ありゃあ、鍛え方が足りんわな。たぶん群をなしている理由は、 「拍子木の音がうるさい」とかいってナイフをもって飛び出してくる キチガイを防ぐためだろうが、もうちっと楽しげにやってほしいもんだ。

ちなみに、将来的にはこの見回りの現在位置がオンラインで 追跡できるようになるので (もちろん、地図と連動して!)、 もしも新山がうっかり web 上にこんなこと書いたら、 具体的な地名を一切出さなくても、たちまち現在位置から 住所が割り出されてしまうに違いない (個人情報を得る手段などいくらでもある)。 そのような世界はすばらしく平和で、かつ安全で、 しかも恐しく住みやすい世界であることだろう。 と、おもう。

と、おもう。

Dec 20 [Thu]


(00:46)
ONLamp Blog とか、たまに見ると 「うげ、開発者のエライ人とよばれる人間がこんなコードを書いてるのか」 とか思って不幸な気分になるから見ない。

Dec 17 [Mon]


(20:20)
今日はまた煮物をつくりすぎたよ。 (おまけに、里芋を長く煮すぎた)

それにしても、オレはここでコンニャク殿に言いたいことがある :

“いったいなぜ お 前
(訳注: そう、彼はたしかにここで“お前 (tu)”という言葉を遣っっ
た)、
いかなる真理と権威をもって、かくのごとくツルぬるぴよピヨと
動き回るの可。

オレが最後のひと切れを正しく (つまりそれは文字どおり正統にという意味だ
が!!!1) 切るのに、
どれほどの危険をおかすハメになったと思っているの
か。”

改行は関係なし。

( 謝罪 && 賠償 ) である!!

注: 「そこもと」って何?

(20:27)
うどんこ病 (みたいなもんだね)。

ちなみに今日寝耳にはさんだ話によると、 さいきん秋葉原では 9.11 に関与した本気 (マジ) なネオコンが集結していて、 そいつらは「マジコン」と呼ばれているらしい。

すごいことたぜ、人間 (men)。

(墜伸 (ついしん))) てくるで ((ところで)、 「ネオコン」という言葉を T-ZONE でも販売されるくらいに普及させた、 かの「“ネット”ジャーナリスト」の第一人者であられるところの、 tanakanews.com はまだ健在であった。 日本にも陰謀論のマーケットをつくろうという 彼のもくろみは成功したのだろうか?

カッコは対応してるよ。句読点 doesn't.

(21:27)
お前のような奴は、モンタギュー文法の中に入れて食ってやる!!

こらこら君 (くん)、 ウィキペヂアに行かないように。

…それにしてもなんで今日はこんなにテンショニ高いんだろう。 オレには麻薬というものは生涯必要がない。おそらく。

(22:18)
お前のような奴は、古今和歌集にして食ってやる!!

…以下、つづく。

そうだ、もうお茶が切れているので明日はお茶買おう。 会社の近所にいいお茶ショップがあるのだ。ふ

Dec 16 [Sun]


(08:06)
そういえばきのう商店街を歩いていて思ったのだが、日本では クリスマスソングといえばなぜいつも「ジングルベル」なのか。 こいつを聞くとどうしても という気分になってしまう。

そんな人にオススメのクリスマスソングが Feliz Navidad である。日本ではほとんど知られてないが、 米国 (およびスペイン語圏) では代表的なクリスマスソングのひとつである。 新山はキリスト教は大嫌いだが、 この歌は気取ってないラテン系のノリで好きだ。 それにしてもこの youtube のバージョンはすげえカントリーっぽいなあ。 もっと都会的なカヴァーもあるんだけどね…。

(20:23)
いままで読んでなかったドストエフスクーの『白痴』を 最近ようやく読みはじめたが、それにしてもこの人はつくづく “修羅場”を描くのが好きらしい。修羅場ってのは、多勢の人の 思惑 (というか策略) がぶつかりあって完全なバトルロイヤル状態になるっていう 場面だが、この本ではそれはナスターシャがガーニャの家に入ってきたときに 起こる。でも『罪と罰』でも似たようなハチャメチャ騒ぎが起きていたよな。 あれはたしかマルメラードフの法事の場面だった。『悪霊』では、 スタヴローギンがはじめて入ってきたときあたりにそれが現れている。 『カラマーゾフ』ではそんな場面があったっけか? あったような気もするが、 今となっては筋を詳しく覚えてないのでわかんないな。 また読み返してみなければ。とにかく (トニクク)、 修羅場を見たかったらドストエフスキーを読め! でも、橋田壽賀子のドラマでもそんなんありそうだけど。
(22:16)
風呂に入る。つまりソヴェトロシアでは、風呂がおまえを入る!!

ってこと。

どうでもいいが、もしもいま「ネット」の意味を知らない子供の前で 「ネットなんとか」という言葉とそれが意味するものを並べたてたら、 彼はきっとこう結論するだろう。「“ネット”って“悪い”って意味?」

うん、たぶんね。

(01:03)
あー ぢぐしょ゛う、今日じゅうに書き終わらなかった。

Tree-like Constant Database (tcdb)

Dec 15 [Sat]


(19:28)
けさはまた時計をセンタクして (耐久性は生活防水程度)、 おまけに乾燥機にまでかけてしまったので落ちこんでいたが、 ネジをはずして、すっかり水を乾かしたら再度復活した。 すばらっし。しっかしこの時計もだいぶ長いこと使ってるよなあ。 これ、もともとはママンから貰ったヤツなのだが (大学時代の新山は電話どころか腕時計も持ってなかったので、 見かねた母親が自分の使ってたヤツをくれたのである)、 NYにいたあいだはずっとこれで通したのだから、もう 10年くらい 使っていることになる。モノモチがいいことは自慢できることである。 いちおうブランドは Timex なのだが、どうせいちばん安いやつだろうし、 ただのクォーツなのによくもつもんだ。

ところで、またドーでもいい (よくない?) 話だるが、 こんな記事を見た。 In China, Farming Fish in Toxic Waters.

NYT で連載してる中国の環境特集の 8回目。 いまだに暇つぶしに NYT を読んでいる (ネットで読む新聞としては、読みごたえがあるため)。 が、なんだかあいかわらず中国の食料事情 (のひどさ) にばかり 目がいってしまうなあ。それにしても同記事によると、 世界で養殖される魚のうち 7割が中国産だそうである。 おそろしい。で、中国人にこれ見せたらぜったいまた「誇張だ!!」と言うだろうな。 べつに中国に恨みがあるわけではないのだが… とりあえず彼らを説得するのは今のところ不可能なのでそれは どうでもいいが、日本のスーパーで売ってるサカナが産地偽装されてたら タダじゃおかねえぞ。

Dec 15 [Sat]


(01:23)
しかし、自分でいうのもなんだが、新山の生活は健康的すぎる。 きょうは自宅のメモ帳に「買うもの: 豆腐」と書くつもりで、 気がついたら「戸腐」と書いていた。 まあ、たしかに字形は (なんとなく) 似てるけどさ…

つまりそれほどまでに健康的なのだる!!!!!
1!!!!! 11

でもサケ・タバこは飲まないが、お茶とコーヒーで金つかう。 本当はハーブティーもといいたいとこなのだが、 日本ではなんでハーバルティーはあんなふうに「気どった飲み物」として 扱われてるんだ? 入手しにくいうえにボッタクリ的に高い。こんなろ。

ところで (てくるで)、ゲームをやらない 新山が唯一気になっていた ATHF: Zombie Ninja Pro-Am だが、 armake21氏のレビューによれば、 しょうもないクソゲーだったようで、買わなくてよかった (といっても、新山は PS2 なんかもってないが)。youtube の ゲームレビュアーとしては彼が一番おもしろいと思う。 Youtube で「クソゲーレビュアー」といえば AVGN (a.k.a. Angry Video Game Nerd) が有名なのだが、 彼はたしかに大衆ウケしそうだが、新山はクセの強い armake21 のほうが 好きである。威勢がいい喋り方で聴いてて小気味いいし、なにより彼は ほんとうにゲームが好きらしい確固とした信念を感じさせる。 自分の印象を漠然というのではなくて、「値段相応かどうか」ってことを 評価しようとしてるあたりが好感もてるね。 でも口はかなり悪いけど (卑語を覚えるにはいいかもしれない)。 最初のころの King's Knight のレビュー あたりもおもしろいのだが、一番笑えるのは Quatro Adventure である (ただし長い)。新山はとーぜんこのゲームなぞ知らないのだが、 ゲームをやったことない人間でも楽しめるようなビデオになってる。

Dec 13 [Thu]


(22:39)
きょうは会社の営業さんと共に某所に挨拶回りにいったんだよ。背広着て。 なぜオレが? 技術担当なのに? と思ったが、まあいいや。これも仕事である。 それにあの施設はこの業界では一種の“聖地”のようなところとして知られている。 それにしても運悪く雨だったので、朝は「まあいん電車」に乗るハメになった。 スーツ着てあんな状態で電車にのるのなんざ最悪だ。 二度とやりたくないね、あんなのは。しかも新山は背広に慣れていないので 朝からえらい騒ぎである。ネクタイは会社に着いてから苦労して結んでいたのだが、 15分ぐらいかかったし、それでも新山の姿は就活中のアホ学生にしか見えない。 あいかわらずこの社会人失格ぶりを見よ。 (もちろん本人は、それでいいと思っている)

Dec 12 [Wed]


(22:59)
きょうの教訓:

大根おろしを入れても、すべてがアッサリするとは限らない。

あっさりしないものの例: こじれた人間関係.

など。

(23:02)
外添要一 (694件)
(23:48)
どうでもいいけろ、korea を corea と書けと主張している人々は CJK が CJC と呼ばれるようになったら混乱するということを心配していないのか。 ぞんぞん。

Dec 11 [Tue]


(23:26)
うぉっと、きょうの教訓:

Adobe-Identity-0 を文字化するためには PDF に埋め込まれている TrueType Font 内の cmap を解析する必要があった。

Dec 10 [Mon]


(21:51)
きょうの教訓:

fwprintfwcstombs を使う際には、

setlocale(LC_ALL, "");
を忘れずに!

Dec 09 [Sun]


(23:09)
きのう、今日と“病気”にかかってました。

“病気”です。

$ wc pdfparser.py
    1824    5088   48387 pdfparser.py

ああ、貴重な週末を。

さすがにこれだけのサイズになるとやばい。全体を把握できなくなりつつある。 これが完全に機能的に分離していればいくつかのモジュールに切りわけることができるのだが、 pdfがアホなところは、複数のデータ構造が相互に依存しあうような形式になっているために 切り離して考えられないのだった。まったく、たかが文書データを読むだけで なんでこんなに苦労しなきゃいけないんだよ??

このコードを書き始めたのは、2004年 12月24日の夜だった (コメントにそう書いてあるし、 日記にもそう書いてある)。 2007年 12月24日にはリリースできるといいな…。

Dec 08 [Sat]


(10:44)
ころきあ。新山はもちろん出れないが、アナウンスだけ今だに送られてくる。 昨日のころきあはすごかったらしい。たぶん Shashaせんせいが呼んだのだろうが、 Kx の CEO で K言語の開発者が来たのである。 K というのは金融機関でのデータマイニングにほぼ特化された言語で、 基本的には APL を元にして作られているのだが (そのためユーザはおもにその手の金融屋、先生によると 「プログラマは世界で 1000人ぐらいしかいないが、彼らの収入はものすごい」らしい)、 メールに含まれていたサンプルコードをみると、サッパリわからん。 たとえば以下のプログラムが Sudoku の解を求めるコードだというのである!
x(,/{@[x;y]'"1-9"^x@&|/p[;y]=p,:3/3\p:!
9 9}')/&" "=*xx(,/{@[x;y]'"1-9"^x@&|/p[;y]=p,:3/-3!
p:9\!
81}')\&" "=*x
ホント?? 読めないし実行の仕方もわからないからわかんないよ。 kのインタプリタ自体は kx.com からダウンロードできるのだが、 そこまでやる気なし。
(13:11)
おう、「集合知」とかいう言葉を流行らせたアホはどこのどいつだ? 彼らは何も知らないようである。多くの人を集めると、集合知よりも 「集合バカ」ができる可能性のほうがはるかに高い、ということを。 すくなくとも現在の web をみるかぎりでは、集合知としての側面よりも 「集合バカ」としての側面のほうがはるかに高い。 しかし、それがどれくらいの高確率なのかは、もっと研究されてもいいことだ。 ら
(21:11)
それにしても PDF は テキスト形式とバイナリ形式の悪いところを両方合わせたような形式である。 いうまでもなくテキスト形式の特徴はその「冗長性」にあり、 バイナリの特徴はその「非冗長性」にある。どちらにも一長一短が存在する:

テキスト形式の悪いところ:

バイナリ形式の悪いところ:

つまり PDF 形式というのは 「冗長性があるにもかかわらず、“冗長性”ということのメリットをすべて潰して、 デメリットだけを得ている」サイアクな形式なわけだ。

(おそらく Adobe が考えただろうと思われる) 当初の PDF のメリット:

  1. PostScript に似たテキスト形式だから、扱いが簡単!
  2. しかもバイナリ形式もまぜたので、サイズも縮められるし、いいトコどりだね!

PDFの現実:

  1. ぜんぜん似てねえよ、バカ。
  2. なぜ xref 以降のあのムダな配列を最初からバイナリにしなかったんだ?

Adobe の行動で笑えるのは、連中がこれらの問題を 仕様の拡張 (=つぎはぎ) でカバーしようとしているところにある。 その結果、仕様はますます醜くなっていく。しかも用語のわかりにくさは絶品である。 PDF には PDF-1.0 の時点から、「ストリームオブジェクト」というものが 存在した。ところが PDF-1.5 で導入された (まさに上の 2. の問題を解決しようとした) 概念が「オブジェクトストリーム」だと?? このヤロウ、寝ボケてんのか。 Adobe 自身、それまでの設計のまずさを認めたということだろうが、 それにしても一体、あんなものを設計したヤツは誰なんだ、と思う。 これほどひどいものが世間に普及しちゃったあとの責任はデカいよ。 たぶん Adobe の技術者なんだろうが、 Stroustrup と同じくらい悪人だと思う。

いつかこのひどさを解説した文書を書かねばなるまい。

Dec 05 [Wed]


(22:33)
きょうは実機でテストしたら思ったより速度が出なかったので、 ややオチコミ気味で帰ってくる。そのあと買いもの袋をもって買いものに。 今日は毎週水曜日でポイントカードが 3倍の日なのだが、 たいていポイントがたまる日というのは、それとひきかえに あまり特売をしない傾向にある。だから今日みたいな日は どのみち定価で買わざるを得ないもの -- 米とかコーヒーとかをおもに買い、 野菜や魚はあまり買わない。いっぽう、これらの贖罪が 安い日は「とりあえず安売りしているものを買って、それから 行きあたりばったりでメニューを考える」のが新山は好きである。 それから買い物袋でポイントをかせぐのも忘れずに。 こういう話を母親にしていると「お前、ヤスい生活してるなあ」と言われるのだが、 オレは質実剛健な生活が好きなんだよ! ところで (てくる出)、 新山は Coling-2004 でもらったサコッシュ風の布袋を使っているが、 これは結構丈夫で容量もあって気に入ってる。学会中はこれに 電話帳ほどもある論文誌を何冊も入れて、ジュネーブの街を かけ回んなきゃいけないのであるから、頑丈でないと困るのだ。 学会の参加記念にもらったものとしては、この袋と HLT-2002 でもらった トレーナー (これもいまだに着てる) がいちばんマトモであった。 (ACL ではロクなものをもらったことがない。)

(追記) てくるで、あの名作 Smash My PS3 から一年が経過していた。Youtube のコメントをみると、いまだに "What a waste" とかいってる人が多いのに驚く (まあたいていは物のわかってないアホだろうけど)。 なぜコレがもったいなくて、普通に PS3 でゲームするのがもったいなく 「ない」のか、新山にはちっともわからん。どっちも資源の無駄だ。 しかも、このおじさん (?) は、たった 500ドル (+ 人件費) で これだけ人々を楽しませている。あっぱれな金の使い方だと思う。 新山はゲームをしないので、ある意味、PS3 なぞ存在自体が無駄だ (Wii もそうだ)。 PS3 や Wii なぞ、この人に壊されるために世界で一台だけ生産されればよかったのだ。 そうすればこんなものが何百万台も生産されて数年後に廃棄物の山ができることもないだろう。 そう考えると、この人のやっていることはすばらしい「エコ行為」である。 資源をムダにしているのはその他の消費者だ。同様に、自殺する人々は すばらしい「エコ行為」をおこなっている、なぜなら彼らは世界の資源を 節約するのに一役買っているのだから…。世界中の人々もみんな彼等をみならって 自殺すべきだと思う。そうすれば資源を節約できる。 本当に本当に本当に本当に本当にそう思う。本当に本当に本当に本

…さて、あなたが考える「価値」とは何なのか。

エコ行為 ≠ エゴ行為。

Dec 04 [Tue]


(22:23)
きょう、インターフェイスについて人と話していて、 結局のところ (ケッキョキ)、 インターフェイスの設計というのは接客と同じなんだなあ ということに、ふいに気がついた。そう考えてみると、まさに ぴったりである。計算機にとって、お客様は様である。 ユーザの一挙一動は神の声だ。お客様に不快な思いはさせてはならないし、 お客様を待たせるときは一言あやまるのが筋ってもんだろう。shit、 オレは今までなんでこんな簡単なことに気がつかなかったんだろうと思う。 インターフェイスを設計するときに、なぜ旅館やナイトクラブの従業員に 意見を尋かないのだろう。彼らが世間知らずの大卒より役に立たないなどということが あるだろうか。「総合力」などというアホなキーワードが情報誌を賑わせている昨今だが、 総合力とはケッキョキのところ世間で「常識」と呼ばれているものにすぎない。 そしてそれを身につけるには 100年ぐらいの教育が必要だ…?

(追記) しかし、計算機におけるインターフェイス設計のむずかしさは、 計算機は人間の従業員 (バイトでさえも) ほど賢くないというところにある。 「お客様が迷っているときに手助けしなさい」というとき、 計算機は人間みたいに空気を読んでくれないから、 たいてい最悪のウザいタイミングで手を出すことになる。 それを「バカな機構だけでいかにやるか」ってところが 工夫のしどころなわけよね。

Dec 02 [Sun]


(09:42)
問題はそんなことではないのだよ!

どうでもいいが (どうでもよろ)、あれから10日以上たっても 何も変化しないので、病気が再発したと思っていたのは どうやら新山の多大なるトリコシグリャーだったらしい。 まぎらわしいよ、ったく。ところでスキー行きたいなあ。

ちっともどうでもよくないぞ。ふんとに。

(11:38)
「文化 (culture)」と「カルト (cult)」って同語源だったんだ。 言われてみれば、そうかもね。
(18:49)
今日は某所におけるシムポ・ジウムを拝見しようと思ってひたら、 モタモタしてるうちに開始時間に遅刻した。知りあいの先生に 「オレの発表どうだった?」と尋かれるも「すいませんソノ直後に来ました」 というしかなく、失礼千万。でもこういうときの 質疑応答で所属を言わねばならないのだが、べつに一個人として行ってる ダケなのに会社名を言うのはアレだよなあ (新山は仕事場から離れても 会社名をぶらさげて歩く人々が嫌いである)。だから 「ニューヨーク大学の新山です」って言っておいたけど、 もちろんこれは (10月からは) ウソである。もう学生じゃないんだから。 しかし、いずれにしても、さぞかしアヤしい奴だと思われたことだろう。。。

で、帰ってきてみると戸井田からメールが来ていて、 生まれたらしい。おめでとーーーー!

(21:28)
それにして。も。思うのだけど。

最近あちこちで子供が生まれている (?) のであるが、 こうして彼等 (パパたち) は仕事をやめられなくなり、 柄にもなく「子供たちのために」みたいなお題目を口走るようになり、 ますます保守的になっていくんだなあ。と、思った。 いや、それはまだいいのだが、こいつらは オレに向かって「新山にはいつまでもキチガイでいてほしい」 みたいなことを言いやがる。そういうのに対しては、 このバ・カ・野・郎・!! と言いたくなるよね。

考えてみれば、オレは予備校でも大学でも、大学院でも、 いつも集団にとけこんでいない、どっか「微妙に浮いている」存在だったような 気がする。いまの会社でもそうかもしれない (ひどい自意識過剰ぶり!)。 といってもそれは別に悪い意味ではなく、自分ではこの微妙な浮き具合が イイと思ってるのだけど、よくよく考えてみると新山はいつもこういうのを 許してくれる人々に囲まれていたからやってこれたのかもしれない。 つまり、適度に放置されてたってことですがね…。 そういう意味ではオレってすごくラッキーかも、と思う。

Dec 01 [Sat]


(11:06)
神保ウェールズ

Document ID: 4db9e192416edba26e730a23fa837574

Yusuke Shinyama