2006年 8月 (1)。

Last Modified: Sat Aug 12 01:54:37 EDT 2006 (08/12, 14:54 JST)

Aug 11 [Fri]


(07:09)
今日でインターン最後である。 いや、さすがに自分をゴマかしつづけるのも 3ヵ月以上になるとそろそろきついよね。
(00:09)
はーーーーー。

さっき帰ってきた。おわりだ。これで終わりだ。 これでもうあそこには行かなくていいんだ。 それに愛想をふりまく必要もない。すべては終わったのだ。 明日からは研究と原稿書きに精をだすことにしよー。 あ、それに、返事しなきゃいけないメールもたまってるしな。 パッチもあてなきゃいけないしな。Traiss も再開しなきゃいけないしな。 この数か月間でだいぶ (数ヶ月ぐらい) 歳をとったような気がするよ。はあ。

で、なんでこんなに遅くなったかというと、 今日は開発部門の全社員 (数百人いる) で Coney Island の遊園地へ行った、 というか「絶対行くように」という指令が出ていた、からである。 こういうのって嫌だな。なんでいい歳こいたオトナが しかも平日に団体で遊園地なの? こいつら世間をナメてんの?? …まあ、ナメてるんだろうな、この会社は。しかし新山は 今日じゅうに何としてでもやんなきゃ (やんなか) いけない部分があったので、 ずっと抜け出すスキをうかがっていた。べつに地下鉄で行くだけなので、 挨拶するタイミングさえつかめばサッサと帰ってこれる。結局、 ジェットコースター (いちばん名物らしい) だけ乗ってサッサと帰ってきた。 1日パスをもらったのに勿体ないのだが、会社に世話されてるのでなければ 楽しめたかもしれない。ゲーセンでの消費用に大量のコインも渡されたが、 これはいわゆる「ゲームコイン」ではなくて本物の 25セント硬貨 40枚だったので、 こいつはあとで洗濯機に使うことにする。

しかし、このジェットコースターは Cyclone というのだが、 これが結構コワい。なにがコワいって、 なんか全体的にガタピシいっててヤバそうなのである。 まず、座席のガードがしっかり固定してなくてぜんぜん身体が固定しない。 てゆうか、オレがやせすぎなんかもしれないが、 ちゃんと座ってもみょうにスカスカしてる。 しかも衝撃がけっこうすごい。木製レールを使っているためか、 ぜんぜんなめらかじゃないのだ。急激な傾斜にさしかかると 激しく上下にガタガタ揺れて振り落されそうになるし、 坂を降りたところではもろに「ガツン」と来る。あれはヘタすると舌かむぜ。 新山はジーンズのポケットに社員バッジやらコインの束やらを入れていたのだが、 あまり振動が激しいためにこれらが落ちるんじゃないかと気が気じゃなかった (腰のあたりはまったく固定されてないので)。 メガネもあぶなかったくらいなのだ。あとで聞いたら新山のいた最後部は いちばん揺れがひどい部分らしい。まったくもー。

その後、2時ごろにコソコソと退散して駅に戻ってみたら、 向こうから例の haskeller の彼も歩いてくる。 「アレ、おまえなんで今帰んの?」「オレは今日が最終日なんで、仕事終わらせないと」 「ああ、お前は今日が最後か、オレは来週までだ」「で、お前はなんで帰るわけ?」 「あきた。実はもう前に 2回来てんだ」ガーソ。お前はそういう奴だったのか。まあそれはいいのだが、 彼は williamsburg を歩いて渡りたいから、といって、その橋にさしかかる前の駅でわざわざ降りていった。 あいかわらずオカシナやつだ (ま、人のこと言えないが)。 帰ってきて 3時すぎ。そのご 6時間以上かけてドキュメントを 20k も書いた。 泣きながら。最後のほうになるともう日本語でも英語でもなにひとつ 思考できなくなっていたので、「こんなんで許してちょ」というメモを書いて出てきた。 オフィスにはもう誰もいない。しかしとにかく終わったのだ。

どーせ将来ここで働くわけでもないのに、 なんぜ新山が仕事を終わらせるのにここまで意地になるかというと、 それは結局のところこの会社がキライだからだと思う。 新山は軽蔑している人に対してはときどき必要以上に 礼儀正しくなるんだけど、それと同じことですよ。 これであとはこの意味ないアブク銭をどうにかして始末するだけだな。

結局 (ケッキョキ、) 自分がこのインターンで得たものというのは 一体何だったのだろう、と思う。ほとんどなにも得ていない。 米国の企業文化を体験したかといえば、こんな世間をナメた会社ではそれもあやしい。 ああそうだ、会社にプロ向けのチョー高価なエスプレッソ・マシンが置いてあって、 それの使い方を覚えたんだった。あとは? ホントに何もないな。 C++ の文法にすこしだけ詳しくなったが、これは負の遺産でしかない。 いちばん大きいのは、この種の会社がいかにハッタリをかますかを 観察したことかもしれない。まあしかしそれを書くにはこの米粒は大きすぎる。

Aug 11 [Fri]


(00:15)
今日は 10時すぎまで塹壕してた。いや残業。 明日 (っていうかもう今日) が最終日なのんにちゃんと終わるのんか?? オレ。 おまけに明日はなんか全社で遊園地に行くとかいうアホげたイベントがあるらしいし。 仕事させろよ!!

Aug 09 [Wed]


(22:27)
腕だりーー。

てくでもいいけるどろ (てくるで + どうでもいいけど (どうでもよろ))、 世の中の会話の 80パーセントは言い間違いであって、 書かれた文章の 95パーセントは書き間違いであったとしたらどうだおrlう?? 「すばらしい才能に満ちた若くて活力ある人格者」というのが、 たった 0.1文字間違っただけで、 「ゴミムシダマシの幼虫のような目つきをした生まれたてで頑固なゾウキン」 になってしまうのだから、書き間違いというのはおそろしい。

かもね。

(00:54)
ある会社における、大きな矛盾 (というか、欺瞞) について。

この会社は、内部的には大きく 2つの部門に分かれている。 ひとつは、「カネをかせげる部門」で、もうひとつは「(それ単独では) カネをかせげない部門」である。 カネをかせげる部門とカネをかせげない部門の間には、でーっかいパイプがあって、 カネをかせげる部門のほうからカネをかせげない部門に向かって、いつも大量のカネが流れている。 「カネをかせげない部門」の社員は、このカネで養われているといってもいい。

そしてこの 2つの部門のやってることは本質的にぜんぜん違う。 でも、この会社は対外的にこの 2つを切り離すことは絶対にできない。 なぜならそうすると、この事業の性格上、「カネをかせげる部門」にはまったく金が入ってこなくなるからだ。 もちろん、実際には少し考えりゃ誰でも違っていることはわかるのだけど、 わざとそういう方向で注目されないようにしてるのね。

で、こんだけなら、ただの「巧妙な会社」ってだけで別にどうってことないのだが…。 最大の問題は、この「カネをかせげない部門」のほうが、 「カネを落とさない顧客」も持っているところにある。 つまり、この会社にとっては 2種類の異なる「客」がいて、 片方の客は「カネをかせげる部門」のほうに金を落とし (この金はカネをかせがない部門にも流れる)、 もう片方の客は「カネをかせげない部門」のほうだけを利用する (そして、金はまったく払わない)。結果的に、 この「カネをかせげない部門」は両方の客の言うことを聞かなきゃなんない (繰り返すが、この会社は対外的には「ひとつの会社」のようにふるまう必要がある、 さもないと何もかもブチこわしになってしまう)。 さあ、そうすると、この 2種類の客の意見が食い違ったときいったいどうなる?

これはセキュリティで言うところの典型的な Confused Deputy というやつだ。つまり、仕える主人が 2人いるのである。 いまんとろ、この会社はどっちに対してもいいカオを見せようとしているが (少なくとも外見上は)、この分裂は本質的なもので、どのみち解決できない。 やがてこいつらが衝突しだすと、 これはとっても醜い結果を迎えることになるだろうよ。 しかもその醜態は会社が公明正大なフリをすればするほどひどくなるが、 どうなるんだろうね。

ぞ。

Aug 08 [Tue]


(23:01)
アトミッカダ。アトミッカデ全テガ解法サレル。 たぴおかハカタカナデ書クベキ田ヨ。 いや、書クベキ蛇内ヨ。
(23:22)
Engrish.com を見ていてつくづく思う。翻訳ソフトってほんと罪だよなあ。 ああいうところでコケにされている立て看板などの英語は、 だいたいどれも翻訳ソフトによって生成されたものだ。 人間があんな英文を書くわけないから。妙に語彙が豊富なくせに、 まったく意味の通らない文章なんだもん。だって「非常電話」が "extraordinary telephone" ですよ…。それくらい辞書ファイルに入れとけよ、とも思うが、 真の問題は「翻訳ソフトがまともな英文を生成すると思っていること」である。 だいたいここまで機械を信頼するというのはそもそも危険なのに加えて 「機械を使えば英語を習わなくていい」という考えがあるのだ。 翻訳ソフトのようなものは日本人と外国人との距離をかえって開かせるだけだというのに (これは将来的に翻訳ソフトが完璧になればなるほどそうなるだろう)。

「ソーシャルブックマーク」の「ソーシャル」が意味してるのは、 相手の好きな URL さえもらえればあとはその他の情報なんか交換する必要ない、 ということだろう。つまり URL を交換するという程度の「関係」を、 これまでにかわって新しく「社会的な (social)」ものであると再定義しよう、 という隠された運動が起きているようなもんだ。 のか??

同じようなことはそもそも web 自身についてもいえる。 つまり、「どうでもいいことのどうでもよくなき化」だ。 これはいつも思っていることだけど、人間にはつねに「どうでもよくなさ保存則」が作用しており、 あることがどうでもよくなってくると、必ず別の (いままではどうでもよかった) ことが 「どうでもよくないこと」に格上げされてき、物事の「どうでもよくなさ」は つねにほぼ一定に保たれる。まあオレはどうしてこんなことを。 たまねぎ化。

(00:24)
かうもの: デンチ。

どうでもいいが、ここ 1ヵ月ぐらい、ずっとここに書こうと思いつつ忘れていたが、 「ぱげらんくの歌」というものを考えたんだった:

ぱげぱげ〜らんく ぱげらんく♪
ぱ〜げぱ〜げぱ〜げぱ〜げ ぱげらんく〜♪
ぱげぱげ♪
ぱげぱげぅ♪
ぱげっぱげ〜〜〜

(以来、120回くりかえし)

なぜこえrが重要かは、あなたが知っています。

(00:33)
すごくウケたニュース。

「長野県を有名にしてくれた」

やっぱ、これ。中学生は正直だなあ。 田中ヤスオの功績といったらこれしかないだろ (オリンピックと同じ扱いである)。 といっても、有名だったのは「田中ヤスオに 2度も投票した県」だからであって、 投票しなくなったらいままでの有名性 (famousity) は すべて「なかったこと」にされそうだけど。 しかし田中康夫はほんとうに長野県民の田舎者コンプレックスを解消してくれたのか。 これはじつにじつに怪しいと思うな。 いままで田中康夫なんか別にドーでもよかったけど、じつは奴自身が 田舎者コンプレックスが服を着て歩いてるようなヤツだったということに、 ああなってから気づいたという人は多いだろう。新山もそのクチです。

ちなみに「田舎者コンプレックス量」というものは時間によって上下するかもしれず、 いまんとここの手の感覚にまるで縁のない新山にしても、 じつは症状が潜伏しているだけで長野に戻ったら現れてくるといったことがあるかもしれないのだ。 こわいのう。しかし、オリンピックで知名度が上がったのは実際便利だよ。 出身地を言っても結構な割合で知ってる人がいるから。 ただし、みんな「ああ〜 Nagano って知ってる、あの北のほうにあるシマだろ!」と言うけど。

どうでもいいが (どうでもよろ)、 名古屋が日本の首都であるという事実を教えこむのは意外にむずかしい。

Aug 07 [Mon]


(21:21)
ここ 1週間ほど、大学のマシンで走っている秘密の ニュースサイト巡回クローラを止めていたが、きょうから再開したら たまってた分をガバっとやりだしたらしく、ぜんぜん終わんない。 しかしこいつももう走らせて 1年近くになるけれども、 すでにテキストだけで 50GBytes ぐらいたまっている。 ハッキリ言って、こんだけあれば研究には困らんので そろそろ止めてもいいかもしれない。 日本語のほうはまだ半年ぐらいしかやってないし、 こっちは 1日 4MBytes ぐらいなんで、せいぜい 600MBytes ってところだ。

思えばこのプログラムは、去年の 5月ごろから 「チクショウもういいかげんに研究テーマ変えてやるからな」 と思い、それから毎日毎日 (cronで) 走らせてきたのである。 新山のデスクトップマシン 1台だけで全部やっているので、 1日のうち半分ぐらいは loadavg がずっと 1.0 超で (とはいっても、nice されていたが)、 オレはそのあいだずっとトロトロした環境でやっていた。 ナニワ節だなあ。ちなみに、この間に新山はこのマシンの OS を Gentoo から FreeBSD に入れ換えている。歴史を感じるなあ。 ってゆうか、このマシン自体が新山の入学と同時に大学からもらったものなんで (当時は PhD 学生全員に PC 1台が支給されることになっていた、 いまはラップトップになっている)、もうじき 5歳になるやつなのだ。 もういいトシだよ。たしか、最初に入っていたドライブは 70G だったはずだ…。 いや、まてよ、30G だっけ? あのディスクは今どこにあるんだろう? どっかにあるんだろうな。 新山のオフィスの棚にはいろんなラベルを貼られたドライブが ゴロゴロ転がってる。 いやー、管理者ってのはこういうもんですぜ。 ほかにも新山の机にはドライバやニッパのほかに、 システム管理者ならたいてい持っているであろう 5色ステッカーやら汎用のラベルやらがある (ほかの学生はまずこんなの持ってない)。 しかし、いまの時代ならテプラだよなあ。

(01:01)
まったくつまらないね、この日記は。 たぶん、社会人になったらつまんないことしか書けなくなるんだろうなあ。
(02:18)
某むかを尋いたらムカついてきたので (別にシャレでない) ここに書いておく。 あのな、イソップ童話はあくまで「童話」なんであって、童話と昔話は違うんだよ! 童話ってのは昔の話じゃない。あれは今、現実に起きていることなんだ! いいかい? 犬が肉に向かって池を落とすとかはもう毎日、世界中で何万回と起きてる話なわけであって、 いまこうしている間にもラプンツェルの髪の毛とかもう 5センチぐらいニョキニョキと伸びてるし、 グスコーブドリの親父はまだ森の中を歩いているしで、暑さのせい。 もうどうでもいいや。

Aug 06 [Sun]


(11:30)
某社製エレベータは弾道ミサイルを八百長だっっ! 断じて長野県民は靖国から (集中治療室で) レバノンをつき落とすべし!

ここ 1ヵ月のどうでもいいニュースをまとめるとこうなる。

どうでもよくないニュース:

ほんとにどうでもよくないぞ! この「どうでもよくなさ度」はかなり高い。

どうでもいいが、かなりどうでもよさ度は高いが、 「原爆」というと日本でも必ずあのキノコ雲を連想する人が多いらしいのだが、 あれが一体どの程度「こわい」印象と結びついているのか新山はハナハダしく疑問だる。 あんだけじゃ中で何がどうなってんのか全然想像つかないじゃん。 あのキノコ雲は「こわい」というよりむしろ「すごい」という感じがする。 アメリカ人があれを「でっかい花火」みたいなステキなもんだと考えていたとしても、 別に驚くにはあたらない。なんしろ奴らはビッグでパワフルなもんが好きだからな。 「人類がついにここまでやれた!」みたいな感じで。

ちなみに原爆の物理的な被害という意味で新山は印象に残っている絵というのは、次のようなものだ。 アメリカ軍は核実験の際に、建物や動物が原爆でどういう影響を受けるかを しっかりフィルムに記録していた。たしか NHK で昔その映像をやっていた。 基本的には爆心地から数キロ離れたところにブタを (鉄製の箱の中に入れて) 固定しておき、 カメラを頑丈に固定して撮影するというもの。映像は白黒だが、音はついていた。 それを見ると、一瞬ピカったあとに、スビャ〜〜〜〜〜っと爆風がやってきて、 中の豚が「ぷぎーーっ」とわめいているところまでが映されている。 あとで見てみたら中の豚はどれも焼豚になっていました、というお話。 箱はオリのようなものではなくちゃんと「箱」になっていたから、 あれは熱線が直接当たったものではないはずである。 建物についての映像もあったが、すごい突風がきたあと 基本的にレンガ製の小屋の屋根はふっとんでドアはどこかにトンでいってしまうし、 たぶん現在の日本の住宅じゃあれはきっとドリフのコントのようにトサっと倒れてしまうものと思う。 こう書くとマンガ的であるが、マンガってのは本当は怖いんだよ! いや、そういう話をしたかったんじゃない。 なぜあの映像はショッキングなのにあんまりメジャーにならないのだろう? あれは、やらせなのか?

(00:48)
くおー。ニッキカクジカンガネ。 くそったれ。 オレはなあ、今日一日遊んでたんじゃないぞ。 つうかこの週末はぜんぜん遊んでいなカッタ (じゃあ昨日のあれは何だ? 何だ??)。 もうフテ寝してやる。

Aug 05 [Sat]


(17:30)
忙しいことはそんなにエライのかね?
(22:08)
正しいことは、一見、いかにもヤリガイがないことのように見える。 そこが問題だ。 そこが問題さ。 そこが問題さね?
(02:12)
はあ…。。。。
また PDF パーザにうつつをぬかしてしまった。。。もう死にたい。。。
しかしこれでようやく PDF 1.5 準拠 (ObjectStream と XRefStream をサポート) である。 PyPDF なんかとどう違うかって? ふはは、これはパーザ + インタプリタなのだよ。 つまり PDF の描画コマンドまでも解析する (いまんところだた「解析する」だけで文字以外は何も描画しないが)。 そしてこいつは日本語もキチンと処理する。CMap が必要だけど。 いやーいやーー日本語の表示はホントに大変だったぜ。 というか、表示というより「テキストに変換」するだけなんだけど、これでも大変なぬだ。 PDF は生成するだけなら日本語でもそんなに難しくないが、解析するほうは非常にタイヘンだ。 なぜならあらゆる形式やエンコードに前もって対応しておかねばならないから。 とくに /Encoding が Identity-V で CID の混合フォントなんか使われちゃったりすると もう泣くぜ (dvipdfm が吐く pdf はこうなっている)。 しかし、まだ大きな関門がひとつある。それは TrueType フォントの扱いで、 まともにやろうと思ったら TrueType や OpenType の中身まで扱わなきゃなんない (前に一度 Perl でやってるって? もう忘れたよ)。FreeType 使えだと? バカヤロウ! Python のみで書くことに意味があるんだ! (ハテ、意味とは??)

ちなみに使っているライブラリはこんだけです:

import sys, os, re, zlib
from struct import pack, unpack
from StringIO import StringIO

そしてクラスはこんな感じ:

$ grep ^class pdfparser.py
class PSLiteral:
class PSKeyword:
class PSSymbolTable:
class PSBaseParser:
class PSStackParser(PSBaseParser):
class PDFObjRef:
class PDFStream:
class PDFDocument:
class PDFParser(PSStackParser):
class PDFPage:
class PDFFont:
class PDFCIDFont(PDFFont):
class PDFTrueTypeFont(PDFFont):
class PDFType1Font(PDFFont):
class PDFResourceManager:
class PDFInterpreter:
class CMap:
class CMapParser(PSStackParser):
class CMapRepository:
class TextConverter:

そしてこれで最終的にいくらがんばっても xpdf に比べてハゲしく機能不足になるのは偶然の必然ではない。 おまけに行数もすでに 1000行超えてるし…。というかこれはいつになったら使いモノになる ライブラリになるのだろうか。コメントを見ると、これを最初に書いたのは 2004年のクリスマスイブということになっている。1年半もいじっているわけですが…。 それにしても、Adobe はもう PDF の解析エンジンには手をふれたくないだろうな。 いくらあそこに天才が揃っているといっても、これだけ仕様が腐っていたら どうやってもキレイなコードは書けんだろうよ。

もう死のう。死なれよう。

Aug 04 [Fri]


(19:17)
ふうふ。こないだ買った新しいディスクに / をまるごとコピーして、 それがようやく動くようになった。別に難しいことは何もしてないが、 スライスが分かれているので cp -Rp / /mnt とかいうようなことは できぬい。久しぶりに ed とか使っちまった。 まあ ed は標準ですよね。ed は標準のテキストエディタです。 これで python かきたくないけど、fstab とかいじるぶんにゃあ問題無 (もんだいむ)。

NYCBUG のえらい人 (…昔からの UNIX ユーザの中には、物知りで成熟した感じの 「えらい人」とよべるような人が新山の周囲にもたしかに存在したものだが、 いまや Linux の世界ではそういう人はほとんど見なくなってしまい、 いるのは妙にヘラヘラした軽薄そうなオッサンばかりになってしまった。 しかし、BSD 界隈ではまだ「えらい人」が生きている。) が、近所に cvsup サーバを たててくれたので (freebsd.nycbug.org だよ!)、そっから sup する。 こころなしか速い…ような気がするが、きょうび米国内じゃどこを使ってもそんなには おんなしだよ、おんなし。 (変な日本語。)

さて、buildworld はいつ終わるのだらう??

ちなみに新山はまだ (Linux のようには) FreeBSD のアップグレードには慣れてない。 毎度いちいち /usr/src/Makefile を読み、 これのステップにしたがってやっていかないとダメなのである。 しかしこれってよくできてるよなあ。 BSD の人々はまだ Makefile の書き方を知っている貴重な人種なんかもしれない。


Document ID: 98bc16bd2dff85fb96fbfa764b53659b

Yusuke Shinyama