2003年 9月 (1)。

あなたは完全に誰かと取り換えが可能です

Last Modified: Thu Sep 11 09:00:57 EDT 2003 (09/11, 22:00 JST)

Sep 10 [Wed]


(09:00)
最悪の夢だった。なんだよあれ。 一度目に見た夢はむかしの知人がものすごく変わってしまっていた、というやつで、 これは人を落ち込ませるものだが、これはあまり現実に起こらなそうだからまだいい。 でも二度目に見た夢はなんだかあやしい宗教団体に追いかけられているというもので、 これはなんか本当に起こりそうでこわかった。こんなことをいっていてもはじまらない。 とにかく、仮定と推論の世界に生きる奴は氏んでしまえ、と思う。何が?
(10:17)
AppServer の宿題がなんだかむずかしい。 「コンポーネントベースのデザインではどのようにして一定レベルの コードの再利用性を確保するか?」とか聞かれてもねえ。そんなん無理です。
(11:49)
今日はカフンショーが今までになくひどい。 朝からもう 30回ぐらいクシャミが出た。

ところで、健康保険のカードがいまだに来ないんだけど、 どうなってんのかね?

(13:43)
うんがあ君。
(16:57)
ったく、忙しくて日記もろくに書けやしねえや。 水曜日はいそがしい! しかも今日は寝不足で敗北ぎみだった。 まず 12:30 から SGS の読書会があるでしょ。きょうは Google で使っている ファイルシステムの話だったが、キモとなる部分はよく理解できず。 14:00 から Dan の機械学習の授業。おいていかれた感覚。 そして 19:00 から例のジャン=クロードなんとか先生の授業である。 宿題はいちおうおわったけど、これじゃ研究する暇ねーや。 さっさと、さっさと。
(22:44)
帰りぎわにふと空を見たら、うっすらと白い光の縦線が走っていた。 WTC 跡地の「光の献花」である。今年もやってたのね。 月がすぐとなりにあるのでおもしろい景色だ。
(01:19)
cdb の内部構造。 先週からずっとうんうん言いながら書いていたのだが、まだ完璧ではないのだが、 もう眠いから公開しちゃえ。やはり英語でわかりやすい文章をかくのはむずかしい。

まあ日本語でも充分むずかしいのだけど。

Sep 09 [Tue]


(08:50)
ノドが痛い。風邪ではなくこれは花粉症なのだ。 痛いというより、カユイという感じがする。
(09:39)
ま、そんなもんでいーんじゃ
ない?

社会の縮図だよ。

(11:31)
kconv-1.1.8c をコンパイルしようとしたら、gcc-2.96 が落ちる。 ふげ〜!! しかも修正しようとしてコードを見たら、なんか読めたもんじゃないし。 けっっっ。やってらんねーよまったく。
(15:16)
いまは kconv-1.3.1 になって sourceforge.jp に移籍してることが判明。 これはふつうにインストールできた。ありがたし。

どうでもいいけど sourceforge.jp って「sf.jp」ドメインを持ってないから不便だな。 新山はいつも「lynx なんとか.sf.net」でアクセスすることが多いため、短いほうがいいのだ…。 ちなみにほとんどのよく使うコマンドは 1文字か 2文字であるが、変態な例を以下に示す。

(18:54)
別のルームメイト候補と会う。 こんどは無事に決まるといいけどなあ…。
(20:15)
うっひょっひょっhyぉ。だーいぶいい感じに動いてきた。。 しかしフォントの幅は (たとえ TrueType であっても) つねに整数値になってしまうので、 18ポイントとかにするとやはり絵がズレてしまうなあ。
(23:15)
ようやくリリースしましたが、このプロダイバーからはどうやら 某掲示板に書きこめないことがわかった (批判要望板のみ書けるので、アクセス規制されてるらしい)。 ま、あしたでいいや。tracker の人々には知らせたし。 なんか、4人いるらしいが…いや、いるだけすごい。
(23:45)
ときに人々は新しい概念を発明したと主張する。
しかしその多くはたんに新しい文字のくみあわせを書いただけにすぎない。
“みんなはあたしに言うの
   そろそろ落ち着きなってね
              だけどだけども
人-生-は-長-い-じゃ-な-い”

-- 浅川マキ「夜が明けたら」

Sep 08 [Mon]


(09:24)
この 3つのエントリが入ってないと OpenOffice 1.0.1 ではメニューの日本語文字が ぜんぶ "?" になってしまう。ということを発見した。 というかこれを発見するのにすげー時間がかかったし、おまけに発見したところでべつに嬉しくもなんともない。 しかし ttmkfdir を実行するとこれらのエントリは自動的に消されてしまうんでアホである。 まあそういうこと。
kochi-gothic.ttf -misc-Kochi Gothic-medium-r-normal--0-0-0-0-c-0-jisx0208.1983-0
kochi-gothic.ttf -misc-Kochi Gothic-medium-r-normal--0-0-0-0-c-0-jisx0208.1990-0
kochi-gothic.ttf -misc-Kochi Gothic-medium-r-normal--0-0-0-0-c-0-jisx0212.1990-0
(13:15)
どういうわけか、City Hall から逆方向の地下鉄に乗ってしまい、 サカナの置物と対面するはめになった (Whitehall St. の駅には 鉄でできたサカナの置物が置いてある、意味不明)。 おっかしいなあ、どこで間違えたんだろ…
(13:58)
表示はできるのに、pfaedit で編集しようとすると落ちるのは GSUB がヘンなグリフ番号を指していたのが原因。GSUB は特に必要ないと思うので けずってしまおう。それから Windows がつねにアンチエリアスしようとするのは gasp がないのが原因だった。これは小さいテーブルだし、 入れておいてもいいと思う。kochi-subst には今のところ入ってないみたいだけど。

ところで、きのう OpenOffice で bold, italic にするとうまく表示されなかったが、 あれは fonts.dir に TTCap を書いたのがマズかったということが判明した。 書かなければふつうに表示する。でも bold も italic もできない。 調べてみたらじつは Kochi-Gothic とかでもできないのでこれでいいのかも (よくないと思うんだが…)。 まったくうー。なに? TTCap ってもう今の X じゃサポートしてないの? …あらためて言わせてもらうが、X のフォント仕様って本当にひどいと思う。 ビットマップのときはまだマシだったんだけど、 TTF まわりは本当に本当に本当に本当に本当にひどい。もうね、アホですアホ!! …ある者 (プログラム) は X 経由の描画を使い、別の者は自力で freetype かなんかをつかって描画する。 その両方を使うやつもいたりする (OpenOffice なんかはそうだ)。 そういえば VFLib ってまだ生きてんのかな? …生きてた。 …ある者は X のフォントパスを探し、ある者は xfs をつかう (ところでいまの xfs っていったいどーなってんの? もう知らん)。 ある者は XftConfig を見るし、ある者は見ない。XftCache ってナニよ!! (逆上中) これ使ってんの?? $HOME/.xftcache ってのもあるけど、fonts.dir と似たようなもんじゃんじゃないの?? ttmkfdir って何だ。こいつの生成する fonts.scale は fonts.dir とどう違うんだ! pspfontcache はなんんなんだよ!! …もう人生何もかもイヤになった。フテ寝したい。

さて、まえまえからタマっていたのだが、ここでいまの UNIX で 新山がダメだと思うところを全部あげてみよう。

まだまだあるかな〜 ありぞうだな〜
(16:12)
意味が微妙に通じない文章を書く奴は 100% 頭オカシイという結論を下すことにしている。

ああ、おれもか。

(18:36)
また秋がきて、オレは人相が悪くなる。
(22:42)
いま帰ってきたとこ。 やはり夜遅い授業はつかれる。 しかし、授業が終わってから夜のNYを歩いていると、 なんだかえも言われぬ充実感を感じたりもするのだ。 きょうは何人かの日本人と知りあった。じつは MS の課程には 日本人が結構いる (彼らとはとる授業が違うのであまり知らないのだ)。

Sep 07 [Sun]


(10:06)
うわあ、ナンなんだこれは。あ

ぼんぼんべんぼこぼこぼこべんぼこ

そう。たしかに (いつのまにか話が通じている)、今の世の中ではパスワードや暗証番号を忘れたら何もできない。 そしてケシカラヌことにそいつらは着々と増えつつある。 かといって、これをぜんぶ統一されるのはなにやらコワそうだ。それがし。ー パスワードが必要です。パスワードが必要です。パスうードが必要です。八ヌケー卜”が必要です。は

(11:17)
つまりね、
(14:32)
おだやキングな午後。

けきょきょきょきょきょきょきょ
  けきょ けきょ けきょ けきょ けきょ けきょ けきょ けきょ、
    けきょ、けきょ、けきょ、けきょ、けきょ、けきょ。

…そういえばうちの親はウグイスを見ると「あ、ホケキョだ。」という。
アホが遺伝してよかった。
ちなみに、オレはこの遺伝を誇りに思っている。

(15:26)
やっぱ hmtx まで自動生成するしかないっすよ。

これやこの

(19:13)
やっと表示できるようになったが、 あとは最大値その他と maxp まわりを…。でもこれってホントに必要なんかね??

ついに glyf の中身にまで手を出すことになるのか。 スクリプトは汚なくなる一方。 Perl だし。もう怒り狂って 1 からガッチリしたものを 書き直すって手もあるのだが、すでに fonttools とかもあるわけだし、 そもそも自分はフォントの専門家になるつもりなんか毛頭ないのである。 「ただ表示できりゃいい」って感じなのに、欲張って昨日拡張してるうちに あれよあれよという間に…。 しかし我ながらよくやるよなあ。この Makefile なんかももう長すぎて 自分でも何やってるかヨクわかんなくなりつつあるうえに、イッチョまえに なにやら複雑なソフトウエアを構築しているような動きをするようになってるじゃないか。

ところで Makefile って prolog のプログラムに似てるよね。 たとえば make におけるこんな依存関係は:

job_finish: this_done that_done
this_done:
	do_this file1
that_done:
	do_that file2
そのまま Prolog ではこう書けるのだ:
job_finish :- this_done, that_done.
this_done :- do_this(file1).
that_done :- do_that(file2).
ただし、この 2つの決定的な違いは「make は何も探索しない」ことにある。 それに変数とかも取れない。しかし逆に考えれば Prolog を簡易 make として使うというのは、 誰かすでに考えてそうだけど、まあさすがにそんなめんどくさいことしないか。 まるで牛刀を裂くのにニワトリを使うがごとしだな。

TODO:

  1. maxp, hhea, head
  2. Unicode で足りないスペースがあるので、例のヤツがズレる。
  3. xfontsel で表示されない (Kochi-subst は表示される)。
  4. bold, italic にするとヘン (fonts.dir の書き方がまずいのか?)。
  5. rpm で ttf 版もインストールするようにする。
  6. 説明書かく。
  7. バックスラッシュじゃなくて¥記号にすること。
うげぇぇぇ。こうやってみるとけっこうあるな。

それから OpenSSH の更新もあるので注意。 これはあした…

(21:51)
いと不健康な週末でありましら。 ずっとヒキコモラーで PC ばかりいじっていた。 まあある程度は進んだからいいが、こんなことではいけん。どうしたもんだろう。 てゆうかなにがよくないのか? その説得力ある理由とは一体なにか?

どれもいまひとつ説得力がない。 べつに週末じゃなくても外には出られるし、運動は…いつもしてないからいっしょ (これは、したほうがいいんだろうなあ、とは思う)。 それから人生なんか基本的に無駄だ、こんなものは。 単なるひまつぶしだ。これは本気ではそう思っていないけれど、でも それでもけっこう有意義ではありますよ? とかいうふうに なんで疑問符で文章をおわらせるんだおまえは、腹へったのか。

Sep 06 [Sat]


(09:59)
オレがベッドから落ちたのじゃなくて床がせり上がってきたんだよ、勝手に。
(11:15)
わけないこと。
わけないことなんです。
(12:24)
人生には数えきれないほどいくつものパラメータがあり、 そのうちの多くはシンナーを必要とする。あるいは石油でもいいが。

常識からの“逸脱的”な…誰かが「コイツはヘンだ」と思うことがあるとすれば、 それは常識がないからではなく、常識がありすぎることなのだ。ほんとかな?

あ、また夢の中から攻めてきた。明日の方角。
slept slept got sleep slept freakish slippery sleep

(13:47)
今年は秋が早い。

秋というのは一年じゅうでいちばん好きな季節だ。 なにがいいのかというと「衰退していく感じ」がいいのである。 夕暮れや老年期に新山がやけに興味をいだくのも同じ理由によるものだろう。 なぜだかわからないが、本当に重要な記述はそこに隠れているような気がする。 けれどそれは何だかわからない。 どうせいずれはこの世の中は壊れて消えてしまう運命にあるのだから、 この問題は他の誰とでも共有できるはずなのに、それができないのはなぜだろう…

ぼんやり

(23:18)
わかりやすいドキュメントを書くほうが、 わかりやすいプログラムを書くよりも 何倍も時間がかかるもの。

プログラムはどうやってもある程度以上はわかりやすくならないが、 文章にはまだまだ上がある。

(00:44)
aa-, 完成しねかった。
(03:59)
なんとなく gimp で遊んでしまった。寝なきゃいけないのに。

Sep 05 [Fri]


(08:04)
寝るとき暑かったので窓を開けて寝たら、夜中に冷えてきてブルった。

夢を見たが、なんだかまったく論理的でない理屈をこねていたような気がする (でも、それがなんだかは覚えていない)。

まったく、な。

(08:43)
手遅れだけど、足遅れじゃない。
(11:20)
ねむい思考。defence をきいてきたが、アプリケーションの要求仕様によって ネットワーク帯域をダイナミックにプランニングするシステムの話だった。 やはり今は incremental deployment ができることが必須条件になっているようだ。 しかしアプリケーショんといえばあいも変わらず HTTP とかで、つまらない。 なんだか最近やたらとシステム屋さんのグループによく入りこんでるような気がする。 言語はどうした!

どうでもいいけど、defence ってイギリス英語だね (米語は defense)。

(11:49)
どこかで見たようで
誰かに似ているようで
でも、
誰でもない
だれか。
(12:39)
アジア人なんか人間と思ってないんだろうな。
(13:18)
よく思うのだが、機能でソフトウエアを表現しないでほしい。 何々ができるとか、何々を持っているとかいった言明はたいていの場合、 たいして意味をなさない。どんなに機能があろうが、ダメなものはダメなのである。 それはまるで人間の評価に似ている。 Ph.Dを持っていようと10億ドルの資産を持っていようと某国の大統領だろうと、 どんな言明に対しても、かならずそれをすり抜けてなおかつ「ダメ」な奴がいるのだ…。 これをいったいどうやって定義したらいいのか、誰も知らない。 できるのは、ただ自分がそこに入っていないことをひたすら祈るだけだ。 もっとも、それは自分では永久にわからないのだが。
(15:26)
?
(22:00)
いまコショウの匂いがする。まあまあ。
(23:37)
(以下の文章は、暗号でかかれています。解読するには例の本と、サソリのしっぽからつくった秘薬が必要です)

誰も尋いてないのに答えるが、おれはテロリストだ。 おれが破壊する対象は、玉子の黄身だ。 わかっているだろうがこの玉子はただの玉子ではない。 そいつは、すさまじい勢いでつぶれる。 そうするとえもいわれぬ内容物があたりにだらっとなり、 彼は満たされるだろう。 しかしこいつはとどまるところをしらないので注意が必要だ。 奴を薄めることはできない。 前の状態と後の状態で味が変わらないわけにはいかない。 つうか、かならず変わる。 しかしよく覚えておきたまえよ、このような行為つまりテロリズムは、 通常最低の卑しさをもって迎えられるのだということを。 つまり、ラーメンの玉子はそのまま飲め。つぶさずに。 そういうことだ。無理。

どことなく梶井基次郎の声がただよっているがそんなことは知ったことか、

研究日誌
きのうのつづき。まえにとりだしておいた類似度 (=tf・idf ベクトルの cosine) >0.3 だった 15,084 個の記事対 (毎日×日経) に昨日のスクリプトを適用した結果、2,194 記事対が フィルタされた。[その内訳は、共通するソース (AP or 共同) のパクリが 336件、 定型表現 (訃報、人事、選挙結果など) が 1481件、著作権問題により不完全な記事対が 377件]

つぎに残りの 12,890記事対から 1% に相当する 128記事対を無作為に抽出して、 その正当性をしらべる。120記事対 (94%) が正しい組。のこりの 8組のうち 3つは Op-Ed (いわゆる社説とか解説記事) で、これはつねに間違ってるほうに分類した。 なぜなら社説は同じことについて語っていても内容は違うでしょうからね。 そのご正解してた 120記事対を分類する。社会面が 41対、政治(国際ふくむ)が 36、 経済が 27、スポーツが 16 という結果だった。結局、いろんなドメインの comparable corpus をとるにはこの簡単な手法で十分ということだな。 おつぎはここから手間をかけて手作業ですべての言い換え表現を抽出することだ。 これは来週いっぱいでできれば恩の字か。ああ大変そ。

しかし、日々の結果をぜんぶこんなとこに書いちゃう研究者ってどうよ?

Sep 04 [Thu]


(09:36)
夢の中で誰か (Owen だったような気がする) を助けるべく働いていた。 でも、裏切られた (彼にではない、別の人に)。 なぜか Hoboken の駅で電車がターンするところだった。 なんかドラマのような展開だったが、こまかいところは覚えていない。

寝坊ぎみだなあ。

(10:39)
げっっ。いつのまに Wikipedia に こんなエントリが… (書いたのはオレじゃないぞ)。 つうか、日本語版はなんかやったらマイナーな内輪受けエントリばっかりが増えてるような気がしてアレだなあ。 一般的な用語を解説できるような層は見ていないのかしらん。
(10:49)
あー。またふられた〜〜〜〜

ルームメイトのことですyお。

(11:37)
なにげなく URL に python.jp/Zopy と打ってしまって Not Found。

勝手に言葉を変えるのは自分の悪いくせだということまではわかっている。

26,000曲が入っている Juke Box (nytimes) だって。主人が自分の持っている CD を全部 mp3 にして置いているだけなので、著作権的には問題は何も生じない。 バーのジュークボックスがいまだに人気あるこの国では、これは結構いいアイデアかもしれない。 ただ、一部の否定派がいっている 「あのレコードをメカニカルにガチャガチャやる機械が好きだったのに」って気持ちはわかるなあ。

ところでジュークボックスといえば、GEB に「たった一枚しかレコードがないジュークボックス」という 概念が出てきて笑った。レコードは一枚しかないのだが、かわりにプレイヤーが何十台もあって、 それがガチャガチャ動いてきて別の曲を奏でるというのだ。ああ。

(17:53)
Bobst 図書館のツアーというものがあったので参加してみる。 が、基本的に知ってることしか説明してもらえなかった。 NYU は大学図書館の中でもけっこうスゴイ方らしく、 とくにここには映画のビデオやDVDがかなりあるらしい。 (ま、映画学科で有名な大学なので)。 暇になってきたら教養のためと称して図書館に映画を見に行けるかもな、 そりゃあ結構いいかもな。

そのあと韓国料理屋でおそい怯めし^H^H^H昼めし。怯(ヒル)んでどうするか。え? ちなみに computer store に寄って、「PowerBook は頼んだらいつくるのか?」と尋いたところ、 2週間もかかるというので、それじゃ Apple Store で買ってもたいしてかわんないじゃん、と思う。 どうしよ。どうしよ。

(18:32)
けっきょき、ちゅうもんしてしまいまし田。

オレって。

(20:53)
「あなたは完全に誰かと取り換えが可能です」
という言葉。

あることについて。いやどんなことでも、 決して人のいいふりをしてはならない。 忘れたり、「代償が支払われ」たりといったことは、 この世界においては起こらない。絶対に。忘れるな! すり替えさせるな! 人々は死ぬまでただひたすらに怒り続けること。 「赦し」など必要ない! 決して!! 誰にとっても!!!

人のいいふり
いい人のふり
(21:58)
かえりは BN によって J2EE 関係の本を物色した。

あついよう。なぜならば乾燥機から出したてホヤホヤのパジャマを着たから。 だからどうしたって感じ。(DDK)

そもそも、それがどうしたというのか? 「暑さ」などというものは、本来存在しないのだ。 指でさし示すことができなければそれは存在しないも同然である。

だから?

(00:14)
そうだいえば、明日は dissertation の defence があるので、 早起きて見に行かねばならない。そうだそうざ。そいうだ

ああ、また誰か。

研究日誌
きのう授業に出ててぜんぜん研究やれなかったので、 今日はすこしすすめた。例のスクリプトをもうちょい調整して走らせる。 15,084 記事対。1時間くらいで終わった (計ってないけど、たぶん)。 下のほう (2000位ぐらいから) はだいぶ OK が多くなっているが、 どの程度たしかなのかわからない。明日はどんな記事の分野があるのか チェックすること。ついでに記事を見比べるための簡単なデータを 生成しておこう。これはきょうの関数を使えばできる。

Python におけるパフォーマンス上の問題は、 インタプリタの起動とモジュールの読み込みに時間がかかることだ (Java よりはましだが)。 だからシェルスクリプトで 1個づつに対して起動・終了をくり返す python スクリプトを ぼかりんぼかりん走らせると重くって仕方がない。こいつをどうにかする方法を考えないとな。 といって、サーバを立ち上げておいて独自プロトコルを… というような苦しいアーキテクチャにするのもまたあれだと思うし。 分散オブジェクトが簡単につかえればよいのに。 python ともなれば絶対だれかやっていそうな気がする。 omniORBpy ってどうよ?

おお、 ここにいろいろある ではないの。あと、 ここ

Sep 03 [Wed]


(08:36)
あいかわらず涼しい。きのうはよくコテンと眠れた。コテ寝 (うちの親がよく使う言葉で、コテンと寝た、の意らしい)。 なんか、よく眠るためには適切な夕食の量があるようだ、な、気がする。 ぱくぱく。

パーークーーーシーーーーー。

でーでれんでんでーでれんっ、でーでれんでんでんっ ピヨピヨピヨピ

(こういうこと書くからオレは頭の中が爆発してると思われるのだろう… しかし実際には書くだけでなく口にも出してますので要注意! こと!!)

(09:43)
だべな!
(11:22)
ある方から「小杉十郎太はなんで濃いのか?」という質問をうけましたが、 単に名前が「“こすぎ”じゅうろうた」だからです。くだんね…。 ああごめんなさいごめんなさい。 実際にはオレは小杉十郎太が何物であるかもよく知りません。 死んできますから許してください。

ところで死ぬる (「死ぬ」を「死ぬる」というのは関西方面らしい) 前に…

学校で教えてくれないテキサス・勝手にその2:

(11:55)
まあ、武蔵小杉とか小杉十字路 (武蔵小杉駅前にある交差点) でもよかったんだけどよ。

ちなみに武蔵小杉で思い出したのだが (また頭が爆発し出した)、 まえにこの駅のことを「ムサコ」と略してた人がいたような気がするのだが、 それだと武蔵小山も武蔵小金井も「ムサコ」になってしまって曖昧だからやめたほうがいいと思う。 でも、といって「ムサコス」にするとなんかロシア人の名前か、あるいは 「むさ苦しいコスプレ」みたいなのでそれもやめたほうがいいと思う。 いま、ある画像を思い出したがもうやめておく。

(15:48)
とりあえずいっこ授業終了。途中からネムくなりだして大変だった。 教室せまいよーなんであんなとこに 20人近くもくんの。 しかし Dan は「ふるい落とし」にかかっているようで、これからが 地獄になると予想さるる。なに、50ページだって? 来週来週。ふは

授業が終わってから、へれんがなにやら質問に来て あいかわらず「ところどころ微妙にかみあってない会話」をしたらすごくつかれた。 はあー。

(17:13)
ああ、ねみー。こぎっっっっ
て。
(23:56)
ふう。やっぱ 7pm-9pm の授業はつらい。 これはたぶん社会人向けに時間帯を設定してあるからだと思う。

というわけで Application Server の授業に出てきた。 なかなかおもしろい。先生がジャン=クロードなんとかいうフランス人で、 「でぃふぉろんす (difference)」「いんぷろもん (implement)」などと発音する。 スゲー、なんかフランス語を聞いてるみたいだよ!

授業そのものは面白かったが、このヒトの定義によるとぞうぴぃは アプリケーションサーバなんかとは到底よべないらしい。 いわく「アプリケーションサーバというのは scalable でなければならない」、 つまり接続がくるたびに毎回 cgi を fork してトランザクションしてるようなのは お話にならないということだった。聞けばこのヒトはむかし Sun Enterprise Server の上で cgi を書いたことがあり、そのシステムは クリスマスの時にトランザクションが集中して (fork できなくなって) 落ちたという。 そういう、「毎分何万トランザクションもできるようなシステム (eBay とか)」 を いかに堅牢につくるか? というお話なのだった。 彼によれば、アプリケーションサーバの定義というのは以下のようなものだ。

ふーむ。そうですか。で、実習で使うサーバは IBM の WebSphere とかで、 「学習用なら安く入手できるから買ってよし!」という。 ちなみにこの先生、噂によると「すごい量のコードを書かせる」ことで有名であるらしい。 燃えますね。やってやりますわよ。ちなみに彼いわく 「なぜシステムを scalable にしたいかといえば、それは儲けたいからですよね!」という。 非常に明確な目的だ。まあヘンに言いわけがましい理屈こねられるよりもそのほうがいいが。

Sep 02 [Tue]


(09:13)
ったくなんでこんなに涼しいの?? 16度。天気は雨。

それにしても、いまだに自分が高校生ぐらいの精神年齢しかないことには嫌悪を覚える。

(10:05)
コーヒーをいれたらあまりに濃すぎた。小杉十郎太ぐらい濃すぎる。

ひと足早く、冬の世界へようこそ!

(11:48)
山形さんのインタヴューに ある「いきなり上級なことをやれ!」ってのはまったくいいことで、 これはプログラミング言語の「お勉強」を重視してこまかいとこばっかり つついてる連中 (2ch に多い) にも言ってやりたい。 だいたい、そういう連中がまともなものをつくる可能性はほぼゼロに近いのだ。 本を買うとかなんとかいってる暇があったらさっさと作りたいもん作れよ、と思うんだけど。 ほとんどの言語は、リファレンスと首っぴきで試行錯誤しているうちにたいていはなんとかなるものだ。 それに、変な定石とかクセみたいなのはサンプルコードから学べばいい。 新山は「事例からの学習」を最優先するので、とにかくサンプルコードが沢山ある言語のほうが好きである。 しかしなんでそんなにしてまで言語の仕様を勉強「しなきゃいけない」と思うのかは謎だ。 言語オタクなんだろうか (でも言語オタクって、そんなに沢山いるとは思えない)。 あるいはただ単に「知っている」ということで優越感にひたりたいだけのようにも見える。 そもそも、プログラミングというのは、まずやりたいことが先にあって それから言語を使うという流れになるはずなのに、こういう人の多くは順序が逆になっている。 本当にやりたいことがないなら、だまってゲームでもやってりゃいいのにね。
(12:11)
そういえば、西洋人の習慣でいまだに新山がどーしても慣れないのがある。 それは「握手」で、オレは潔癖症なのでどうしても握手したあとに手を洗いたくなってしまう。 んー。しかし逆に新山家にはおそらく普通の日本人から見ると圧倒的に変態な習慣があって、… いやこれはやめとく。
(13:27)
おー。 Simple English Wikipedia なるものができている。 つうかほんとはずっと前からあったらしいのだが、いままで気づかなかった。

これって言いかえ表現による文章の簡略化をめざしてる人々 (NAIST 方面) には、 いいコーパスにならないかな?

(14:12)
「246」を「ニシロー」と読むのはオレだけなのだろうか。
(19:37)
まだ続くルームメイト探し。 きょう会ったのは、グラフィックデザイナーをやっているというベトナム移民 (でも英語はほぼネイティブ) だった。うーむ。いろんな人がおるのうー。 これで 3人コンタクトをとったが、そのうち2人はまだ返事待ちである。 そしてあと1人まだ会う予定があり、それでもダメならもう一人、ということになるかもしれない。 これから授業が始まるのでまた地獄のように忙しい日々になることが予想さるる。ああ。 ちなみに履修する授業は これこれこれだ。 じつはぞうぷ本を買ったのはこのせいもある。ga, まだほんの少ししか読んでないよ。 あと統計の教科書もぜんぜん手つけてないし、いいんかね。こんなこって。 ああ予習しなきゃ。

でも、忙しいほうがへたに落ちこんだりしなくなるから (次から次へと追いたてられるので落ちこむ暇がない)、 いいと思う。そうだよ、ほんとにさ…。

(21:20)
「しんこうでんき」って少なくとも 3つあるのね。 ドメイン名が shinko と shinko-ele と shinko-elec だ。苦しい…。
研究日誌
類似した記事をしらべる。その結果、毎日と日経で類似度が高いほとんどの記事は、 共同通信やAPからそのまま文章をパクってきたものであることが判明。 あとは人事や訃報、地震情報、選挙結果、スポーツ結果などもほとんどいっしょ。 これらを除くと、残るドメインは社会面 (殺人・傷害) と政治の記事のみになってきた。 しかしこれは類似度が高い順に上から記事を調べていたため、 セキネさんいわく「まだ判断するのは時期早尚、類似度が低い記事も調べてみる必要がある」とのことで、 どんな特性をもっているか分類する簡単なスクリプトをつくってみる。まだ改良中。あしたもやること。

ところで「タス通信」ってオロシヤの通信社だったんね。

Sep 01 [Mon]


(08:56)
すずしいです、
(10:29)
ほんとにすずしいです、
(11:07)
てくるで、明日からラッコウ (学校) が恥マルのですが、t tttttt
(14:38)
Perl で
print " ".join(@_);
などとやって、「動かねえー」といっていた。

馬鹿。

(17:27)
ある文字列がぜんぶひらがな (あるいはカタカナ) でできてるかどうかの判定。(ただし記号は無視する)
import re
HIRAKANA=re.compile(u"[\u3041-\u3093]")
KATAKANA=re.compile(u"[\u30a1-\u30f4]")
KANJI=re.compile(u"[\u4e00-\u9fff]")
NUMBER=re.compile(u"[0-9\uff10-\uff19]")
ALPHA=re.compile(u"[a-zA-Z\uff21-\uff3a\uff41-\ff5a]")
def is_hirakana(s):
  return HIRAKANA.search(s) and not (KATAKANA.search(s) or KANJI.search(s) or NUMBER.search(s) or ALPHA.search(s))
def is_katakana(s):
  return KATAKANA.search(s) and not (HIRAKANA.search(s) or KANJI.search(s) or NUMBER.search(s) or ALPHA.search(s))

ところで今日は Labor Day でオヤスミだったって、みなさん知ってました? ボクは知りませんでした。

(19:09)
きょう帰ってきて、道ばたに野良っぽいデブネコがいたので 「おいデブネコ! デブネコ!!」と話しかけているうちに なんだかだんだん楽しくなってきてしまい (←キチガイ)、 その後もしばらく (誰もいないのに) 一人で「デブネコ…デブネコ…」を 繰り返していた。どうやら自分は「○○ねこ」という単語が好きらしい。 うみねこ。なまねこ。カムネコなど。しかし 5モーラになるともうだめである。 「まねき猫」とか「からす猫」とかはだめ。却下。 ああ、でも 6モーラになるとまた OK だ。「オオヤマネコ」とか「ぜいたく猫」とか、 4文字ほどではないにしても、まあ OK (何が OK なんだろう??)。 しかしこの性癖はどこから来たのだろう… 先祖は 4文字猫 (四熟語みたいなもん) だったのだろうか?
(20:19)
セールス電話がかかってきたので、「いらない」といったら 「本当に? いまなら完全にタダなのよ? あんた本気?」とか言われて無可付ク。 「こいつはタダならなんでも欲しがるだろう」とかハナから決めつけられるのは気分悪いんだよ。 そりゃたしかにオレは貧乏だし育ちも悪いけど、いくらなんでもそこまで悪くはない。

…そこには船着場はなく、あるのは砂利の高い斜面だけだった。 斜面のまん中に、家主は黒い字で「私有地、上陸を禁ず」と書いた大きな看板を立てていた。
「上がろうよ」
大いに腹を立てたおばあさんはいったが、ソフィアはこわそうな顔をした。
「大きなちがいだ。育ちのいい人間なら、誰もいないからといって、 他人の島へのこのこ上がっていくものかね。それなのにこんな看板を立てるんだから、 上がってやろうよ。人をばかにしてる」
と、おばあさんは断固としていった。
「もちろんよ」
とソフィアもいったが、これで彼女は厳粛な生活の知恵をふやした。
二人は看板に船をもやった。おばあさんはいった。
「あたしたちがいましていることは、一つのデモンストレーションなんだよ。 非難を示してやるんだ。わかったかい?」
孫は、
「一つのデモンストレーション」
と繰り返してから、やさしくつけ加えた。
「ここにいい船着場はできっこないわね」
「だめだね」
きっぱりとおばあさんはいった。
-- 少女ソフィアの夏
(23:25)
…と、思う。

塩じゃけに納豆。

新山ネ右介

研究日誌
こないだ調べたカッコの分類に「言いかえ」というのがあったので、 それをつかって言いかえ表現がどの程度抽出できるか、予備実験的なものを やってみる。NE をまとめて knp で文節区切りしたあと、「A(B)」という形の ものをとりだし、そこから「言いかえ表現っぽい」A と B の組み合わせのみを選ぶ。 いまのところとりあえず、「A と B のどちらかに NE がひとつでも含まれていたらダメ」という 非常に単純なフィルタリングをとっている。 すると残った表現 (得られた表現) は以下のようなものであった:
サドンデス : 突然 死
緩和 : フラット 化
大陸 出身 者 : 外 省 人
一般 投票 : 本 選挙
女性 自身 : 母 、 姉妹 、 妻 、 娘
全国 市民 オンブズマン 連絡 会議 : 事務局 ・ 名古屋 市内
彩度 : 鮮やかさ の 度合い
動画 : 十数 秒
LAN : 域内 情報 通信網
LAN : 域内 情報 通信網
バーチャルリアリティー : VR 、 仮想 現実
LAN : 域内 情報 通信網
ヒル : アップダウン の 激しい 丘
ヒューミディティー : 高い 湿度
ドーピング : 薬物 使用
◆ CALS : 生産 ・ 調達 ・ 運用 支援 統合 情報 システム = キャルス
BS : 衛星 放送

まあまあ正しいものもとれている。が、ぜんぶ用語説明だな。


Yusuke Shinyama