2005年 8月 (1)。

Last Modified: Wed Aug 10 23:10:10 EDT 2005 (08/11, 12:10 JST)

Aug 10 [Wed]


(10:40)
そういえば、ゆうべ聞いた話でショックだったのが、 「スマートカード中に AES を実装してもじつは危険」という話だ。 なぜなら、スマートカードから放出される熱量や電磁波をこまかく分析すると 中で何を計算しているかがわかってしまうため、 カードを分解せずとも中の鍵に関するヒントが得られるのだという。 なんと!! これを聞いて ssh のパケット流量を分析してパスワードを推測するという研究 (ほんとにそういうのがあるんです) を思いだした。 そういう意味でも ssh では公開鍵認証を使うことが望ましいのだが、 話は変わるけどすこし Unix に詳しい人でも ssh の使い方はぜんぜんわかってないことが多くて、 まずは「公開鍵認証って何?」というところから話を始めなければならず、ひじょうに苦しい。 …おっと、技術的な話はしないんだった。

日本語における「ぢ → じ」「づ → ず」への転換はいつ起こるのか? たとえば、「まず」「めずらしい」などは「先づ」「愛づらしい (←愛でる、の活用)」が語源であるため、 ほんらいこれは「まづ」「めづらしい」が正しいはずだが、今ではこの書き方はマイナーになっている。 「生地」とかも本来「きぢ」のはずだが、たぶん今はほとんどの人がこれに「きじ」というふりがなをふるだろう。 いっぽうで「鼻血」「続き」などを「はなじ」「つずき」と書く人はまだ少数派だ。 でもこの傾向が続けば、いずれはこれらの語も「た」行の濁音から「さ」行の濁音へと移行するはずである。 だが、それにはなにかきっかけがあるのかな? かもしれない。

(12:14)
またぞろ激さむいので、キンジョのデリでレモンを一個だけ買ってき (50¢)、レモネードをつくる。 うーー寒い寒い。それにしても「レモンを一個だけ買う」というのはおかしなものだ。 袋に入れる必要もないのでそのまま持って出てきたのだが、 「左手にレモンを1個だけ持って歩いている男」というのはなんだかおかしいし、 かといってシャツの胸ポケットに入れてもおかしい。どうでもいいことで悩むのは幸せな日々の証拠。 なのかもしれないがホントにどうでもいいぞ。
(12:52)
ところで、「マニュアル世代」がさらにパワーアップしてタチが悪くなったものとして、 「検索エンジン世代」というのが考えられる (もうすでに現れているかもしれない)。

つまり、人生に関するすべてのことは検索で答えが出る、という信仰および態度をもった人間。 かれらの信仰対象はgoogle様だ (つーーか、もうすでにいるじゃん! こんなの)。

そして、それをマニュアル世代の連中が「あんな奴らがいるようでは世の中もうダメだ」となげく世の中。 諸行無常。いや人間の適応力ってのはすばらしいね。

(13:26)
おととい書いたことがまさにアレだ。

ハリウッドがコンピュータを設計する時代

(14:00)
よーわからんが、ACL ふぉr OSX で共有ライブラリを使うには 拡張子の終端が .dylib でないといけないらしい。 これに気づくのに時間がかかったぜ、ちくしょうめ (OSX のライブラリの中には拡張子がないものもあるのだ)。 まあ ACL は使わないから、べつにいいんだけど。
ふぉr

Common Lisp (こもりす) でいいなと思った機能は、 「好きな shared object をロードして、インタプリタ上からそれを試せる」ということである。 なんかいじってみたいライブラリがあったら、いちいち C でテスト用コードを書く必要がない。 これは非常に便利といえる。 Python でも dl などを使えば一応できることはできるが、型の扱いがまともでないし、 C からのコールバックも使えない。これが CL の FFI (foreign function interface) では 型や構造体を定義できるし、ポインタや配列も渡せるし、返り値にもポインタが使える。そのうえ Lisp の関数を C からコールバックとして呼べたりもするので、ほぼ完全に C のインタフェイスとして 使うことができる (もちろん、そのぶん segfault の危険がつきまとうわけだけど)。 だから swig とか使わなくてもバインディングが簡単につくれてしまうのだ。 Python は glue 言語というわりには、このへんはいまいち弱いね。

(16:20)
「スパム王」って、なんだかウマそうな名前だやな。 いや、うまくない! うまくない! オレは spam はたいして好きじゃないんだ。

サムいのでそろろそ帰っちゃうおうかな。

(22:01)
追悼番組をやっていたので見ていたら、あの瞬間の映像をやってた。 新山もその瞬間を生で見てないので (大学でメール書いてたのだ)、 あんなことがあそこで起こったとは、信じがたい。

Aug 09 [Tue]


(18:13)
そもそも言語化できないものをどうして電子化できるんでしょうか?

…ところで (てくるで)、ニューヨークというのは日本人が思い描くような都会ではない…。 ここはさしずめ、世界各地から田舎をとってきて、それらを 1/100 ぐらいに圧縮し、 マンハッタンの中につめ込んだようなところ (てくる) である。 てくる

(18:15)
がらんとした、車のいないチュウシャ場 (= 注射) にハトが 20羽ぐらいとまっていた。 そいつらはアスファルトの割れ目にくちばしをつっこんで何やらつついているが、 あまりにもそれが地球的な光景に見えたので、オレはしばし足をとめて見入ってしまった・・・ (中略-後略)

さいきん、ここに現実世界っぽいことばかり書いていたので、 これからはしばし反省して現実っぽうことべけれくくくとぅぬすよう。ふ

(22:42)
しらふ・ヨッパ   (酒を飲んでいないのにヨッパらったのと同じような精神状態になった状態、 まあ新山はいつもそんなもんだが!)。

夕刻から lispnyc-meetingo. きょうはとくに発表もなかったので、 77丁目? だかにある、うぇすとさいど・ぶるわりーで 飲んでいた。といっても新山は今日は飲む気にもなれないので、 なんとなく水しか飲まず安上がり。

しばらくすると、明らかに日本人とおぼしき集団が入ってきたが、 ソソクサと出ていってしまった。彼らは一言もしゃべらなかったが、 明らかにかれらが中国人や韓国人でなく、(海外慣れしていない) 日本人であると確信できる。 それはかれらが場の空気を読もうとして必死になっているのがわかるからだ。 しかし日本ではこれは一種の「気取り」として見られるが、米国ではそもそも 読める空気というもの自体、存在していないので、 そんなの気にするだけ無駄、なのである。でも、ああいうタイプに限って、 日本に帰りゃ安心してデカいツラしてるんだろうな。 そしてどっかの掲示板に「空気嫁」とか書き込んでんのかもしれない。 ああいう人々が、すべての人に「空気を読むこと」を期待しているあの傲慢さがきらいだ (新山が慣れ合いを嫌いだというのもたぶん同じ理由)。 読める“空気”なんてものが存在するのは実は地球上でも日本ぐらいだろうと思う。 だからこのことを知らない人々は、海外に来ても自分たちが 空気を読めているかをつねに気にしてしまう。でもこれはほんらい 存在していない恐怖に怯えているようなものだ。 そして、こういうのは正直いってとっても幼稚。

に、見える。

あなたのことですよ。

オレか? オレのことか!?

それにひきかえ、セキネさんなんかもう完全に「空気読まない人」になってて、 この人が日本での学会に行ったりすると微妙に浮いてるんで、おもしれーーんだ、これが。 (もっともこの学会にはもとから浮いてる人が多いので、あまり目立たないケド)

きょうは例の wordseye (いまの名前失念) の人が来てたので、 「さいきんどうよ?」という話になり、新山は自然言語処理のインチキ性について またひとくさり不満をぶちまけていた (この人とは意見が一致しているのだ)。 しかしこの人の会社はほんとに面白いことをやりつつあると思う。 いいな。これはもしかすると世界でも類のないデータが集められるかもしれないぞ。

(00:01)
てくるで (ところで)、どうでもいいけど (どうでもいいけろ)、 オレは携帯電話も使ったことないが、MS Word も (OpenOffice の Word も) まだ使ったことないんだよな。米国でいまどきこんな奴はめづらしいと思う。

ところで (てくるで)、どうでもいいけろ、ほとんどの「○○的」って単語は たいてい「○○による」「○○っぽい」などといった表現に置き換えられると思うのだが、 「全面的」という単語はそれが不可能なことを発見した。 「全面っぽい」って何だろ? まあどうでもよろ (シイ) けど。(シイ) (シイ)

きょうは、一日ずすしくてよござんした。オフィスは激寒。

(00:43)
財団法人「正しい人びと」の提供でお送りいたしました。 (いたしまーす (ドン))

Aug 08 [Mon]


(09:30)
これでもう Peter Jennings のニュースを見る機会はなくなったのか…。

新山がこのヒトを最初に見たのは米国に来てからで、忘れもしないあの 9.11 テロの日は ずーーっと出づっぱりでやっていた。テロもテロだけど新山はこのキャスターにむしろ 驚いていて「このおっさん、よくもつよなあ」と思ったことを覚えている。 ABC のサイトによると「彼は 25時間ぶっつづけで生放送した唯一のキャスターだった」と書かれている。 Wikipedia によると 9.11 のときは 60時間ぐらい出ていたそうだが、このころから (一度は禁煙した) タバコをまた吸いだしたらしい。 これで今回の肺ガンになったのね。 彼の政治的な姿勢についてはよく知らないが、ひたすら現場主義で体力勝負でおまけに冷静、 というこのおじさんはオレにとっては典型的な「すごいアメリカ人」に見えた。 しかもカッコいい。 ファン多そう。 当時うちにはまだケーブルがなかったため、Owen の TV で、おまけに WTC が壊れたせいで 映るチャンネルは CBS と ABC ぐらいだった。

どうでもいいが、ABC でほかに有名なキャスターっつったら Barbara Walters がいるけど、 さいしょに 20/20 を見たとき、ああ NHK の「クローズアップ現代」はこれのパクリだな、 と思った人はたぶんオレ以外にもいるはずだ。

新山は「死ぬ直前まで仕事をしている」というのにあこがれる傾向がつよい。 これが労働の賛美で悪趣味だと言われようが、何と言われようがオレはそういう生き方が好きなのだからしょうがない。 「すでにアガってしまって悠々自適な生活」というのにちっとも興味をもてないのである。 これがあと 30年たってもまだこう思ってるかどうか知らないけど、できればそうありたいもんだ。

(22:22)
ここ 2、3日、あまり日記を書きたくならない。 とくに問題があるわけでもないのだが、おかしなこと。
(01:27)
ひとつの考え。“かれら”のような人々は、より巨大なもの、 より中心にあるもの、あるいはより明るいもののほうへ向かって 「到達した」り、あるいはそれらを「統合した」り「創出した」りするのが好きなのかもしれない。 だが、オレはそのような暴力的なやり方がきらいだ。 中心よりはむしろ周縁のほうがよく、統合よりはむしろ分裂を積極的に支援したいと考える。 そういう意味では、…
Zzz

(以下 2〜650行略)

(02:04)
"Trusted Computing" の意味について。いままで 「これは一体誰が誰を trust しているんだ?」と思っていたが、 きょう気づいた (やっと!!)。 これは「ユーザが信頼できる」機械やソフトウェアという意味ではなく、 「音楽屋 (あるいは映画屋) が Microsoft や Dell などのメーカーを信頼できる」 システムという意味だと考えれば納得がいく。なあんだ、こんなことに 気づかなかったなんて、オレもまだまだ言語探索者としての経験が足りないな…。

てくるで、darl mcbride が日本語を話すとは知らなかった。

Aug 07 [Sun]


(13:23)
  1. あー、またそろそろ花粉の磁気なんじゃないの? 广广。
  2. 大きいフライパンの欠点は、格好いい目玉焼きがつくれないことだ。
  3. もしかして、オレはまたハンカチなくしたのか??

Aug 06 [Sat]


(15:48)
じだらっくな生活っ。 きょーは激寝坊して選択して買い物してるうちに牛(モウ)こんな時間になっちまった。

まあ日が暮れるのは 8時ごろなんだけれどね。

某所の地下鉄車内にて。

Aug 05 [Fri]


(11:37)
激あついね。そしてそして激さむい。汗だくでビルに入ってオフィスの机をさわると、
「つべたっ!」というようなヒエ方なのであ。
りまするよもうこれはこれはまいったねまっっっ。
っっっ  っ</centre>
たく</dev>

というか、新山はキーボードをだいぶ前のほうに置くのが好きなのだが (たぶん 50cm ぐらいはあいていると思う)、そこまで机に腕をのせるために いつも一の腕 (?) がほとんど机に接しているのだ。だから机が つめたいとこれはこれはオレにとっては死活問題である。死活問題だる。 いいなおし。→→〉・→〉〉〉→→→→・→→→〉・・・

てくるで、知らなかったのだけど iPod は日本ではホントに売れているらしい。 なんで??

(11:56)
なんだかこのジャビー (java で書かれたプログラモ) がメモリイ・リヰクを起こしてイるようなんですけど。 ぬんとか (=なんとか) なりませんかね?

ふと気づいたが、「ラーメンマン」と「リーマン面」は似ている。 「○ー○ん○ん」という語は日本語では以外と特徴的で、頭に残りやすいんではないだろうか。

ということで、いつもこういうときに (だけ) 使う ipadic にご登場いただきました:

$ cat /src/nlp/ipadic-2.7.0/Noun*.dic | tr -d '()' | jperl -ane 'print "@F[4] @F[9] \n" if (@F[9]=~/^.ー.ン.ン$/);'
有神論 ユーシンロン
溶連菌 ヨーレンキン
光電管 コーデンカン
公民館 コーミンカン
等深線 トーシンセン
後見人 コーケンニン
B4判 ビーヨンバン
通信員 ツーシンイン
同心円 ドーシンエン
総本山 ソーホンザン
一般 ゾーリンゲン
一般 アーリントン
日本語の grep はうまく動かなかったので jperl 使用。 はっきりいって、こういうときの perl の使いやすさは Python よりはるかにまさっていると思う。 1行以上のコードを書く気はないけど。
(12:54)
SSH のどこが安全なのか / どこが安全でないのか、をきちんと説明している文書が少なすぎると感じる。 Web 上での説明はほとんどないし (英語でも!)、書籍にもない。 説明すべき点をしぼると以下のようになる:
(14:13)
ふんげあ。いま検査してみたら、 なんだか文書をいっこ処理するごとに 7MBytes ずつプロセスの メモリがふくれあがっていくらしい。 なにを握ってやがるんだチクショウ。 おまけに、Java 用のメモリリーク検出ツールってほとんど商用。 くそったれ。

…つーことでまた久しぶりに Java のコオドをいじっていたら、 すぐに原因判明。つまりファイルを全部いちど Vector に読み込もうとしているのが原因だ。 各文書は独立してるんだから、いっこずつやれば十分なのに。 しかし直すのがめんどくさい。「くそーーーなんで generators が使えねえんだ!」 などとひとりムカつく午後。ああ、そろそろ腹へっあ。

(15:27)
Guido's Bias からもはや ll-discuss はすっかり盛況になってしまい とてもここに抄訳を書けるほどの議論ではなくなった (新山はこの 2、3日は忙しくて、全部に目を通すこともできなかった)。 ところで、今日またおもしろいトピックが出た。モジュールシステムについて。 「Common Lisp の package は sucks だ、しかし Java のような モジュール階層とファイルシステムの階層を直接結びつけるのはもっと間違っている」 といっている人がいる。彼によれば、ファイルシステム型のモジュールシステムだと、 あるモジュールの異なる実装に対して同じ名前をつけて、場合によって 切り換えることができないからだという。しかしそれは本当か? それは むしろモジュールに「エイリアス」のようなものをつけるのが妥当な解決策であって、 個別の各モジュールにはやはり独立した名前が必要なように思える。

てくるでぜんぜん話は変わるが、チョコレートの Godiva というのは peeping Tom に覗かれた Lady Godiva のことだったらしい。 あれってイギリスの話かと思ってたが、ベルギーだったの?

(22:53)

20 の回答シリーヅ: (この回答は、どんな質問に対してもご利用いただけます)

  1. いいえ。
  2. はい。
  3. 中学生のころでした。
  4. はい。
  5. わかりません。
  6. 残念でした、正解は 4番です。
  7. 本当です。
  8. 大阪。
  9. ジャンプは読んでいなかったので知りません。
  10. いいえ。
  11. 150日以上です。
  12. ときどき忘れています。
  13. 黒か金色。
  14. 質問の意味がよくわかりません。
  15. 1 か 2。
  16. しません。
  17. 53回。
  18. 犯人が右側のドアからまわりこんだから。
  19. 怒る。ケトばす。
  20. そうですか?

Aug 04 [Thu]


(09:21)
まっくらな中を、「すべり台」のようなもので地下鉄の駅まですべり落ちていく夢を見た。

それがあまりに楽しかったんで、(夢の中で) もう一度やったら どっかのオジサンに怒られた。

これは一体なにを暗喩してうるのだらうか??

(11:22)
どうでもいいけど、自宅の IPアドレスから google のトップページを見たときには何も書かれていないのに、 大学から google のトップページを見ると「卒業したならウチへこい! (Graduating? Come work with us.)」 というメッセージが現れていることに気がついた。google 必死だな。

これはあくまでウワサだが、googleの給料はそんなによくはないという話である (もっとも人によって違うだろうけど)。ようするに、やつらは会社へのプライドで働いているんだろ? あとは飯がタダらしい。MS も似たようなことをしていると聞いた。オタクはそういうもので釣れるんだから単純ね。 まあ、オレにはどのみち関係ないが。

(17:43)
アップタウンで打ち合わせ。やっぱ英語で 5時間も技術的な話題につきあうのは疲れる。 もう最後のほうになると集中力が低下して相手のいってることがよくわからん (もとからわからない、という説もあるが)。日本語でさえ技術的なことを説明するのは むずかしいのにね。英語だとなおさら。

今日もこれまた激暑いよ。

どうでもいいけろ、ジョブズはわざわざクソ暑い中東京まで来て何を言ってったんだろう? ヤツは内心では日本なんてたぶん大キライだろうと思うのだが (そういう顔をしている)、 わざわざ我慢して愛想ふりまいてるとしたら笑える。新山はちょうど iPod が発売されたのと同時期に こっちに来たので、そもそもアレが日本でどれくらい売れているのか知らない。 NY ではときどき地下鉄に乗ると周囲の 4人ぐらいが iPod を使っているときがあるが、 日本じゃ携帯電話で音楽が再生できるっつーのに、わざわざあんなデカいの買うかね? 前にナカガワさんがカーステレヨにつないで使ってるのを見たが、ああいう使い道しかないと思う。

(19:32)
世の中の異常性というものがすべてこの一冊の本に!

やべえ、そろそろ図書館の本返さなきゃ。樋口一は結局途中で挫折しました。

(20:38)
てくるで世界初ののクロンが韓国産だというのはかなり狙ってりと思う。 これは韓国だからこそできた離れ業であって、 もしこれが長野県人だったらせいぜいイナゴザザムシ程度のクローンで、 たいしてインパクトがないところであった。ちなみにオレだったら絶対野沢菜にする。 あるいはナスあざみ切り干し大根

google://野沢菜 茄子 あざみ 切り干し大根/ (7)

(22:01)
あー。ふと思ったのだが、現在の traiss では "style=" 属性を編集許可しているが、 これはもしかして脆弱なのではないか。もしかすると @importurl() でおかしな URL をとり込めるのでは? よくわからんが、とりあえず禁止にしておこう。 「明らかに必要なもの以外は、余計なもんをつけない」という方針に 従ってなかったオレが悪かった。

てくるで、slsdhtot (わざろ) の連中の日本好きはなんか見ていてイライラする。 お前らはどーせ Inuyasha とか見て秋葉原行ってああいうのが日本だと思ってんだろ? 共和党バリバリのアメリカンは嫌いだが、かといってこういう連中にも腹が立つ。 かくいう新山もまだアメリカの奥地 (= 真のド田舎) を見たことがないので アメリカンを理解しているとは正直なところ (= てくる) まったくいえない。 もしかすると田舎に行ったら実はアメリカが好きになるかもしれない。 だけど、もう、オレには十分好きな「田舎」があるのでこれ以上はケッコウだ。 欲張りは身を滅ぼすよ。ほんとに

Aug 03 [Wed]


(15:43)
ふぇーーーもう 4時だよ。外は激暑。36℃。

きょうは某所のオープンハウス (と呼べば呼べるようのもの) に行ってきたのである。 といっても、べつに新しい学校に行くわけじゃないのだけど、ある人々に会いにね…。 自分は研究テーマを変えようと画策しているので、なるべく早いうちから あれこれと知っておいたほうがいいと思って。それほど面白いものでもなかったが、 たしかに問題は存在しているということを知った。そしてオレはそういったことに (いまの研究よりも) やりがいを感じるということも。

とはいえ、学位取るまではいまのままでいい子にしてますよ。たぶん。 それに、逆説的ではあるが、物事それほどスムーズに進むとも思えない。 まあ、気長にやるさ。

(16:06)
google://ハッサム中央/ (0件)

日本語ウイソドウズのデフォルト用紙設定はすくなくとも 3箇所ある。 A4 をデフォルトで Letter 変えるには、これらすべてを変更しなければならない。 くそったれ。

(19:26)
かへりますわよ、广广。(これは中国語ではない)
(23:22)
ひじょうに、あつい。まだ。

てくるで

アレの続きはどうなったのか、とご疑問のみなさまへ:

もっか収録中でござ。

(01:08)
なっぷ なっぷ
すった すった
なっぷ
すたーーー

もう寝るます。オヤスミマシタ

Aug 02 [Tue]


(11:25)
ウギャーーーー!! げき寝坊!!!

おまけに昨夜しかけといた実験はエラーで止まってるし…もう最悪。

(16:22)
きょうはネボったので自分を罰するためにマックを食おうかと思いしが、 なんとなくドサにする。さいきん、あまり食してなかったので。 きょうもおじさんは暑い中にしっかりといた。
「へーい兄ちゃんどうだい調子は? マサラにするかパンディチェリにするか?」
パンディチェリというのは野菜が入っている dosa であるが、今日はシンプルな masala でいいや。
「じゃあ、マサラで」
「辛さは? light, medium or hot?」
「ミディアムで」
「最近どうだよそっちは? 忙しいのか?」
「そうでもないね」
「オレはここんとこいそがしいねえ、ああきょうはクソ暑いなもう 91度だよ、 ところでお前は Stern の学生か?」
Stern というのは NYU の MBA 向けビジネススクールである。日本人留学生多し。
「いやオレは CS だ。別の学科だ」
「このまえお前を Stern の前で見たんだよ、だからそこかと思って。 Stern の学生はベジタリアンが多いからな。いいお客さんだよ。 CS ってどこのビルだ?」
「2つに分かれてるんだ…いっこは Stern のとなりと、もういっこは Broadway 沿いのビルだよ」
「へえそう。…はいできた、あと他になんかいるか、サモーサとか?」
「じゃあサモーサいっこもらうよ」
「ソースはなんにする? sweet sauce か green sauce か」
「sweet のほうで」
Samosa につけてくれるソースは 2種類あって、sweet sauce というのは真っ赤な甘酸っぱいソースである。 Green sauce のほうは真緑色をしたやつで辛い。しめて計 5ドル。

そのあとオフィスに帰って食っていたら、汗がでるので、 食ったあとに急激に身体が冷えて激サブい。 緑茶をのんでフーフーする。そのあとまたもや実験スクリプトを走らせて、 アホなバグをいっこつぶし、Fedora の設定をやらされ、帰ってきたら へれんから電話がかかってきてパーザがどうしたこうした…という話。 そのあとトイレに行ったら、ドアがペンキぬりたてで手が真っ白になった。 ちゃんと注意書きしてくれよ!

(17:29)
IE はダメだから Firefox をすすめる、という論調はもう聞きあきたぜ、人間。、
(23:11)
ああ自分はこの街で「暮らして」いるんだな、と思うときはいくつかある。 顔を覚えてもらっている店でなにげない会話をするとき、 知り合いにコーヒー屋で会ったとき、地下鉄の駅で 最短距離の出口を選んでいるときなどである。 べつにそれはニューヨークでなくてもかまわない。 しかしこういうことを心地よく感じだした時点で、 オレも「都会化」したものだな、と思う。

Aug 01 [Mon]


(09:13)
黒字に青い文字ってのは「読むな!」ってことですかね?
(09:27)
「ナス漬けは鉄に反応して色合いが良くなる」 だって。ワオ!! これぞ「レール漬」!!
(11:39)
なぜみんな fedora や redhat をインストルーしたがるのか理解できない。 エンドユーザ向けなら Ubuntu とかのほうがよさそうだし、 まじめに使いたいなら Gentoo とか FreeBSD のほうがいいよね。 ようするに中途半端なんだよ。
(13:17)
ふとなにげなくデリで買った一品がメチャクチャカライ味付け。あーーー、カラかった。

さて、こないだまで来ていた図情大の学生はぶじ帰っていった (はず)。 いつもいつもセキネさんが呼んでくるビジターの学生には 女の子がやたらと多いのだが、これはなんでなのか、という疑問が ある方より呈される。そういわれるとたしかに女の子が来る率は高い。 なんででしょうね? 今回の 2人をはじめ、 その前の長岡の学生さんも女 2人組だったし、さらにその前は慶應からいっぱい来てたよね…。 オレとしては毎度毎度、人が変わるので疲れるのだが (どうせオレはただの「雑用君」扱いだし)、 また来学期も誰かくるのかなあ。 自然言語処理は、情報系の中では女性率が高いほうだと思うが、 それでもこれはちょっと多すぎだ。新山は セキネさんがわざと女の子ばっかり呼んでるんではないかという疑いを もっている。たぶん毎回日本に行ったときに人買いしてんだろうね。 そういえば今回きた図情大の人々は例のスーパープログラマの方のところにおられるらしい。 まあ「図情大で自然言語処理やってる」って聞いたときからなんとなくイヤな予感はしていたが、 まったくこの業界せますぎて疲れる。新山は「どこそこの誰々がどうした」という このテの噂話がほんっとに嫌なので、できるだけそういう話題は避けているのだが (こういうのを聞くと、人間は RFID よりも猛烈な勢いでトラッキングされているということがわかり、 がっかりするから)、つい聞いてしまって脱力。自分は誰からも気づかれないように トンズラしようと心に誓うのであった。

話は戻るが留学の話。べつにセキネさんがつれてくる人々に限らず、 日本からの留学生には、どういうわけか女性がヒジョーに多い。 NYU には日本人留学生の集まりのようなものがあるが (新山はほとんど参加したことがないが、 ML だけはとっている)、これまた女の人が多いのだ。 これは NYU に限ったことではないと思うが、なんで男は留学しないのだろう。 台湾や中国からは男も女も沢山来ているから、これは日本人だけに見られる傾向だ。 新山はハナっから留学を希望していたクチなので「留学したがらない男」の 気分は理解できないが、このことは日本人男性のもつ保守性や ヘンなプライド等々と関係があるのだろうか。ナゾね。

(14:22)
いやーーさっきぶつけた所が内出血してなくてよかった、よかった。
(16:38)
きょうはくつしたを持ってくるのを忘れたために足元が激サブかった。 明日への todo: くつしたを持ってくること、 それと浅漬をつけること、etc. etc.

きょうは何をやったんだっけ? ああそうだ。 webstemmer のスコアリング関数がなんかオレの意図したのと違った動きをしているようなんで、 こいつをデバッグせにゃ。ああこれは「今日やったこと」じゃない。これも明日への todo だ。 しかし今日中に終わらせる予定だったのにくっそーー。

あと。

テスト用のプログラムをいくつか作ってもってくこと。明日までに必要か?

あるものを C(++) で書き直すということは、それをブラックボックス化するということに等しい。 ほわいとぼっくす化

(17:09)
でばっぐ、終了。 しかし、改めて webstemmer のコードをみてみたがなんだこの汚さは。 自分でもガッカリするほどの汚さだ。アルゴリズムが複雑であることは言い訳にならない。 つうか、クラス(=構造体) を使わずに tuple をつかってるのがよくなき。 そんでタプル内の特定の要素を x[2] とかで指定してるのがさらによくなき。 これじゃー (caddr x) とかってやってんのとおんなしだよ。 でもこれメンテする価値あるのかなああ。誰かオレの他に使ってる人いるんならやるけど、 今のところ誰もいなそうだ。

サムいので早帰る。まだオモテは地獄のごとき明るさだ (ここでべられている「地獄」とはサルトルの言及するそれである、以下同文)。 なんかだ微妙にテンションが不断とくらべて高いような気がするが。 それは寒さのための禁断賞状であろう???

(21:59)
「にぼし」と「いりこ」は名前が違う以外に何かちがいがあるの
か。それは「ラーメン」と「中華そば」の違いのようなものであるの
か。あるいは「しらたき」と「意図こんにゃく」のような違いのものであるの
か。ちなみに、新山はラーメンよりも中華そばよりも 「支那そば」って言い方のほうが好きだ。発音してみるとわかる。 「しなそば」。なんか微妙に「しめさば」と似ているような気もするが気にすべからず。 中国の呼称としても 「支那」のほうが響きがよくって好きである。 中国人は支那という呼び名が気に入らないそうだが、やつらに 「いやいやシナって呼称は実はカッコいいんだぜ」といってあげるのが これからの日中友好にとって不可欠であると思はるる。 といっても、新山は「ヤマト」がカッコいい呼称とは思えないので、 日本の呼称は「日出処」でいいです。
Yusuke Shinyama