2003年 2月 (3)。

^ back < 2月 (2) へ。

Last Modified: Sat Mar 1 09:44:43 EST 2003 (03/01, 23:44 JST)


Feb 28 [Fri]

(07:58)
なぜか昨日はこのあとたとえようもないほど眠くなりけり、 ベッドに横になったらそのまま眠ってしまった。歯もみがかずに。 なんだこりゃ。
(09:30)
そういえば昨日書けなかったことを思い出した。 自分は「心中」にあこがれているのだと思う。 「心中」を和英辞書で引くと double suicide とか joint suicide with a woman とか書かれているが、ここでいう心中とはもっと広い定義をさし、 そこには死ぬまではいかなくとも「集団でダメになる」というものも含まれる。 それにしても「複数の人間が同意して自殺する」というのは、 まともに考えてみるとほとんどただのバカに見えるに違いない。 世界広しといえども心中を美しいと思うのは日本人ぐらいじゃなかろうか。 にもかかわらず、やはり自分は心中にあこがれているようだ。 よくわからないなあこれは…。 日本特有の宗教といえるのかもしれない。

でも、たしかバンジージャンプの起源というのは 「男女が飛び降り心中するんだけど、じつは女には別な男がいて、 女は心中したように見せかけて足にロープをつけていて生きのびた」 という言い伝えじゃなかったっけ。とすると、あそこの国 (どこだかは忘れた) では 心中するのかなあ。しかしこんな言い伝えが残っているということは、 やっぱ「心中なんてバカらしいからやめとき (あるいは、男ってバカ)」という教訓があるような気がする。 ああ、そういやーむかし UFO が来るとかいって集団自殺してたアホな新興宗教もいましたね。 でもこういうのはどれもちょっと違うんだよなあ。太平洋戦争末期の日本なんかでは ほんとうに「日本全体で心中」な雰囲気だったのだろうが、新山はべつに ほんとに死にたいわけではないのだ…。

こんなことを考えたのは、きのう Owen と話したときに、 祖国に対する考え方というものが彼とオレでは違うということに 気づいたからである。たとえば Owen は次の総統選挙には投票したいし、 台湾をよくしたいという。でも新山の目的はそういうのとはちょっと違うのだ。 べつに自分の国がよくなるか悪くなるかはどうでもいい (まあ悪くなるよりはよくなったほうがいいけれど)。 けど、たとえばこの前の 9.11 テロみたいな事件がもし東京であったとしたら、 自分はその場 (すくなくとも日本国内) にいなければならないと思う。 なぜだかそう思う。まあそれで死んだら運が悪かったわけだが、 「離れていてよかった!」とは思わないのだ。なんでだろう? やはり一番近い概念が「心中」のような気がする。 あーもうなんだかドツボにはまりそうなのでやめとく。

(12:20)
またノドモターですよこれ。
(18:24)
ちょっと落ちこんだので Mercer St. Bookstore へ。 そしたら Psychology の棚に「Foundations of Psychohistory」という本があった! ギョギョギョ。これってアシモフの本の話だけじゃなかったの? でも中身は大したことなかったけど。そういえばクルーグマンが 「むかしは心理歴史学者になりたかった」といっていたことを思い出した。 他にも「Fantastic Invention by Nicola Tesla」なるこれまたアヤしい本を発見。 なんで自分はいつもこういう変なものばかり見つけるのだろう。 別にそういうのばっかり探しているわけじゃないのにな。
(20:56)
やべえ、トイレ行ってるあいだに書くこと忘れた。 ので、またあとで。。。
(21:08)
音楽はあなたを肯定してはくれませんよ。

自分を肯定できるのは自分だけです。

(22:39)
これは一体どういうことなんだろうか。 ちょっとふざけすぎではないだろうか。
yu@gi~[50047]$ ll /memo/cur/
total 384
-rw-r--r--    1 yusuke      62145 Jan 16 23:52 11.html
-rw-r--r--    1 yusuke      93779 Feb  1 12:33 12.html
-rw-r--r--    1 yusuke      54073 Feb 10 18:15 21.html
-rw-r--r--    1 yusuke      45677 Feb 19 14:55 22.html
-rw-r--r--    1 yusuke      42559 Feb 28 21:09 23.html
lrwxrwxrwx    1 yusuke          7 Feb 19 14:54 cur.html -> 23.html
drwxr-xr-x    5 yusuke       4096 Feb 18 22:48 img/
(23:33)
今月の日記を読み直してみて、いつのまにか「意味の通る文章」ばっかり 書いていることにがっかりする。来月からは以前のように意味が通らない文章を 書くように心がけよう。だいたいこのページには基本的には どうでもいいことしか書かないので、これはつまり「どうでもいいこと」が 次第に増えつつあるということか。 でもきょう気づいたことを書いておく。

これは今でこそほぼ脱却できたから書ける話なのだが、 新山は、米国に来るまではかなりの欧米コンプレックスだった。 こんなことを書くのは、日本メディアでの松井の報道を見ていて、 いまだにかなり多くの日本人がすさまじい欧米 (おもに米国) コンプレックスを持っているらしいとふと思ったからである。 しかも日本のマスコミはどういうわけか、このコンプレックスを めちゃくちゃ煽るような報道をしている。これにはなにか訳でもあるのか。 たとえば日本のニュースサイトなんかを見るともうどこも松井はニューヨークでは 超有名人、というように読めるのだが、実際にはぜんぜんそんなことないと思う。 むしろこっちのマスコミはマツイ本人よりも、かれに対する日本からの 「報道陣の異常さ」が珍しがられてるように見える。

で、この落差はなんなのだろうと思ったのだが、考えてみれば 日本のメディアというのはいつもこの手の報道が好きである。 いわゆる「日本人は海外でこんなに活躍しています」的なやつだ。 でもこれは実はコンプレックスの裏返しでしかない。 つまり自分たちはどっかダメだということをいつもずっと気に病んでて、 誰かにそれを否定してほしいわけね。で、米国でそれができたやつがいればなおさらよしと。

技術にもそれがいえる。むかし IPv6 関係とか Ruby 関係のページに 書いてあってうんざりしたのが (いまだったらこの手のやつは他に何があるのかなあ…いや、いまもそうなのか?)、 「この技術/言語は日本発信ですっ!」 というなんだかよくわからない力みかただ。なんかやるせないものを感じる。 これじゃ 2ちゃんねるなんかでよくバカにされてるウリナラマンセーな人の行動パターン (ほんとに韓国人がそういう気質なのかはこのさいどうでもいい) とまったく同じではないか。 たとえば、 Guido van Rossum がどこ出身かなんてオレは知らない (なんか名前からして米国人ではなさそうだが)。 でも「日本発祥ニダ!」という領土権を主張したくてたまらない人が たしかに存在していて、しかもそれが結構多いらしいということは驚きだ。 何かに煽られてるとしか思えない…とすると、思い当たるのは例の一群の 過剰な「日本がこんなに有名です」記事である。 日本のマスコミはますます日本人を煽って自意識過剰にし、結果的に コンプレックスを助長しているようにしか見えない。これは、何かの陰謀なのか?

そもそもこっちに来るまで知らなかったんだけど、 アメリカ人は日本のことなんて全然知らない。まったくといっていいほど知らないし、 おまけに興味もないようだ。「日本のモノが大人気!」とかいう報道は、 ありゃ一体誰がどこで見つけてくるんだろう? ほとんど大ウソに近い誇張だと思う。 日本人がアメリカのことをいつも意識しているのに比べると、この非対称性には すさまじいものがある。で、きょう思いついたのが、これってまさに 「有名人と一般人」の差だということ。つまりふつう一般人は有名人のことを知ってる。 そして有名人に声をかけられたとかいう程度で大騒ぎするのだが、 一方の有名人からしてみれば「あんた誰?」って世界である。 まさにアメリカから見た日本ってそんなかんじなのだ。日本での報道とは違って、 日本はアメリカにとっては圧倒的に「非有名人」で、ほとんどネズミみたいな扱いだ (別にあめりか人に人気の某ネズミではなくて、ふつうのねずみだ)。 つーかこいつらはほとんど日本を文明として認めてないのではないかとすら思える。 そりゃ工業製品はよくできてるが、彼らからすれば「なんかチョコマカした連中が 必死になんか作ってる」という感じだろう。アメリカ人にとっては意識すべき相手は ヨーロッパだけらしく (南米ももしかすると入るのかも)、 日本はほとんどケツを向けられっぱなしに見える。

ある意味、北朝鮮もたぶん日本と同じように 「有名人グループに注目されたい非有名人」なのだろう。 だから彼らのチョーハツは理解できるような気がする。 でもさあ、あすこは某おじさんのほとんど独断で動いてるような国だから 仕方ないとしても、日本人でそれと同レベルなのが多くて、しかも マスコミがそれを煽ってるってのは一体どういうわけよ? それとも、なにか見落してる要素があるのかなあ…。

(そういやーこないだの Linux Expo で、わざわざ JLA のブースに 「日本人が開発したRubyを使ってます」って挨拶にきた外人がいたんだって。 アホか…。いやいや、やっぱオープンソースの世界といえども国籍にはこだわらないとね!!)

結局、なにが言いたいのかよくわからん文章だが、 とりあえず「ネズミ扱いもべつに悪いもんじゃない (新山はネズミ好きだし)」ということである。 (←ネズミを馬鹿にする発言、許しがたい) あるいは日本へ帰ることの正当化。 つーか、新山は結局のところ、つねにこういう態度で生きているわけだな…なんて傲慢。

(Mar. 1 追記) きょうの newyork post をみたらマツイは一面トップ扱いだった。 まあやつは例外的に有名カモしれんが、それにしても日本マスコミがアメ国を意識しすぎなのは あいかわらずだと思う…やはりどっかでコントロールされてるとしか思えない。電波、電波!


Feb 27 [Thu]

(08:10)
けさは朝おきたらいきなり 「♪頭ボサボサ〜、ボサノヴァ〜、菩薩地蔵!」 というフレーズを思いついてしまい、ひとり布団の中で クックックッと笑っていた。笑い方をみればそいつの育ちがわかるそうな。 ちなみに新山の一番好きな笑い方は「グフフフフフフ!」というものだが、 こういう笑い方をする人をいまだにほとんどみたことがない。うr
(14:21)
お昼を買いに 8st. まで来たら、店に入る直前にカネをおろし忘れたので おろしがねを取りに結局、 La Guardia まで行くはめに。ほぼ正反対じゃねーか。 寒いからあんまり長い間出歩きたくないのだ。とほほ。 でもこの結果、かなり歩いてしまった。銀行を出たあと、これで また 8st. まで歩くのは負け犬的ではないか? と思い、 どこか途中のデリに寄ろうとしたがなんか知らんけど激混で やめとく。結局 8st. まで戻った。 その後おひるを食べたら早速たとえようもなくなるほど (飛ぶ鳥を落とす勢いで) 眠くなりましたです。もうだめです。もうだめ。もうです。

外を歩くときに気をつけてることは、寒いからといって 猫背で歩かない! ということである。しかし部屋に帰ってきて 端末をぶったたく (キーボードを打つことをこう呼ぶ) うちに、 フト気づいて窓にうつった自分の横姿をみると、すんげー猫背でとてもカッコ悪い。。。

(19:58)
そういえば Hoboken Museum で PATH の歴史の展示をやってるんだって。ふーん。行ってみようかな。 平日の開館時間は夕方5時からよる9時までというので帰りに寄れる。 今日はもうだめだけど。

ちなみにここ2、3日のあいだ作ってたJavaアプレットは これ。 やっぱ慣れない言語は疲れる。。

(21:29)
また新山の病気「授業ではおとなしいのに ML では饒舌」が出てきたようです。 これじゃドキュソとおんなしだよ。おんなし。しかし授業でも もっとバシバシと質問できたらなあと思うときはある。
(00:05)
帰ったら Owen から別れ話を切りだされた。まあ予期してたことですが…。 かれは 8月に正式に結婚するらしい。なので当然、ここも 8月にはひきはらうことになる。 ここにきた当初は新山が学生やるかどうかわからなかったので、 もしかするとかれのほうが長く滞在するかと思われたが、 つまり今度はオレが新しいルームメイトを探さにゃならんってことか。 んー、どうしよ。このさいオレも出て別の場所に住むという 選択肢もあるが、いずれにせよめんどくさい。 しかしもうそんなになるのか…。 時がたつのははやいねえ。
(00:29)
その後「で、ユウスケは Ph.D をとったあとどうするのか?」という話。 そんなのはまだまだ先の話だと思うけど…わからん。 今の時点ではなんとも言えない。もちろん新山の最終目標は、 前にも書いたように標準的な規格をもった一個の部品として 社会に組みこまれることである。だから希望としてはいずれ日本に帰るということになる… (つーか、これ言うとほとんどの人に悪いジョーダンだと思われるんだけど、 残念ながらきわめて真面目なのだった。) けど、これはひどく変な話だと思う。じゃあ Ph.D なんかもってて何の役に立つのか。 さっさと帰ればいいじゃん、日本に。 あんたの親もそれを望んでいるよ。親孝行をしない奴は悪いね。

(この後いろいろ書こうとしてみたが何も書けなかった、 どうやら自分で自分の掘った穴に落ちたらしい)


Feb 26 [Wed]

(08:56)
ぬくぬくと? ぬけぬけと?

ところで Python に慣れてしまった人が Java を使うときの注意点:

…ということですね。
(10:41)
また寒かッたよ今日も。
(11:16)
ぬるぽがでた。
(20:36)
なぜか TextEdit を入れると 1.4.0 の VM ではうまく動かないということが判明したが、 1.4.1 にすると動く。しかしこんなことがわかってもぜんぜん嬉しくないぞ。 このために多大な労力を費やしたのにぜんぜんペイしない。どうしてくれる。
(23:35)
もうネムくて氏にそうです。誰かたすけて。

暗黙は
すてきな迷路を通って
くる…。

(23:54)
こーめん、りべすと、らいざーそん、
こーめん、りべすと、らいざーそん、
こーめん、りべすと、らいざーそん、
(00:37)
よく見ると当たり前のことしか書いてませんね。

Feb 25 [Tue]

(08:08)
↑カッコ悪い。(明日の自分に対する感想)

Scan error: "Unbalanced parentheses", 9, 1

(09:53)
なんかしょっちゅうキーを打ちまちがえるなと思ったら、 キーボードの位置がすこしばかりズレていた。こんなことに気づかないとは! うnぬn。

Joyce が書くような小説を読むための (そしてそれだけのための) 支援ツールというものが もしコンピュータにあったらどんなものになるだろうかと考える。 たぶん、通常でない英単語を入力して、これは何と何の合成語である可能性数十%、 というような使いかたをするのだろうが、それってどうすりゃできるかな? いちばんてっとり早いのは、すべての英単語との LCS を計算してその割合を比較することだが、 これはすべての組み合わせを試さねばならないためにむちゃくちゃ時間がかかる。 ispell なんかでは対象となる単語は 1語だけだから速くできるんであって、 もしあれが複数 - 複数のマッチングだったらきっと終わらないだろう。 そうすると厳密なアルゴリズムはあきらめざるをえず、話はよりパターン認識っぽい 方向に向かう。たぶん特徴的な文字およびパターンを抽出してマッチさせるということに なるのだろうが、そんな研究やってる暇人 (失礼) はいるのかな??

(14:47)
きょうも faculty presentation。今日はおもに暗号グループの話だった。 新山は知らなかったが、nyu の暗号グループは じつは結構有名らしい。Michael も暗号やってるらしいし。 …でも、コンピュータの暗号ってじつはあんまり普及しないような気がする。 なぜなら他のセキュリティ問題と同じように暗号も基本的に 「結果がすぐには目に見えてこない部分の話」だからだ。 だいたい、いくら「どこそこの scheme で暗号化されてるから通信は安全です」といわれたって、 ブラウザにでっかい鍵マークが表示されたって、基本的に素人にとっては同じである。 何を言われても「信じるしかない」という状況。 人は基本的に、目に見えないものは信用してくれないし興味も持ってくれない。 個人的には、計算機科学のこういう部分はけっこうやばいと思う。 技術は一般の人々が監視できるような形で普及しなきゃいかんと思うし、 この手のセキュリティ話はかなり社会的に重要なのにもかかわらず、 問題が目に見えなすぎて軽視されてることが多い (じつはオレもあまり興味持てない)。 CG屋(あるいは音楽屋)とかインターフェイス屋(自然言語屋もこれに含まれる)ばっかりが 注目されるようじゃ世の中終わっている。何が悪いのか? ひとつは専門家がそういう啓蒙の 努力をほとんどしてないこと (プレゼン命の米国でさえこうなのだから、 ほかの国でどんな状況かは言わずもがな) だが、そもそも問題そのものが複雑すぎる。 これをなんとかする理論的な武器を提供できないことには、 計算機科学は終わってしまうような気がする (世界もそのとき一緒に終わらなきゃいいんだけど…)。

オープンソースは技術の監視という面では たいして解決にならないと思う (レッシグせんせいが何といおうとも)。 たとえば MS のソフトウエアを全部オープンにしたとして、あんなもん誰が読むんだよ? (たとえば Mozilla のソースで main() が どこのディレクトリにあるか知ってる人はどれくらいいるのだろうか。) かりに誰かが自分のかわりに読んでくれたとして、どうやってそいつの供述を信用するのだろう。 というか、目に見えない技術に関する監視や証言というものがどれくらい 世間から真面目に扱われるのかわからない。たとえばどっかの信頼できる調査機関が 「うちの名誉にかけて言いますが、このカーネルは絶対安全です」とかいったとして… でも考えてみれゃそんなことはいまでも平気で起こっているじゃん…。原子炉とか飛行機とか。 結局、田舎で農業やってるのが一番いい、という結論に落ちつきそうな気がするんだけど。 つかれたのでまたあとで書く。

(21:48)
久しぶりに Java ってました。つかれました。 なんか Python になれすぎたため、コンストラクタに new をつけ忘れて エラーだらけ。もう帰る。

ところで appletviewer では動くのに mozilla だと動かねー。 ざけんな。j2sdk のアプレットのサンプルなのに…。

(23:07)
あんたじゃ
ないよ・・・。
(00:18)
ところで「この孫野郎!」 という言葉を検索しても 1件しかヒットしないじゃないか! しかも厳密には孫野郎じゃないし。 どうゆうことだ。
(00:33)
あーなんか家のマシンでやったらちゃんと動くし。もうやんなっちゃう。 同じ RedHat7.3 なのに。あっちは設定がおかしいのか。うまうま (←意味不明な擬態語を使ってみる)
(01:56)
あんま原稿進まなかった…。
研究日誌
きのうここに書いたことをもうすこし詳しくして、 だいたいにまとめる。Ralph に渡すと「oh, boy, こんなに長いレポートを書くなんて偉いね、you deserve three cookies!」 だって (かれはいつもミーティングのときにいつも必ずお菓子をもってくる)。 こういうお茶目な先生は結構好きである。ちなみにタナカ先生もお茶目であったが、 あっちは 天然 だったのに対して Ralph はちゃんと狙うときは狙っているところが違う…。 ちなみにプレゼンから帰ってくるとまだミーティングは やっていたが、着いた瞬間に終わった。名詞の peculiarness の話は セキネさんにけっこーウケた。もうすこしやってみれとのこと。

Feb 24 [Mon]

(09:16)
朝っぱらからトイレを20分も占拠されるとかなりむかつく。
(12:26)
きょうの colloquia は overlay network についてだった。どうやって IP が multicast されるかのアルゴリズム的な説明は結局よくわからんかったが、 結構おもしろい。ようするに router をすべて改造するんじゃなく、 ところどころで改造して application level の末端ノードが中継点での administrative control をもてるようにするという話。 この手のやつはセキュリティがからんでくると大変だろうな。

こういう、自分の専門とあまり関係ないような分野で それなりの人がきて話を聞かされるというのは 日本の大学ではあまりない経験だが、こういうのは もっとやってもいいと思う。というか、いろんな人が来るのは 土地柄のためかもしれない。こういうときに都会って便利だよな〜。

でも、遅刻しないこと。

(13:58)
spinach!!
(15:25)
…ニワトリ。
…卵。
…ニワトリ。
…卵。
…ニワトリ。
…玉子。
…ニワトリ。
…玉子?
…ニワトリ。
…王子!!
…ニワトリ。
…ニワトリ。
…卵。
……卵!!!!!!!

お。これは神だ。 神はこのようなところにおられる。きたなき所へようこそ。

(19:02)
そういやー今日は買い物ついでに St. Mark によって Ulysses をめくってみたが、ほとんど読めない。でもオレは Finnegans Wake のほうが ヘンで好きだなのけどな。まあこっちは構文解析さえできないわけですが。 オレにはね。

腹へったので帰ろー

(19:58)
帰ってきた。コメがおもかった。明治の板チョコを発見し衝動買い。 $1.49 + 税。安くないですねえ、あいかわらず。。。

ちなみに新山は「チョコレートは明治、ヨーグルトは小岩井」という 頑固なポリシーをもっております。た。がしかしそれはこちらへ来てからもろくも崩れ落ちた。 つーか、スーパーとかで売ってる Danon とか Columbo とか、うまくないんですが。。。 そういやーブルガリア出身の彼は元気かなあ。しかし明治、チョコレートはいいが、 ブルガリアヨーグルトは食えたもんじゃないよね。だいたいなんであんなに 酸っぱいのですか? あれじゃまるで (検閲済)。(検閲済)。(以下すべて検閲)。

さて、電車の中で首すじに「生現」という刺青をしてる黒人がいたのだが、 またもや意味が不明的。現生ならまだわかるんだけど。 あと朝生 (あさうまれ) とか、黒生 (くろお) とかならば。 "life appears" という意味だろうか? それとも "live emergency" という意味なんだろうか。 まあどっちでも意味不明的だけど。 確固-意味不明-国歌。こぇrgぁワかLやつはハン端っxtucci.

google://生現/ (971件)

研究日誌

TODO:

明日はまたミーティングに出れないので報告資料かかねば。その原料。そしてそれ:

やったこと:

やること TODO:

で、類似表現抽出のなかでパラメータとゆーか、 調節可能な部分というのは結局どこなのかをまとめた:

  1. entity retreival。 これはその後のすべてにわたって影響する。
  2. article レベルのペア抽出。 これは entity さえ出てしまえばあまりもうやることないような。
  3. sentence レベルのペア抽出。 これももうだいたいアレだけど、subsumed な文をどうやって みつけるかという点が問題になる。
  4. phrase boundery の認識。
  5. paraphrasing の制約。
  6. postprocessing?

そして、言語 (英語) の変化。ああこれはもう dsymni.


Feb 23 [Sun]

(10:34)
pyone へのリンク貼ったのはぼくじゃないですよ。もう。

などとこんなところでいちいち説明するのは非常にカッコわるすぎてもう氏にたい。

(12:47)
きょうもなんか天気わるいなあ。おまけにふぉぎー。
(13:53)
なぜか「VC++ 用に書かれたプログラムを MinGW でコンパイルする」という作業に没頭しはじめ、 いま MinGW クロスコンパイル用 gcc のコンパイルをしているが、 つくづくこんなバカデカいソフト (gcc のこと) を開発してるやつはすげーと思う。というか、キチガイ的。

UNIX ですこし大きめのプログラムを make した人ならだれでも、 あのなんだかわからんメッセージがだーーーっと流れるのを見てひるんだ経験があるのではないか。 ほとんどの人の感想は「あうーあうーなんか知らんけど動いてマスよこれ…」 というものだと思う。そしてワケわかんないところで止まったりして途方に暮れるのだ。

(思い出話) むかしは新山はあまり UNIX オタクではなかったので (オタクではあったが UNIX かぶれではなかったという意味、むしろマカーであった)、 まわりの人間が niyaniya しながら EmiClock (なつかし〜!) とかを インストールして「これは make 一発ですむので簡単だよ」とか言ってるのを 聞いても「へ〜 make ってなんじゃらホイ」というぐあいだった。 たしか xcruise をつくったあたりでは見よう見まねで Makefile の書き方を 覚えていたが (ちなみに当時いちばん慣れてた開発環境は Mac の THINK C だったのですよ! ああ、あのころは Symantec もウイルスワクチン屋なんかじゃなくて 先進的なソフトウエア企業だったのに…)、 人がつくった大規模なソフトウエアを自力でビルドした 経験はほとんどなかった。はじめて新山が自力でコンパイルした プログラムはなんだっけ。Lynx かなあ。これももう長い付き合いだな。 当時はまだ多くのプログラムが ./configure には対応しておらず、 Makefile を読んで書き換える方法が主流だった。さいしょにビルドしようとしたとき、 README だか INSTALL だかの英語を読むのに何時間もかかったことを覚えている。 無事コンパイル後の root で make install がこれまた緊張したこと! (当時まだ -n の存在を知らなかった) SunOS4 だ。当時はまだ学科のサーバすべてが NFS でつながっていた頃で、 たしか片山研で動いている Lynx の動作を参考にしたんだよ (その後 curses と端末と termcap の互換性問題にぶちあたり地獄を見ることになる)。 むかしは Solaris すげー嫌いだったんだよなー (自作のプログラムが 何もかもコンパイル通んなかなかったから)。いやーなつかしい… (遠い目)。もう話がわけわかんなくなりつつあるので終了。

gcc はとにかく沢山の人の手が入っていると思うけど、Stallman が書いたのは これのどれくらいの部分なんだろうか? いずれにせよもはや誰も全体像を 把握していないようなソフトだから、しかし、そういう「もはや手が出ない複雑さ」を あがめてはいけない。これは人災なのだ。

(17:04)
やっと動いた。とりあえず warning 出まくったが、まあいいや。 最初「リソースをコンパイルする必要がある」ということを 完全に忘れていて、「アレなんでダイアログが出ないんだ?」とか 首をかしげていた。windres のパーサはヘボすぎるので、Wine についてきた wrc → windres という過程を経る。いままで Windows ってアイコンとかの情報を どこにしまってるのか疑問だったんだけど、 .rsrc というセクションにデータが格納されるということも判明。 ResEdit を使ってた MacOS と比べるとへぼい仕組みだな。 Windows プログラマーの間ではこんなこと常識なんでしょうが…。 ちなみに、MFC しか使えない人間は「C++ でプログラミングできます」などと言ってわいけない。

しかし Linux 上で Windows 用の「ふつうのコード」が クロスコンパイルできるのはかなり便利だと思う。 まともな make が使えるしね。結局いくら VC++ の開発環境がいくら (見た目だけ) スゴそうに見えても、やってることは おなじみのツールで代用がきく程度のことなわけだ。なんだかとっても安心した。

で? それはいいのだが?? 問題は こんなことやってたらもう夕方じゃねーーーか!!! チクショーーーー!! ってことです。ああオレはまた週末をこんなことで。。。(以下略)

だが、すげー楽しかった、ということは認めなければならない。 どうせオレはオタクですよ! つーかきょうは外出るつもりで服着たのに、どうするよまったく (といっても家の中用のだぶだぶしたパンツのかわりにジーンズをはいたというだけの話だが)。

(19:28)
そして今ごろ大学に来てこれから研究すすめようとしてるオレは・・・バ・・・。

しかし日曜のこの時間なのに、なんでこんなに人いんの? なんかスドウさんもノヴァタさんもいるし。ほかにも結構人いるし。あやしきこと限りなし。 まあいいけどね。。。

(20:37)
そろそろ帰りたくなってきました。
(22:24)
いま家に着いたが、すげー寒くなってる。 もう道はパリパリと凍りはじめてて、風はつよいし、大変だった。 それにしてもきょうはなんであんなに人がいたんだろ… 新山をふくめて 9人はいたぞ、あのフロアに。 Dan が新しい学生を 2人つれてきて紹介しにきたのだが、 なんで日曜の夜なんだよ?? このヒトもかなり常人とは時間ズレてる人だし… (T氏を思い出させる)。 もうワケわからん、この大学。

ところで下に書いてある「忘れんな」という文字列をみて思いだした語句:

google://あげんな/ (2,660件)

(23:25)
ふーん、グラミーショー授賞ですか。 さいきん好みが世間と一致するようになってきたのかなあ、オレは。
研究日誌

TODO: (もう疲れてるんで適当に)


Feb 22 [Sat]

(09:29)
♪だれかが〜
♪どこかで〜
♪ニンニク使ってる〜

という歌をいま起きたら発作的に作詞・作曲した (本当は作曲までしたというのはウソである、でも♪マークさえつけときゃ なんとなく歌っているように見えるのだ)。 だって誰かが本当にどこかでニンニク使ってるん死者 (デスモノ)。 なぜか洗面所まで臭っている。 さて、けさはなんでこんなにテンション高いんだ? さっき目ざめた瞬間に思ったことは「ああそういえば -q オプションは いらねーや、とっちまおう」ということだった。 どうやら昨日今日は軽い躁状態にあるらしく、 きのうは 3時すぎまで起きていたのにきょうはふつうに目ざめるし、 まったくわけがわからん。そういえばきのうは統計の本を 読んでいたのにちっとも眠くならず大変だった。 べつに大変じゃないけど。ていへん。底辺? ヤッタネ!!!

(09:55)
「私はすべてを知っているほど若くはない」といったのは、 オスカー・ワイルドだったろうか。きっとそうだ。
(10:39)
なぜか Num Lock をオンにしていると不可解な現象馬鹿り起こる…なでだ。
(12:11)
せーん たーく 終了。
(13:10)
インターネットに接続されたサーバでセキュリティに 配慮しないのははっきりいって最低である。 で、新山のようにセキュリティに関心ない人間は djb のツールですませると。 Apache 使ってるひとはえらいよね〜。 オレには毎日 errata をチェックするよーな気力はとってもありやせん。
(15:20)
雨だ雨だあ、あめあめ〜〜〜 母さんが蛇の目ミシンを持ってお迎えにきてくれるよ。重いのに大変だね。 ああ、やめておくれよ、リッカーミシンはいやだよ。 だいたい(株)リッカーはもうすでに倒産したじゃないか! ずったっずったっずたずたっ。

てゆうか今日はオレ狂ってる (いつものこと)。 きょうは雨だから家の中にずっととじこめられていると気が狂うよ、 city へ出てみるるにもめんどくさいしなあ…。

(16:20)
上位互換 (upper compatible) と下位互換 (backward compatible) って どっちがどっちだかよくわかんないね。。。
(17:03)
なぜか Paul Graham による なぜオタクはもてないのか と その後の AskSlashdot、 12歳の自分に一言いうとしたら が、なぜかすげー生協。 このテの話題がウケるのはどこでも同じらしい。 でもこっちの国の人々は日本よりはるかに外見に気をつかわないので、 見た目だけで判断すると男はかなり多くがオタクみたいに見えるんだけど、 では彼らのいう nerd の定義とは何なのか? 新山は基本的に "Funny" のコメントがついたとこしか読まぬのだが (だって長いじゃん…)、 てきとうに読んだ限りだと「ひとりで部屋にとじこもって、スポーツとかをせずにコンピュータばっかり いじってる人間」がそうであるらしい。まあ新山はこの定義でもモロにあてはまるわけだが。 しかしヒーロー指向のこの国では、男子学生のやるカッコいいスポーツというと もっぱらフットボールなわけだから、あんなのやるくらいならたしかにオタクよばわり されてたほうがなんぼかマシだと思う。それよりも米国の人々をみていて気の毒だと思うのは、 かれらの「人生には勝ち負けがある」という強固な思い込みである。 ほかにもアイデンティティを確立しなければいけないとか、いろいろ脅迫観念がありそうだ。

これに対して新山をふくむ多くの日本人の理想はまったく逆だと思う。 こちらは最終的に「集合的な意識に同化する」ことを目標としている。つまり心中万歳。 世界をなめらかで平らなものにすること。欧米の個人主義が個性というものをどんどん 「とんがらせる」方向のものであるのに対し、新山が妄想しうる日本人の 完成形はこれとはまるで反対だ。自分の個性はどんどんすり減って丸くなり、 最終的には個というものは消滅する方向にむかう。まるで「1984」みたいだが、 この小説は「多様性は善」とかいうプロパガンダを信じこんでる欧米人だから 恐しく見えるんであって、まったく逆の価値観ではこれは恐しくもなんともない。 そういう世界は、退屈なのだろうか? いや、たぶんそのときは すでに「退屈である」という認識をおこなう主体すら残っていないわけだから 退屈とは呼べない。でも「1984」では実際にはビッグブラザーだけ特別扱いだから これって実はぜんぜん全体主義じゃないよな。だいたい、ほんとにそういう世界が 実現したら、もはや誰も自他の区別をせず、全員が集合的自我としての「we」という 人称のみを用いるので、ああいう独裁者というもの自身が存在しないのである。 北朝鮮とは違うのだ。でもこれって認知システムの崩壊だよな。 そういう状態で人間が生存しうるのかどうかはナゾである。 しかしまあ、“悟りを開く”というのはたぶんそういうことなんだろうよ。 残念ながら、ほとんどの人はそうなるまでには数十年程度の人生では とうてい間に合わないので、実際にはみんな個性的でも没個性的でもない 中途半端な状態で終わるわけだけど。しかしとりあえず、 そういう世界を妄想するだけはしておこうと思う。でもオレには無理だろうなあ、 いまだにこんな自己顕示欲が高い状態なんだから…。 つーか新山はむしろ自身の希望とは 逆の方向につっぱしってるような気がしてしょうがないのですが。 その理想に向かって、2ちゃんねるにはあくまで名無しで書き込んでるわけでしょうか??

(20:30)
「真の妄想」と「偽の妄想」 (仮想的妄想) を区別ること!
(23:40)
きのうの「魚語」が なかなか気にいってるので、ふとこれから日記はすべてそういう「ヘンな日本語」で書こうかと 思ったが、書く側にとっても書かれる側 (= 読む側) にとっても負担が大きすぎるのでやめた。 ところで新山は寡にして知らないが、 日本の作家でジョイスみたいなヘンテコな小説を書いてる人っているのかなあ。 いるけど有名にならないのかなあ。なんでだろ。ウケると思うのになあ。ああいうの好きなんだけど、 Joyce を読んでも (←嘘、「ページをめくっても」の間違い) 英語じゃ完全には感覚がわからないし…。 けど、なんでジョイスがあんなにスノッブに受けるのかは謎である (バロウズが受けるようなもんだろうか?)。 たとえば Ulysses なんか某本屋に貼ってあった「これは読んどけ! 20世紀ベスト文学作品 100選」リストの 1位だったが (ちなみに 2位は The Great Gatsby だった)、そんなにメチャメチャすごいものか??
(02:32)
MinGW っていいね。 cf. MinGW on Linux

Feb 21 [Fri]

(10:56)
ベーコンを焼いていたらまた火災報知器をならしてしまった。 まあ、ちゃんと動いてるってことを確認できたからいいじゃない。
(11:35)
Staten 島で爆発があったらしい。テロか? 空をみると煙モクモク。 ちなみに Regional なニュースでは NYTimes よりも Newsday のほうが 情報量が多くていい。これって Long Island の新聞らしいんだけど。
(12:40)
領事館からさっきの爆発に関するおしらせが届いた。なんかえらく早いね? 今回は。
(15:49)
うーむ・・・うまくいかねーー・・・・ なんかこうもっと単純でズバっときてバキっとくる方法はないもんだろうか? うるうる。

まあ、こんなこといってるようじゃ、「楽して儲けたい」とかいってる連中とおんなしだな。おんなし。

(23:50)
サカナを焼くときに、どうしても「…んむ。」という口をするくせがある。

なぜならそれはサカナが焼かれるときにだいたいそういう口をしているからで、 仏教徒としては動物を調理するのは罪であるから かならずそういうときはいつも焼く対象に対して感謝の意を表さなければならない (さすがに殺生の禁止までを徹底すると戒律がキビしすぎるので、 その規制は勝手に緩和することにしている)。 だからって魚ごときに感情移入するバカもあれだけど…。 だいたいヤツラはなにを考えてるかわかったものじゃないぜ? 文字どおり「住んでる世界が違う」んだから! たとえ魚が口を聞けたとしてもきっと彼らの日本語は (英語でもいいが) 半分も理解できないだろう。ライオンよりもずっと。 たぶん文法からしてすこしおかしいような気がする。 きっとこんなかんじだ。

「たいへん岩だったですよ? ことが海流ーにから…おまけにぬゆいだっても、 てんでおちらからへ往来へままならぬので…気じけっても、 そもがたゆってちゃしょうがないですから、メバレとげね、 追もってたら、ワル! っときて、おしたらもうのびてましたわ、パロッパロに」

ところでひらがなの「む」って字はなんか「む」って口のかんじじゃないですか?? 形が。

それにしても…。

まったく世間は戦争するかもしれないってのに、 こうして「魚言葉」を苦労して考えているバカも世の中にはいるというのは まあなんとも救いようがない政治。 そういえばチャペックの「山椒魚」を思い出したぞ (それは井伏鱒二だろ!)。

(00:19)
  1. DNS の綱引き
  2. DNS の股引き
(02:43)
いーかげん Perl で oneliner を書くのに疲れたので、 Python で quick & dirty な oneliner を やるためのスクリプト pyone とゆーのを作っていた…。 完成したがドキュメントがまだなのでとりあえず ソースだけ置いておこう。 おやすみ。
研究日誌
きょう午後はずっと数式をいじってデータがどう見えるかうだうだやってた。 peculiarity という考え。 sqrt($4+1)/$3. NE 辞書の半自動拡張に使えるか? いや、しかしこれは NE とはすこし違う。だいたい NE の辞書に使うにはタグが必要だ。 これはむしろある単語の意味の「ユニークさ = パラフレーズしづらさ」という尺度を測定しているのではないか? あるいは「類義語の少なさ」ともいえるかもしれない。 たとえばかなり rare な単語は類義語がすくないために、この値は大きい。 あとは専門用語とか…。でもこのデータが活用できるかどうかはまだわからない。

murder20/src のほう。どうやって正解をつくるか? 多少ルーズでも評価する方法はあるか? いま考えてるのは、「構造までは書かない」ということ。

cooccur をとるときにかんたんな照応解決をいれればもうすこし沢山とれる。 でも照応解決アルゴリズムの改良。やはり prefix/suffix は最低でも一致してないとだめ。 それから「松本容疑者」←「同容疑者」とはマッチできても、 「同容疑者」←「麻原容疑者」にはマッチできない。 これは一方向しか受けつけないように直すこと。 あと、あまりに長さの違う文字列はマッチさせちゃダメ!

共起する単語の分布を考えよ。 分布を仮定することによって、もしかして RIDF のような考えを使えないか?

あともういっこ何か考えたような気がするけど…。 (21:22) そうだそうだ、構文解析をどうやってゴマかすか? ということも考えねばなるめい。きょうもいいかげん KNP のミスには がっかりする。cabocha を使ってみようか。 でもそうすると文節を解析するルーチンを新たに作んなきゃならない。 だったらいっそのこと全部自分で…ということになってくる。 どうしよう? そもそも厳密に構文的な方法でとれるパラフレーズの数はあまり多くないのではないか? これについてはなんとしても正解を作らねばなるまい。 さらに「bunch of 名詞」な考え (これもいいかげんに名前をつけなきゃ、 自分でいってて恥づかしい) を使うのはいいアイデアのような気がする。 あとは?

てゆうかじつはコーパスにいちいちタグづけしなくても 曖昧じゃない文だけ正解に使えば…げふんげふん。 なんか見通しは明るいではないか! と思うことにしよう。


Feb 20 [Thu]

(09:32)
食事中に何を食ってるのか観察されるのは嫌いなのだが、 この感覚ってどうやって説明したらいいんだろうな。。。
(14:13)
ようやく宿題が終わった。でもギリギリではない。 授業は夕方からなので、だから余裕をカマしていられた訳で在るが。 ので、昼食。戦争に関するラクガキはこのところいっそう増加したように思える。 が、オレどうしてもあのサダムって悪人に見えないんだよなあ。 たぶんイヤな奴なんだろうけど、あの顔はみょうに愛敬あるように見えてしかたない。 まあ新山はもともとアラブ系の男の顔はわりとカッコよくて好きなわけだが、 たぶんあのヒゲがポイントだろう。それともサダムの印象をよくするために あのヒゲは計算しつくされているのだろうか。すごい技術だ。 …でもこんなことを書くとまた突然ウチの電話が不通になったりするぞ。こわいこわい。
(14:54)
DNS には 3つある。
  1. DNS の正引き。
  2. DNS の逆引き。
  3. DNS の万引き。
あ。置き引きも含めると 4つだ。でもこいつは 3文字におさまらないのでパス!
(19:03)
ここに書くこと忘れた。。

ああそうだ、授業中に教室の中をネズ公が走りまわっていたってこと。 NY にはとにかくネズミが多い。やつらはどこにでもいる。とくに地下鉄には大量にいる。

それだけのことだけど。

授業で Java を書かなければいけないので、めんどいなーと思っていたら Jython があったということを思いだす。 そんならこれを代わりに使えばよいのではないか。 でもいざ *.py をコンパイルしてみたら、おせーー。 しかし web ブラウザで動くというのは重要な利点である。

(21:27)

Jurafsky & Martin からおもしろい引用をみつけた。

しかし、「ある文章の確率」などという概念が、 この用語をいかように解釈してもまったく無益なものであるということは 認識されねばならない。
Noam Chomsky (1969, p. 57)

チームから言語学者がひとり減るたびに (音声認識システムの) 認識率が上がるんだよ。
Fred Jelinek (IBM 音声グループ, 1988)

まあ、心情的にはチョムスキーにやや同感ですがね。。。現実は厳しいのだ!

そういえばこの本にはほかにもいろいろとおもしろい引用が載っている。 なかでも、こんなのがあるのだが、これの原文はいったい何なんだろ?

words people
never use --
could be
only I
know them
Ishikawa Takuboku (1885-1912)
(23:31)
んまー゛。んまーんまーまーまーんんーまーま ?゛

ん゛ま゛゛ーーーー!!!

そう゛いえば明日はひさしぶりに゜ colloquia がないな。 久しふ゛゛りというほどのことでもないか゛?゛゛

うん゛。

TODO: 洗濯、税金。Form 1040NR。


Feb 19 [Wed]

(14:55)
ついに 3ファイル目に突入なのですが。。。
(16:48)
…で、けっきょく 2つともなんとかなりそう。 いつもノドモターなときに仕上げたほうが出来がよさそうに見えるのはなんででしょう?
(20:06)
さーてディスクの追加もおわったことだし帰るか。
(21:50)
日本食をたくさん買って帰る。 アジのひらきとか買っちゃったりして。Owen は魚焼くニオイが嫌いなのだが、 彼のいないあいだにこっそり調理することにしよう。 ネギを買ったら先っちょがクタっとなっていてぶらぶらしている。 しかもこいつはラップでくるまれているので、その動きがなんか自然じゃなく、 「うんうんうんうん」とつねにうなづいているように見えるのである。 結構おかしかった。この袋を持って電車に乗ると、前にすわってたババア (ムカついたのでこう呼ばせていただく) は新山がこの長ネギをぶらんぶらんさせているのが かなり気になるらしく、あきらかにイヤそうな顔をしていた。 しかし車内は混んでいるし他に場所もないのでしょうがない。 別に臭うわけでもないと思うんだが、見慣れない細長いモノが 不自然に首をふっているのでイヤなのだろう。まあ電車に草 (と彼らには見えるらしい) を 持って乗る人って少ないから。しかし新山だって人のことはあんまり言えないのかも しれないなあ、とちょっと思った。
(23:48)
いやー、遅かったけどすばらしい夕食でありました。 ちなみによく見たら鯵じゃなくて鯖の開きだったよ (←よく見れよ、アホ)。 スーパーに並んでるのを見て「おっ、ひらきだ、ひらきだ、しかも 2匹で $2 とはオトクだ」 と思ってろくすっぽ商品名も見ずに買ってきてしまうのがいけない。 それに英語でラベルは読みにくいし。でもだいたい鯵はもっと短いよね。 形みりゃわかるだろ…。で、グリルがないので換気扇を全開にして、 フライパンで焼いてたらまずいタイミングで Owen が帰ってきた。 しまった! と思ったのだが、かれは「おお? いいニオイじゃん!」という。 鯖を焼くのは OK らしい。で、「ひと口くわせろ」というので、 あげたら「うん、これ知ってる! うちのおふくろがよく食ってた」という。 「漢字で青い魚と書くやつだ (実は中国語でもそう書くのかは自信なし…)」 「字は知らない」「あっそ」 そのあと、ここぞとばかりにダイコンおろしが いかにすばらしいものであるかを力説する。ちなみに魚は結構しょっぱいので、 ご飯がすすむ。面白いのは Owen が鯖の頭を食いたがったことで、 聞けば「中国では魚は頭が一番ウマイと思われている」そうな。 へえ。どうせオレは食わないのであげるとうれしそうにしゃぶっていた。 鯖の頭って信仰の証明だっけ (そりゃ鰯だ、馬鹿)。 ちなみに日本では魚を食ったあとに背骨と頭しか残さないのが エレガントだと考えられている、と説明。でもブリとかは頭も 食うかもしれないけどね。知らない。新山はむかし母にだいぶ鍛えられたために いちおうそこそこにはましな食い方をすると思うが (父よりは)、 世の中にはほんとにキレーに頭と骨しか残んない人がいるからすてきだ。 尊敬すべき人間というのはそういう人だろう (いや、ふざけてるのではなく)。

しかしこっちに来てからいいことのひとつは、 サカナをずいぶんありがたがって食うようになったということだ。 第一あまり手に入らない。日本食料品店以外のスーパーで売っている鮭とかは 塩づけにしていないから、焼くとかなりナマぐさいし。 それに焼魚を食うのは何か仏教的美意識のようなものを感じる。大げさか。 肉ばっか食ってる連中は成人病で氏にやがれ。

(01:00)
いやな話を聞いた。うちのアパートのすぐ前で 簡単な強盗 (?) があったという。となりの棟のインド人がやられたらしい。 強盗というより恐喝かもしれない。

それにしても家の玄関の前ってどういうことよ? それじゃ防ぎようがないじゃん!

研究日誌
今日は宿題その他でぜんぜん研究ははかどらなかったが、 きのうの結果では 1-any をやったらやはり precision さがった。 しかしパラメータ調整をおこなうことにより、どうにか F=0.60 を確保。 Recall は上がったからいいが、照応を使ったときと使わないときとの差が 縮まってしまった (これは論文を書くときにインパクトが弱くなるので、よくない)。

ちなみにスドウさんは ACL に出す (らしい) 論文を書きあげたみたいだ。敗北〜。


Yusuke Shinyama