とりあえず、オモテへ入れと。
Last Modified: Thu Jan 16 23:52:38 EST 2003 (01/17, 13:52 JST)
TODO: あしたファイル分割すること。
研究に関する訳のわからない妄言を「研究日誌」という セクションに分けて書きだすようにしてみたんだけど けっこう分量あんな (毎日そうだとは限らないが)。 ページ分けるか。
ところでさいきん「スペイン語ってトーホグ弁みたいだなあ」 ということを考えた。JC 周辺にはヒスパニックが多いので、 PATH の表示はだいたい二ヵ国語 (英語とスペイン語) で書かれているのだが、 電車のなかに「非常時のさいには (In case of EMERGENCY (En caso de EMERGENCIA))」という 看板があって、そこの最後にはこう書かれているのだ:
Thank you. Your security is our priority.「セキュリティ」が「せぐりだっど」になるところが トーホグっぽくない??
Muchas gracias. Su seguridad es primero.
注意: ここから「スペイン語をバカにするな」とか 「トーホグ弁をバカにするな」という発想になる人は危険だと思う。 実際、トーホグ弁のほうがトオーキョオー弁より全然かっこいいしね。
手荒れがひどい。前から不思議に思っていたのだが、 なぜか左手のほうが異常に荒れている。ふだんの生活で とくに左手のほうを沢山つかうという状況が思いあたらないのだけど、 これは何かのバグだろうか (?? プログラミングのしすぎで思考回路が変に)。 ニベアは欠かせない。
しばらく tabesugi.net 落ちてました。すみません (また落ちるかも)。 これにはいろいろ事情がありまして…。netgear が悪い。
どうでもいいけど、ここにあんまりこまかい式とか書いちゃやばいかな。 競争相手の方は閲覧をご遠慮ください (まあ彼女、日本語が読めるとは思えないが)。
log とるようにしたけど、まだいーか源。 考えてみたら判定に使うのは名詞だけじゃなくて、 形容詞や動詞を含んでいてもべつにいいんだな。しかしこれは今後の課題。
SVM のテュートリアルを読んでみたが、半分ぐらいまでしかわからん。 とりあえず線型 learner を2段階に拡張して kernel をつくる。 そしてその kernel のつくりかたがみそ (各アプリケーションによる)。 そこまではわかったのだが、その後がハア? これやっぱり独学じゃ駄目だわ。 来年は機械学習の授業をとることにしよう…。来年も Dan がやるのかな?
getpp-from-pairs.py とりあえず動く。まだバグが残っている。これはあした。 スピードはそこそこだが、もっとましな評価方法を考えねばなるまい。
TODO (あとで):
ところでゴジラって和製キャラなのになんであんなに有名なんの?
ところで「おなかへった」のかわりに 「私の胃は削減されました (My stomach was reduced)」 と言ったらどうだろう。 すさまじい知性が感じられないかい? あ、そう…はいはいもういいですよ新でやるから!
帰りにまた Ryan に会った。「ヒュー! yusuke! また会ったな! (おまえもココ? - と新山が入ろうとしている中華料理屋を指さす) オレたちはまるで約束してるみたいじゃないか!?」 彼は大声で歌いながら歩いていた。おめでてーな。 そのあとやつが注文するところを見るが、すげー大食いなのでびびった。
で、帰ってきたら、フォークが入ってない。 フォークが屏風に上手にフォークでフォークナー!
あと、文マッチがどれくらい prec. に貢献してるかの評価。
sentence-matching.
sentence-matching とりあえず完成。つーか、かなりテキトーな tf/idf の cos を 計算しているだけだが、最適な重みと threshold はまだ不明。いまんとこは
というやつ。IDF はほんとに入れる必要あんのか、まだ不明。0.3 < (score = vcos(v1_nouns*1.0+v1_nes*3.0, v2_nouns*1.0+v2_nes*3.0))? → match
それから同値類を求める python コードがいつのまにかどっかへ紛失してたので ここに書いとこう。
def equivalence(feqv, objs): eqs = [] for x in objs: eq1 = [x] i = 0 while i < len(eqs): if exists(lambda y:feqv(x,y), eqs[i]): eq1.extend(eqs[i]) del(eqs[i]) else: i += 1 eqs.append(eq1) return eqs print equivalence(lambda x,y:(x%4)==(y%4), [1,1,2,3,4,5,1,2,3,4,0])
教科書は 5.2 と 5.3 の最初。
Todo: (近い)
Togo: (遠い)
めずらしく爆笑したスレ。
追伸。カワイ肝油ドロップ っていま見たらもう デザイン一新されていて、あの浅田飴みたいな缶じゃなくなってるのね。
個人的には、今にも死にそうで死なない、という生き方をめざしたい。
ああまたオレは落ちのつかないことを。
とにかく毎度評価を手でやってたんでは やってらんないので、なんとかして正解データをつくる必要があるんだけど、 これがむずかしい (考えられる表現を全部列挙するのは不可能)。 なんらかの方法で正解データを「正規化」する必要がある。 しかしいまの状態では NE 出力の結果がそもそも人間と機械で違うので、 人間側で正解データをつくっても機械の結果に適用できない。 するとどのみち NE の正規化みたいなことが必要で、 けっきょくだったら correference の解決までやってしまえということになる。
さしあたってはこれはアドホックなプロセスを組んでやるしかないだろう。 でも it has to find references across multi documents. だから ACE のタスクとは違うかと思ったらじつはそういうタスクはあって、 alias-i の彼がやってるんだとさ (ただしかれの手法は人名だけ)。 ちなみに ACE でもこのタスクに参加したのは彼しかいないため、 最上位で最下位という結果だったらしい、ヘンなの。
あと並列構造のある subtree の出力がおかしい。 あきらかに subtree() でバグっている。でもこのデータ構造は破綻してきたような気がする。 いっそのこと class NLNode を書きなおしたい (最初からノードが複数の並列構造をもてるようにする) のだが、これをやりだすとおそろしいことになるだろう。今のところはがまんすべし。 それと並列の最後にある文節の情報をノード間で共有させたいんだが、 形態素列からそれを切り離すのはむずい。文節にある素性をみればなんとかなると思うが、 そこから逆に文字列を構築するには辞書をひかなきゃなんない。もういや。
ようするに knp が悪い knp が悪い knp が悪い knp が悪い。 こいつはこの手の用途には向いてないのだが、いいかげんいやになってきた。 例の計画をはじめるべきか。というか chunker と分けるべき。 もう古いし C で書かれているしあんまり見通しよくないし (黒橋先生ごめんなさい)、 そろそろ誰か次のやつを作るべきでしょ?
バグをとりだしたら次からつぎへと芋ヅル式におかしい部分がみつかる。 最終的にやっととれたのだが、アルゴリズムが複雑すぎて誰も理解できなくなりつつあるぞ (python でたかだか 1000行なのに)。詳細なコメントを書いておいてよかった。 データ形式を改良すればずっと簡単になるのだが…。 きょうは教科書は進まず。
あしたやること: 目的はとりあえず recall よりも prec. なのだから、じつは ne coref. の問題はあまり助けにならないようにみえる。 前にもすこし書いたけど、prec. をあげるには「ふるいおとし」が必要なんであって、 spurious な結果を減らすことが目的なのだから。だいたいこれがなぜ prec. の向上に役立つかといえば「ne がたくさんとれる → threshold を上げることが可能 → prec. 向上」という推論にもとづいてる。 でもじつは prec. するなら sentence matching をまずやるべきで、 むかしはこれをもっと一般化した文脈としてとらえていたけど あれってうまくいかなかったでしょ? つまり文単位はけっきょく重要なんだよ。 ああなんだか目がしょぼしょぼするわー。さっさと書いちまおう。 しかし sentence matching やるにしてもやっぱり npまわりの正規化は必要で、 だけどそれはアドホックなもんでいいから、さっさと作れ、明日じゅうに。 これがあすの課題じゃ。そんで sentence matching もおざなりなもんを作ると。 あとなんで subtree generation があんなに時間のかかるのかを解明する必要がある。 たぶん sieve は効いてると思うんだけど、それにしても何万レベルであんなに 時間がかかるものか? singleton の検査あたりでまだ無駄な処理してそう。 sieve の徹底適用を! 評価はそのあとだなこりゃ。 そんでまあ ACL までにこの 2つのモジュール (ne normalization & coref. と sentence matching) の性能をいかに上げられるかがカギかな。 いやでもそれでも問題はまだあるぞ。より根本的な問題が… しかし本質的な問題とそうでない問題をすこし 「よりわけ」られたのでとりあえずはよし。自画自賛。
つうわけで otod:
(11:17) おなかがへりました。。。そうだ!
博士「ウシシシシシ…ついにできたぞ…人類滅亡計画の完成じゃ!」
助手「でも博士、これを使えば我々自身も滅亡してしまいますよね?」
博士「うんそうだよ、それがどうかしたか?」
助手「…それは非常にマヌケではありませんか?」
博士「きみはポストモダンというものをわかってない」
おもしろくないなあこれじゃ。。。
(13:50) えーとえーと。日本語でも説明がむずかしいこと (Xのフォント設定について) を 英語で説明するのって至難の技だな。もうしどろもどろ。 話してて明らかに「あーオレって意味不明なこと言ってるー…」というのが 自分でわかるのだ。かなしいのう。
そもそも X の仕組みを知らない人にまずどれだけのことを 説明しなければならないかとゆうと:
あれま、こんなにあるだよ! ぜへぜえ。 そういや今じゃーほとんど過去の遺物と化した高岳製作所の X 端末では フォントサーバが基本でございました。しかも昔の xfs はよく落ちた (それも落ちるパターンはたいてい決まってて、 X端末側で netscape が落ちると、 道連れに xfs も落ちるのだった、端末で動いている高岳の Xサーバがクソでメモリリークしまくるせいだと人はいっていたけれど)。 そんで、xfs が落ちると X端末側でとたんにあらゆるフォントが おかしくなるので大変だった (研究室では何台ものX端末が稼働していたのである)。 おまけに xfs を上げ直すには管理者がくるまで待たなければならなかった… (そのせいで昔の田中・徳永研には root が4人も5人もいたのだと思う)。 でもこいつは NFS もサポートしてて、何も知らなかったころはトクナガ先生に 「X端末のために NFS で static mount させるのはキモチ悪いので xfs を使うように」とか 言われてもなんのことやらサッパリわからんかったなあ。 結局ああいうのは自分でいじれる身分になってみないとわかんないワケよ。 NISまわりはいまでも謎が多い。97年の日記をみるとそのへんのトラブルが書かれている。
(16:19) ああダメだなオレって人間のクズだ…。 ところで葛湯っていいよねー。いつもあせって飲みすぎて舌をヤケドするのですが、これは罰の一種です。
(19:35) また赤ペンをなくしたらしいぜ。ヤダナァ牛 (「やだなぁモウ」と読むこと)。 これで何度目か?
google://なくした site:www.unixuser.org/
todo:
結論:
ところで自分の ~/.emacs
を ~/rc/emacs
に移したら、
find-file したときに Lisp コードだと認識されない。
たしかなんかマークのようなものを書いておけば自動認識してくれんじゃ
なかったっけ? と思い、あちこちの lisp コードをさがしまわる。
ああ、やっと見つけた。; -*- emacs-lisp -*-
だ。
これは一行目に書いておかねばならないので注意すること。
perl スクリプトなんかでは普通にやってたんだけどなあ。
(13:35) 3日間にわたるカレー色の人生がようやく終了したので (といっても毎日3食カレーばっかり食っていたワケではねい)、 きょうはすこし調子がいい。寝坊したけどね。 朝飯 (というかこりゃもう昼飯だろ) を食いながら考える。 論理によって何かを「推論」したり「予測」したりできる、 という信念は傲慢であると。人間は自分が考えるよりもはるかにおバカであり、 世界は逆にずっと入りくんでいるので、つまり、この日記は論理的でなくてもよいと (ほらほらだんだんあやしい雲ゆきになってきた!)。だじゃら (=「だから」のtypo)、 言語っ! つまりまともな日本語も使わなくてもいおいしいみかんすたいぷなんか蒙古れ ほっとけ、てな感じ。あえはaerlkfjaeあえaげえあえおいぎょf.
「終わった世界」
朝 (だからもう昼だって) からなにをこんなに元気がいいのだろうオレは…。 防虫剤のニオイがするほとひどく不機嫌なんだよ!! これはこれはもう。 いかん。まだ昨夜の電波が残ってりるようだ。。。そもそおm「電波」が「残る」 なんて「こと」が、「ある」「もの」「だろ」「うk」「あ??」「?」 これではぼのぼの父になってしまいますね。sikasiこういうこと(=論理を超えるとかなんとか) をいうとすぐに「禅がどうとか…」いう話をしだすこっちの西洋人もどうにかしろ。 だからそれはこうゆうことだ (= 「だから」という言葉を使ったからといって、 それが順接になっているかどうかは、げふねふ)。ちび他はおでんが好き → asdf, asdf, asfd, asfd, fdqn.
(14:40) さて、インフルエンザと英語の influence (影響する) がどちらもラテン語の influentia (in + flu で「(不吉なものが)流れ込む」の意) から来ているという話は よく知られているが、こういう雑学を日記に書いて喜んでいる人間はただのアホにしか見えない。 思うに、中途半端に物事を知っていることはまるで知らないことよりも罪が重いとみえる。
…どーでもいーけどインフルエンザもウイルスだから電子メールで感染するんだろうなあ、やっぱ。
Content-Type: application/x-augmented-material Content-Length: 0.00023
(15:37) コーヒー豆を Maxwell の French Roast にしたらミルクとよくあうので機嫌がいい。 こちらではスジャータのような小分けにした製品はないので、 牛乳をとぼとぼ入れてじーーーっと液面を見やる・・・ すると、夜の底からじわじわと白い煙がはい上がってくるのだ、 おおおそろしい! ところで送りがなは本則ですか??
(17:54) さいきん、nytimes をみるたびに暗くなる。 といって朝日や毎日のサイトを見ても脱力するだけなので、これは「ニュースなんか見るな」 という天のお告げだろうか?
ntpサーバは time.nist.gov と ntp.nasa.gov を覚えておけばとりあえずは大丈夫。
(01:19) あらいつのまにかこんな時間だ。言葉に笑う者は、言葉に泣く。 っつうか、言葉にたよりすぎるのはいいとしても、 単語にたよりすぎるのは問題だと思う。 ボキャブラリーの豊富さと表現力はほんらい関係がない。 が、それにごまかされている人もまた多いような。 …だから世の中にはカタログスペックおたくが多いのか?
それにしても、なんという木っ端ずかしい、救いようのない、むきだしの自己愛だろうか。 ところで第三屈曲リフトって廃止されてしまったのね。
(02:22) おや? 何度も何度も何度も何度も encounter させる気ですかこのページは。
すばらしいです。ほんとうに。
オットトトトこう書くとなんだか怒っているように見えるのでにこにこしていよう。にこにこ。
(13:06) 寝坊し、た。
飛ぶ鳥を落とす勢いでプログラムを組んでいたら、 いつのまにか机につっぷして気づいたら朝まで寝てました、 という「モーレツ型不健全生活」を一度やってみたいのだが、 いまだにそうなったことがない。気合いがなっとらんのだろう。 というか根性ない体質なのでそういうワザはできそうにないな。 だいたい昔から徹夜そのものが非常に苦手だ。頭が働いてなくても 身体が動く人って尊敬する。たぶん脊髄が発達しているのだろう…。 新山は周辺機器が劣っているためか、なんでも大脳中央集権型になりすぎるような気がする。 頭がつかれるともうメシも食えない、という状態。トイレはどうすんだろ。 こりゃー、早くボケるよ、きっと。
オチがついたのでここで書くのをやめよう。
(13:16) そもそも「気合」なんて言葉を日常的に使ってるやつあ悪魔にとりつかれてる。 たぶん北チョーセンあたりでも似たような言葉がいま大流行中にちがいない…。
(20:59) 見なかったことにしよう。なにやら、なにやら。
(23:05) おー寒い。 きょうは真冬日なんじゃないかというサムさだった。もう凍りつくね。
ぶるぶるしながらかえってきて、夕食はインスタントな cous cous にする。
なんか電車の中で書くことを考えていたんだけど忘れた。
(00:08) ビゴロッソ!!
・・・あーなんかまた落ちこんできた。
表面上は、なんかこのように表面上は、 毎日なんの悩みもなく日々をただ騙しかまし過ごしているかのような新山であるが、 ほんとうになんの悩みもないという状態などありえない (でもね、まあ、新山の場合は少ないかもしれないけど、それはそれ)。 いやね、やっぱりオレはいったいこんなところで何を暇つぶしてんのか、 こんなアホなことばかり (自分の書いた日記をあとで読みなおすと その人格の悪さ加減にほんとに憂鬱になることが多い) やってて 本当にいいのかとか思うときはあるワケですよ。 なにやら話を抽象化しすぎのような気がする。 まあどうでもいいっちゃあどうでもいいんだけど。 いやそれにしても。
レッテルを貼るのってたのしーよねー。ああこいつはこんなことやってるから きっと阿呆にちがいないとか。この歳になって…(以下略)。 いやーほんとに。…死んだほうがいいですね (自分、は。)、というか、人じゃない、人じゃない。 ペタペタと。はい。人を見下すためには冷静でなくてはいけませんよ。そういう人は物言いが違います。 だいたい、いまごろになって留学していったい何かの役に立つんかってのも かなり日本じゃ疑問ですな (他人のふり)。こっちで一生暮らすならともかく。 それはひた隠しにしていよう。ひた書くし。 まあ論理的に考えようとすると、そんなものはタグがはずれてしまうので (「たががはずれる」とちょっと似てる)、哲学的に。ごつっ! ってことです。 ゴツー君。(頭をつぶける音。にぶい館。) ちなみにアルコール薬物その他の危険な状態ではありません。 しらふでこうも狂っていられるのが新山のすごいところであるわけでして、 その電波! な、…というかなんでこんなに消しても消しても強力な電波源が 現れてくるのでしょうかね? じつに謎です。というか、というか、 「発火点」は、あったわけですが。ずっと昔に。でも… 知るか! (なにやら見えない存在に向かって話している) だいたいおまえの せいでなー…。沈黙。ああそうか、ああそういうわけか。 なるほど、なるほどねー! ふん。
さてこのように単語の N-gram だけで続け書くような文章のあるわけの、 たいへん結構でよろしいほでございますが (日本語の構文規則までを 覚えている暇のないであるよ)、うだうだ。とりあえず書くだけ書いて ストレスを収束させておくのだ。こうすると爆発する。 しかしドラえもんの「まあまあ棒」ってすごいよね? それとも「マアマア棒」とカタカナ表記が推奨されるもの・状況・あるいは、 であるのか。いや、まあいい。そんなことは関係ないことだ別。のこと。別。 温泉でしょうね、きっとこれは。このゴツンゴツンぶりを見たら人は、 見た人は、おどろくでしょうよ。わずか数分のうちにこれだけ! まるで表意されているかのように文字ですね、憑依。 かなかんじ偏見のまちがいをやようするというのはもうこれ直さない。絶対。 あいかわらず爆発ぶりしてますなー。そろそろ<p>の時間だ。<p>
えーともうどこまで話をもどってよいやら不確か明らかでなくなるつつ
あるわけだけれどですも…。ああ、わざとだ。ワザ。ワザ。
もうそれくらいで勘弁してやれよ。「100円で分析」は通過単位の問題です。
(→ 電池切れ。) ああ? そうそう、よくバカにされていることに
腹を立てるのは被害妄想以外のなにものでもありませんね (この辞書は、
使いものになりませんね or とんでもねえわたしゃ神様だよ的人物)。
パイプ。パイプ。||
、ということ。
あっちのほうから見つからないっていってんだから放ほっときゃあいいで醤に。
つかれました。全部読むような異人はよもやおるまいでしょうから、 拡散された分散は情報が隠蔽です。成功じゃ!
(00:49) 止まらない。オレには新興宗教の教祖様になる才能があるのではなかろうか。 やばいよ、それは。つーか本当に人を怖がらせるには、つけこみ所は そんなとこではないような気がしまするですよ、怪物はそいつ本人に作らせるのが 一番効果的っつうか、怖いものは自分が結局いちばんよく知ってる。 うわーくるな来るな!
意味のない記号から意味をみいだす能力をバカにしてはならいない。 なんで新山はわざとあるところで日本語を間違える(=バカにする)のでしょうか? これには意味のある順列などあるのでしょうか? そのはずはござりませんし、思わせぶり路線はもうとうに全盛期。
たくさん書いてもテンションは上がらないなあ。
(02:36) というか、読みなおしたら引いた!
(09:07) カレーの法則: 朝からカレー。 とにかくカレー。泣いても笑ってもカレー。
まあこうなることは覚悟していたのだ。
けさは夢の中で、なぜか paul oakenfold & carla werner の "Southern Sun" という曲が ぐるぐるループしてた。めずらしく今回は曲を覚えている。でもどんな夢だったかは覚えていない。 新山の夢はいつでも総天然色音楽つきなのです。
(09:53) そういえばいまだに SMAP って稲垣メンバーしか名前覚えてないや (それも名前だけ。顔と名前はまったく対応つかない)。 むかし広末凉子を「ひろまつ りょうこ」と読んだ この芸能オンチぶりに勝てるやつぁそうはいないだろう (←自慢してるつもり)。
(14:15) 電車の中で英語クラスで一緒だった Kevin (はいはいこれも中国人ね) に会った。 「年末なにしてた?」などと話す。こいつもかなりテンション高いやつで、 話があっちこっちに飛ぶうえに早口で中国なまりのためわかりにくい。 中国人って a と e の発音の区別うまくできないらしい。 そういやー中国語の e の音って厳密な「え」じゃないもんな。 かれは "professional" をどうしても「ぷろふぁしょなる」と呼んでしまい、 英語の授業中になんども先生に訂正されていた。あいかわらず "many" "best" などを「まにい」「ばすと」などと言う。 ききにくいよ。。。まあいまだに th 音と sh 音を間違える新山もアレだが。
(16:45) 輪講 (みたいなもの) があるにもかかわらずすっかり忘れていた。 論文よまずに行ったら、全然わかんねーのでぼんやりと外を見ていた。 ダメじゃん…。そうこうしているうちに2時間経過。 とりあえず結論は「分けて考えろ」ということなんだな。これでいいや (槍投げ的な)。
なんとなく、今日はカプチーノを買ってみる。$2.95。ちょっと濃い。
(19:39) 研究で中国語のデータをいじっている Winston が、 gb2312 (本家中国で使われている簡字体のコード体系) のテキストを Emacs-21 で編集できないという。 見たらあるファイルに gb2312 範囲外の文字が一文字だけふくまれていて、 それで Emacs が「こいつは gb2312 じゃない」と思いこんでしまうのであった。 たぶん元データは Windows で編集されたものを持ってきたのだろうから、 また MS お得意のコード拡張か! しかし Emacs のコード認識もきつすぎるよ…。 Mozilla でもだめ。「?」になってしまう。しかし Netscape4 はバカなので gb2312 の範囲外でもそのまま表示していた。
いろいろ調べた結果、これは cp936 という gb2312 拡張体系であることが判明。 iconv ではサポートしているから、utf8 に変換することはできそうだ (unicode ってマイクロソフトの拡張文字は絶対全部入ってんのな)。が、 utf8 に変換したところでやはり (Mule-UCS を入れても) emacs 上では編集できない。 なぜなら Mule-UCS は基本的に unicode ←→ (Emacsでサポートしてる)既存コード体系、 という変換しか行わないから。cp936 の一部が Emacs ではどうやっても扱えない以上、 Mule-UCS を入れたところで意味なし。どうする。そのうちに yudit という unicode フルサポートという エディタをみつける。おお、こりゃすげー。しかし編集はできたが、 肝心の文字はやっぱり表示されなかった…。フォントがないのだ。 しかし似たような問題は日本語にもある。罪なことよなあ。
ところで
さてまた帰ってカレー食うか。。。
今夜はカレー臭 (加齢臭ではないよ… わーははははははははははは、 どうでもいいけどキャラクターが変わってませんか? オレ) のゲップに悩まされるのかなあ。
どうでもいいけど帰るときふと考えたのだが 「カレーまみれになる」ってなんかすごくヤな表現ですね。 ヤーな表現。
(23:54) きらいな人間がたくさんいても、そのぶん好きな人間もたくさんいれば問題はないでしょう。
(10:07) 惰性で起きる。でも、まだねむい。
なぜか起きたら頭の中で「きたか〜ぜ、こぞう〜の勘太郎〜♪」 という曲がぐるぐる鳴っていた。
(11:59) 「かんたろう」は「寒太郎」ではなかったか? と思い出した。
ねむい。
(14:54) すこしくもりがちな天気のほうがきれいに見える。
(17:18) 今日はあったかかった。サンドウィッチを喰いながら片手で日記を書くのは時間がかかる。
(00:13) なぜか非常に和風なカレーが食いたくなり、 帰ってきてから怒涛のようにつくりはじめる。 また時間をかけて無駄 (でもない) ことをやってしまった。うまい。
ふつうカレーやシチューをつくるときは、ほんとうは野菜や肉を 炒めてからやるのだが新山家ではなぜかそれをしない風習であった (ひとつは油っこくなってイヤなのと、単純に面倒くさいから)。 今日はシチューとカレーを両方買ってあったので、 ルウをとかしこむ直前まで「シチューにすべきか? カレーにすべきか?」と悩む。 選択式お料理。
ちなみに、むかしから新山はよく母親に「料理できないとおムコに行けないよ!」と 脅されていた (本当)。したがって、料理しない男を夫とは呼ばない。
(09:32) kurai to huhei wo iu yorimo,
(10:58) どうぢで毎回こんなに時間がけくるのでせf?
(11:23) ああ、inodeが…。
(12:09) 「モノは言いよう」という言葉が好きだ。 この言葉をなげかけるだけで、すべての言明、命題、表明は茫漠として悪意に満ちたものにみえる。 なにか人から話を聞いたり記事を読んだりしたら 「なるほど、モノは言いようですね…」と言ってみよう。 険悪な雰囲気になることうけあい。この破壊力はおそろしいよ。
そういえば全然関係ないけど じゃいスポ ってどうなったのだろう。 あれ、誰か続ければイイのになあ…。
(12:48) ニオイにやたらと神経質なために、ときどき自分の体臭が気になる。 でも自分のはまだいい。いちばん気になるのが、自分の身体 (おもに手) に「自分以外のヒトの匂い」がついているときだ。 たぶんドアの把手とか電車のつり皮 (NY地下鉄の場合は鉄パイプ) とか 水道の蛇口とかで感染 (!) するのだと思うんだけど、 そういうときは洗面所に行って、水 (できればぬるま湯) で ていねいに洗い落とさないと気がすまない。 ちなみに欧米の「握手をする」という習慣はいまだに好きになれない。
(15:48) へぁー。やっと終わった (雑用が)。XP から vm 上でうごいてる samba が見えないのは なんのことはない、linux の ipchains がブロックしていたためだった (にもかかわらず「コンピュータを検索」すると名前だけは一覧に出てくるんだよなあ、ヘンなの)。 そのあと XP から linux が見えるようにして linux からも XP を smbmount できるようにして ついでに lpr も xp と linux から両方フロアのプリンタが見えるようにして、 もうしっちゃかめっちゃか。セキネさんも「わけわからん」といっていたけど、 使うのはアナタの責任ですからね。しかし windows って見るたびにワケわかんなくなっていくよなあ。 とくにネットワーク回りとかプリンタ回りとか…設定はあっちこっちにあるし、 ドライバは adobe と epson のやつが両方動いてる… 実はなんで lpd 経由で印刷できてんだかようわからんのだが、まあいいや。 こういうモノばかり相手にしていると「動きゃいい」という 思考に毒されてしまってこまりますね。いや、こまるのはオレじゃないことを祈る馬鹿理。
(19:39) 疲れているためか、あまりにネムいので、きょうもサッサと帰ってきてしまった。 またカゼひいたりしてもやだし。 スーパーが開いてる時間に帰れるというのはうれしいよね。 最近は授業もなく、研究だけすればよい日々であるので比較的おだやかである。 しかしこういうときにズッコケるから注意しないと。
(21:33) それにしても毎日毎日一体誰に向かって語りかけてゐるのでしょうね…。
そういえばきょうは散歩の途中で Crate & Barrel に 寄ってみたりした。のだった。のである。 でも、なんか重い皿ばっかり。見えない存在
(23:12) 2週間ぐらい前に買ったクッキーの缶がようやく終了した。 それにしても、こういう丸い缶クッキーってのはどこで売ってんのを見てもデンマーク製で "Royal Dansk" とか書かれているのだが、この国では「缶入りクッキーはデンマーク製」って 決まってんのかね? 日本にいたときはこの手の舶来モノはあまり食わなかったので覚えてない。 いつも氷砂糖のついたプレッツェル型のやつは一番先になくなる。 ちなみにマンハッタンではマンホールの蓋のほとんどが MADE IN INDIA だということも謎のひとつだ。 いつか写真に撮ろうと思う。これ TODO ね。
あかーねいーろーのあーさやーけぐもひとつーちぎれてー
ああ、夜だ、夜だ。夜はくらいなあ。グフフフフフフ??
(00:59) 東風ゴシックから自動生成させるのだ。ふははははは
(01:37) おお? なんか知らんけどうまくいってるみたい。 しかし maxp や hhea, head はもう全部向こうから持ってきたほうが早そうだなあ。
(03:34) なんか徹夜しそうな雰囲気。こんなこと始めるんじゃなかった。
(04:09) とりあえずもう寝ます。。。
(09:08) ガーソ! 非常に不吉なメールが…。おいおいマジかよ。がくがくぶるぶる
(10:23) つうか、なんで他の人はもう成績来てんのにオレだけまだなんだよ!? これじゃ生殺しだ。はやく本格的に落ちこませてくれー
(11:28) めちゃくちゃサブいです。JSQ 駅に歩いていく途中、投資しそうになりました。
% wide.sty for letter % letter: 792 x 612 pt \NeedsTeXFormat{LaTeX2e} \ProvidesPackage{wide} \setlength{\oddsidemargin}{-18 pt} % Note that \oddsidemargin = \evensidemargin \setlength{\evensidemargin}{-18 pt} \setlength{\textwidth}{504 pt} % 612-(72-18)*2 Width of text line. \setlength{\columnsep}{36 pt} \setlength{\topmargin}{-36 pt} \setlength{\textheight}{648 pt} % 792-(108-36)*2
TeX きらい。
(12:56) にっこり! (鈴木のマネ)
Ralph いわく「“しごき (hazing)”は完了したね」とのこと。
(18:08) セキネさんのとこで vmware に RedHat をインストールしてて、 samba に XP からログインできねー。って、木づいたらまだ昼飯食ってないじゃないか! というわけでそそくさと家に帰ってくる。今日はめずらしくすごい早い帰宅。 夕食はきのうののこりのまぜごはんに豆腐とワカメのみそ汁。 ここでも海苔を細かく刻むのに心血を傾ける。青海苔教徒は氏ね!
どうでもいいが、日本の薄志学生はなぜああも覇気がないのかという話。 さあ、ぼくに聞かれても (なにしろ新山は日本ではテンション高すぎて浮いていたのだ、 まあ覇気があるのとテンションが高いのはだいぶちがう毛度)。 でもたぶん日本の白紙課程というのはほとんどの場合消極的な選択 (=就職できない、したくない、めんどくさい) だからでしょう。とくに工学部の場合は。 とりあえず「オレは博士を取ってバラ色の人生送るぞ!」という人はみたことない。 まあここでもないけど。以上
(23:44) 自分は人間的に欠陥があるので、人をなぐさめるのが苦手だ。
手紙をかくために Quotations をさがす。 カッコつけるために。 そしたら、あるわあるわ。しかも読みだすと結構おもしろい。 著者やテーマでカテゴリー分けされてたりして、「Quote of a day」という メール配信もあったりして。とうぜんサーチもできるのだが、 どの程度ブラックな quote も含めるか? を選択できたりするのだ。おもしれー。 ちなみにきょう気に入ったのはこれ :
"That's the secret to life... replace one worry with another...."
Charles M. Schulz (1922 - 2000) (スヌーピーの作者)
キチガイ的な引用でなくて悪うござんしたね。
ちなみに長野方言は江戸弁に似ているところがあり、 ai → ee への母音の変換がおこることが多い。 たとえば「キチガイ的」は「きちげえてき」と読む。 ところで google で「キチガイ的」を検索したらなかなか笑えたので、 これはおすすめです。
(00:38) まあ軍事政権国家と共産主義国家ってやってること大して変わらないもんな。
さいきん Google へのリンクばかりはりつけて胡麻化しているように見える。 大変よろしくない。(08:36) 2つものが「同じ」であるわけがない。 なぜならもし同じだったら、それは 1つとしか数えられないから。
(09:34) あーやっぱへんに意識しちゃうとダメだなあ。
さっき洗面所で口の中が出血していることに気づきしが、 血があまりにきれいな朱色をしていたのでびっくりしてしまった。 オレの血ってこんな色してたっけ? 美しい…血でナルシスト。あなたもどうですか?
(10:39) カードがこわれたよー。まだ3ヵ月しかたってないのに…。しくしく
いま、雪が (降っているのではなく) 舞っている、という感じ。
(11:27) あれ? セキネさんってそんなに早く帰ってきたの!? (やや焦り気味に)
(13:57) 新山が間違えやすい単語 (a ではじめる編):
たぶん、字面でしか覚えてないからだろう。
この日記を読んでいる方々は、知的好奇心が高い。
…などと書ける神経をもってなくてよかった! (書いてるじゃねーか)
(19:47) はいはいどうせわたくしはまだ学生デスヨネ。
(22:32) 固定長データ相手にパトリシア木ってそんなに有効なのかなあ…。 もちろん形態素解析とかサーチなんかには有効なのはわかるのだが、 いずれcdbと対決させてみよう。
(01:32) 問題はゼロからつくりだされる。
(12:25) 自分がいまになって必要だと思うのは、
(12:54) また寝坊したので今日は出かけようかどうしようかなあ。これではまたヒキコ森だ。
(15:29) ジサクジエンです。
なんでも呪いのせいにしてはいけないと…。
(16:19) また完璧主義の呪縛にさいなまれた。
(18:05) おなかの音が…。
(19:30) ああああああ。部屋にずっとこもっていたら いいかげんに考えはまとまらなくなるし、 頭もくらくらしてきたのでもう嫌になってわけもなく表へ出た。 雪がふっている中を 10分ぐらい傘もささずに早足で歩きまわる。 手袋もつけない。1km ぐらい歩いて戻ってきたら、部屋の中は暑かった。 この勢いでついでに洗濯もしてしまえ。
最近ようやくわかってきたんだけど、やっぱり自分には 仕事場 (職場というよりこの表現のほうが好き) が必要なのだ。 在宅勤務とかって絶対できそうにない。べつにする気もないんだけど…。 というか、自分は監視されてないと働かない人間なのだ。そうなんだ。 ああ、ダメなやつ。 田舎でゆったり暮らす、というのも憧れなんだけど、この分だと向いてないのだろう。 人がワイワイいるやかましい環境で締め切りにせっつかれてひーひー言ってるほうが 性にあってる (というか、そういう方法でしか生きられない) のだ。 絶対長生きできなそうだよな、こういう人間は。でもそんなの別にどうでもいいもんね。
この正月(という言葉は英語にあるのだろうか)の反省。 はっきりいって、家にこもっていたのは大きな間違いだった。 無理にでも市街地に出て、がやがやしたところに行くべきだったのだ。 新山の性質からして、じっとしていても頭は働かない。 この2、3日の日記の敗北ぶりを見てみろ! ああバカだなオレってばほんとにもう。
(20:32) 大家から「今月の家賃まだあ?」という電話があって、すっかり忘れてました。 しかしどこへ行ったのだか、小切手帳をさがすのにえらく時間がかかる。 整頓されてるにもかかわらず重要なモノが見つからんとはどうゆうことだ! としばし憤然として捜しまわり、やっと見つけた。なんかよくわからん場所に入っていた。 なんでこんなところに入れておいたのだろう? まあいいや。
(22:00) 基本的には、どんな願いでもかなえてもらえる。
でも、メタ願い (あるいは高階願い -- 願いに関する願い) は、かなえてもらえない。
(22:53) 乾燥機から出してきたシーツがやけにあったかいので、 試しに頭からかぶってみる。あー、いい感じ。 ここで誰か周囲にいれば「オバケだぞ〜」ってやりたいところだが、 幸運にもまわりには誰もいないのだった。おおそうだデジカメがあるではないか。 しかしそんなアホにつきあっている暇はないので…以下省略。
(23:45) ああ、なんだかとっても不安定。ころころろろろろ… (坂をころがり落ちる音)
(01:40) すみません。「あけましておめでとうございます」って書くの忘れました。 社会人的常識欠如。社会人失格。
原稿もいったん書きはじめてしまえばけっこう進むんだけどなあ。
どうか起きますように
(11:10) ヘッポコピー!
(11:22) どうでもいいけど kuro5hin を 「くろゴヒン」と読むやつは、オレだけなのか。オレだけなのか。やっぱりそうか、 オレだけなのか…。(←自意識過剰ぱか)
(11:28) さて (なにをおれは興奮しているのだ)、 新山は「バカ」という言葉をよくつかう。 これが他の人にとってどんな印象を与えるのかは知るまいが、 どうも「バカ」ってのは一方的に見下しているような感じがして、よくない。 そこで最近「ぱか (ひらがなで表記スルコト)」という表現を考え出した。 これを使うと、言われてる方だけじゃなく言ってる方も同時にバカっぽく見えるので (しかも敗北的退廃的)、 大変よろしい。たとえば「おまえはぱかだな」。おれもぱかだな。ぱか。
(13:05) うげ。大学に来るまできょうが土曜日だということに気づかなかった。やばい、完全狂ってる曜日感覚日付にちじ。
(13:55) どこか遠くで戦争が起きつつあるなどと誰が気づくのだろう。
(18:31) 気がついたらきょうは土曜日ということで 5時まえに帰ることにして、 そのまえに、3時ごろから大学と外との接続がキレテイタ。 というわけで勉強がはかどってしまった。やはり強制的に外部とは遮断したほうが 精神衛生上人間にはおろしい (大根おろしの親戚) ようである。 そのあと、帰ったあと、また例の CD屋とうにすく (union square の意、うにっくすを連想した人は全然ハズレ) にある BN に寄ったあと、だが結局なにも買わず、そして外した。
時間をジグザグさせて書いてみました、論理的でなく。倒置法に。で、。
(21:27) また印刷できなかった。
(21:55) ほうぼうの形態における表現「ご無沙汰」な多様性。考察。それ。
(23:54) またお茶をのみすぎないように。
(09:24) 朝からみぞれが降っていて暗いなあ。
(11:20) サムかったのです。ぶるぶる。がくがく。
(14:59) やばい、またネムくなる時期だ。
(16:34) Orens のあんちゃんさあ、いっぱいいれてくれるのはいいんだけど、 これじゃコボれるって。
やる気が低下したので、Astor の Barnes&Noble へいって 新刊をうろうろ見る。が、外はサブいのに店内はホンワカしてるので 立ち見してるだけで眠気がおそってきてしまう。 あまりおもしろいのはないな。というか、web上などでおもしろそうな本を みつけて「ああこれ今度見てみよー」と思うことはよくあるのだが、 いつもいつも本の題名や著者を忘れる。こういうことは、メモをとっておかねば ならない。でもそのときにはだいたい記録しておこうという気にならないのが問題。 そしてあるとき発作的に「あれが読みてー!」となる。こまったもんだね。
(17:26) ああ、いつのまにか 佐藤健 って亡くなってたんだ。 12月20日あたりまでは読んでいたのだが、その後しばらく読んでなかったので気がつかなかった。 この人の文章はむかぁーし毎日中学生新聞で読んだことがあり、その後 なぜかずっと名前を覚えていたのだが、死ぬ直前まで自分の醜態さらして見せ物にするという 記者根性には驚く (誉めているつもり)。すごい。
(21:08) Viterbi の実装でおかしなところがわかった。 というか、自分は Viterbi をきちんと理解してなかったらしい。 動的計画法を使うというところまではわかってたのだけど、 てきとーな仮定をもとにプログラミングしたら、これでは絶対うまくいかない ケースがあるということが判明。Path Recovery のためにはあとひとつ 2次元配列が必要なわけよ。 めんどくせーなあ。 あと、Dijkstra の SSSP (Single Source Shortest Path) とこいつが関係あるということは うすうす知ってたんだけど、さっき電車のなかでようやく理解した。つまり Viterbi は Dijkstra をひっくり返して SDLP (Single Destination Longest Path) にしたものと 等価なのだ。だからこの 2つは本質的に同じアルゴリズムだといえるわけである。
ちなみにこのアルゴリズムには O(m n2) の計算量が必要だが、 これは自然言語処理の分野では速いほうである。O(n log n) なんていったらもう神様。
(21:44) 天真爛漫にふるまっていれば人を傷つけずにすむかというとそういうわけでもないようで…
オマエこんなものが科学になると思ったら大間違いだぞ (自分に言い聞かせる)。
(00:43) で、久しぶりに読んだらすっかりわすrれてるワケでして。。。
(09:10) なにやら、どっsさりした夢をみた。
…日本人のいる店に入ったのだが、なにかを買おうとした (それがなんであるかは知らない) とき、 店にいるピアスをした日本人のにーちゃんが急に顔を近づけてきて「あのー、この品物、ちょっとヤバいんで、 人に言わないでくださいね」という。どう見ても合法的なものを 買おうとしていたはずなのだけど (でもなにを買おうとしていたかは忘れたのだ)、 そのにーちゃんは「まずこの書類を持ってメキシコ国境まで言ったあと、 再入国のさいにこれを海外から持ちこんだことにして…」などと低い声でいうのだが、 なんでこんな麻薬密輸みたいなことせにゃアカンのだ! なんにもヤバいものは買ってないのに! …そしてそのあとなぜか人里はなれた山奥の小屋で泊まるハメになっている自分がいて (途中のストーリーは予算の都合上省略されたらしい)、 風呂に入るとそれがひどくきったない所で、大量に髪の毛がぬけおちた。 髪の毛の半分ぐらいがバサっととれたので「フギャー」と思ったのだが、 おかしなことに抜けた髪の毛はひとつにつながっているのだ。…もしかして、 これは、ヅラか? オレは生まれたときからずっとズラをしていたのか? わけ不明。とか思っているうちに目がさめたのだが、なんとも幸先の悪い初夢であることよ。 起きてから「なんだ夢か…」と思ったのはいうまでもない。
そんで鏡を見るとほんとうに髪の毛が半分なかった! りしたら、ホラーなのだが?
(15:46) ひる来るときは気づかなかったが、いつのまにか 8st. 駅の改札が Waverly Pl. にもオープンしている。便利便利。
(16:06) おい、いつのまにか外は雨ふってますよ?
(18:17) 気のせいであったらしい。
(22:20) また妄想にとりつかれた。 きょうの妄想は巨大なハンマーが壁をつきやぶって横からふりおろされてくるというもので、 そいつは新山の頭をねらっている。ちなみに支点は上にくくりつけてあるが、天井がどこだかはわからない。 のだね。意味がわからない、自分でいってて。だいじょうぶ。というかこの妄想は高校のときから ずっとくりかえし訪れていたものであるのだが、人に公開するのははじめてだ。 まあ意味わかんないからどっちでもいいんだけど。
ところでてゆーかひょっとしてこの日記見られてる?
(00:56) あーもうオレって。
(09:02) なんかガリガリいってるなと思ってたら、いつのまにかリブートしてた。何故?
(11:27) のんびりしてたらもうこんな時間だ。 こちらでは三が日というものはないので、明日からいきなり平日が始まる。 といってもまだ大学は冬休みなので授業はまだだけど、いいかげんに研究をすすめなきゃ セキネさんから尻をたたかれてしまう。
だいたい web で自分の日記など公開しているやつは例外なくみんな 自意識過剰ぱか だと言いきっていいのだが、 それにしても去年は電波なことを書いている日が多かった。 そしてそれはとても痛々しい。ってこんなこと自分で書いてる奴はろくなものではない。 今年もデンピーでありますように。
今年の抱負:
で、去年の抱負ってなんかあったっけ? と考える。
(13:14) オレが無趣味なのは日常が退屈じゃないからだろうか。 音楽を聴くとか寝っころがって本を読むとかは趣味というよりも生活の一部なので、 あまりがんばっているという意識はないし、散歩も必要にせまられて行くことが多いので、 それ以外の趣味というものがまったくない。アレとかアレがあるけれど、 それも趣味というよりはもう仕事の一部というかんじだし…ああそうか、 「趣味」という言葉が好きじゃないんだな、と考える。 言いわけがましい。趣味をもちましょう。 なんの趣味ももたない人間は精神が貧しい人で、毎日をなんの目的もなくロボットのように生きており、 はっきり言えば生きている価値がなく、人生の負け犬です。 でも趣味はあくまで趣味なので、仕事とちがって人生を賭ける必要はありません。 人間の目的はもっと生産的なことに使うべきだからです。ということですね、 ということですか! 音楽を大音量でかけているとまわりの音が何も聞こえないので、 いまラスコーリニコフがここに入ってきて後から斧をふりあげてもぜんぜん気づかないだろう。
でもたしかに毎日はちっとも退屈じゃない。 「日々新た」なのは学生だから? 恵まれているというしかない、正直にいって。
しかし退屈な日常というものにあこがれているのです。 そうなったら、死にたくなるんでしょうか? でも退屈でなくても自殺を考えることはあるので…。
雨がひどい降りっている。やだなあ
(15:59) はやくも「あの世的」。
(17:02) 思ってた以上に時間がかかっています。
(00:40) いやあ、へたに落ちつきがよすぎると傷む(=腐る)のも早いってのは本当だったんですね。
(01:19) スクリーンショットを撮るために Outlook Express をインストールした。 そしてすぐ消した…いが、まだ使うかもしれないので残さざるをえない。 いやあ見れば見るほど迷惑なソフトだね。感心したっす。