(最近こんなのばっか)
そしてそのあと電話を切ったらまた死にたくなり眠くなった。
つうか、むしろ死にたい原因はいまだに地下室のランドリーが壊れていて
使えないことにある。まさかサムすぎる間は当分ダメとかいうんじゃないだろうな!?
一体いつになっっっっっっっっっっっっっっっっ
っっっっっっっっっっっっっっっっっt
tっっっっっっtたら使えるんだよよよよよよよ!!!
(まあ、どう考えても学会より日本にタダで旅行というのが目的だったのだが…残念)
日本のガッカイが全然大したことないという事実は、 どこの分野でもそうなのかもしれないが、すくなくともセキネさんは 言語処理学会はもうちょいなんとかしたいと思っているらしい。 でも彼ひとりがそう思っても無理でしょうけどね。 オレはどうでもいいけど…。 だいたい日本は大学自体やる気ないんだからさ。 東工大はまだやる気ある方かと思っていたが、 いかにその考えが甘かったかをこちらに来てから思い知らされた。 個人的には市場原理が働かないところでノラクラやるのはいやなので、 そういう意味では新山はアメリカ的であるかもしれない。 しかしオレはマゾっぽい敗北主義でネガチブ思考なところが違う (べつに大いばりで書くことじゃない)。 ま、とにかく、
こんなところ (てくる) に長居は無用デス。
そりゃあさ、そりゃあさ、そういうわけでさ、
ピッタンコーーーーーーーー!!
きょうはミーティングで Dan と Adam にボコスカに叩かれて すっかり意気消沈してた新山であったが、いつまでも地下でくすぶってるような俺達じゃあない。 さっき、シャワーをあびているうちに「いや、やっぱりこれで正しいんではないか?」と思えてきた。 つまり、かれらは「anchor をとるなら properness よりも必要なのは invariance ではないか?」 「invariance は単一のソースからでた単語の spike と同じ傾向をもつのではないか?」 というのだが、まず 2番目のほうからいくと、今日使った式では spike のシャープさはソートすると単語の idf とほぼ (9割以上) 同じ順序になった。 まあこれは実際、df が少ない単語はそれだけ狭い領域に分布してるから 強い spike をもつのは理解できる。でも idf が invariance と同じでいいのかどうかは疑問だ。 つぎに、anchor に必要な要素は inう゛ぁriance だけではなくて、 じつはもうひとつあった。今日のオレはそれを見落としていたのだが、 anchor が anchor として使用可能なためには、invariance のほかに、 indispensability とでもいうべきだろうか、両方の表現に「欠かすことができない」 必要がある! つまりある文章中である表現が invariant であるだけなら、 べつの表現では単にその事実を「書かない」「omitする」ということもできるはずだ (ここで対象にしてるのは完全な parallel corpus ではないことに注意)。 しかしニュース記事には「どうしても必要な情報」とでもいうべきものがあり、 それはどちらの表現からも落とせないとする。そういうもののなかで、 さらに invariant なものが anchor として役に立つ、だから複数ソースの correlation をみる必要性がある! というところでどうだろう。うん、
どうでもいいけど spike を測定するのに Σi^2/Σi だけじゃなくて Σi^2/Σi/df というのも明日やってみること。まあだいたい同じ結果になりさうだが。
ただ人には激しく向き不向きがあると思うだけである。
しかし、問題は、なにが自分に向いているかわからないままで すべてが終わってしまうということだ。
だから、いろんなことをためす必要がある。でもこれは本当かしらん。
いつもあっちこっち流されてる軽薄な人間は、 いつまでたってもそれを見つけられないのではないか。
しかし、ひとつのことに打ちこめば何事も大成するというのだろうか。
それなら苦労はしない。
(オチなし)
正直いってリクツをこねるのはあまり楽しくないということだ。
電波人間にはつらい仕事だね。
このくせを日常生活にまで持ちこんではならないと、
つねに自分に言いきかせている。
(この日記が電波ーなことへの言い訳)
(でんでででん、でんでででででん)
<fonta size="+2">
アホぅ
でしょうか。
日本の大学でこんな状況、「もー! とりたい授業がいっぱいあって困っちゃう」というようなことは、 ほとんどなかったような気がするぞ。まあ、大学に入学したての何もわかってない頃は オレもそういうことはあったが、現実を知りだすにつれてどーでもよくなってきて、 あとはひたすら「ラクそうなやつ」に流れることになる (とくに語学とかはやる気のない先生に当たると ただの時間の無駄ですねありゃあ、語学クラスはふつう出席が大事なのでサボれないうえに、出てもちっとも身につかない、 あれなら学食でダベっていたほうがまし)。 ところが米国じゃあ、現実を知るにつれてますます取りたいものが増えてくるワケよ (といっても、当然ハズレの授業もあるのでそういうのは見きわめが大事だが)。 米国の大学はほんとに学費払うだけの価値はあると思う (と、奨学金もらってる分際がのたまっております)。 この違いは一体なんだろうね?
どうでもいいが、あさってから Linux World Expo 2004 なのだが、 同時にその日 NYLUG のミーティングがあって、そこでは「Knoppix Special Edition CD」が 配られるらしいぞ! どうする! 1日は 24時間しかない!
.bashrc
にあたらしいコマンドがお目みえしました:
function tot { du -b --total "$@" | tail -1; }
つーか、ただ論文を書くためだけに出したような一発ネタなんだが、 あいかわらず理論的な基盤が弱い (まあ、これは実はこの分野の研究ほぼすべてにいえることなのだが)。 しかもオレがキライな「データさえあればなんとかなる」式だ。 このアメリカンっぽさ。嫌いなんだよ、そういうのは! 今日一日だけで、3GBytes ものデータを消費した。この大食いめ! でもこんなことよりもっと世の中のお役に立ちそうなことがあるような気がするのだけど…ねえ?
帰りに電車の中で考えていたら、さっき自分の使ったプログラムにバグがあることが発覚。 ふんげあ。これを直せばさらに結果がよくなるだらうか。しかしこの手の実験でおそろしいのは、 バグを直したらかえって結果が悪くなったとかいう場合があることである。 ちゃんと考えた式より、何を計算してんだかわからないミステリアスな方式のほうがかえってうまくいっちゃったりして。 「とりあえず log をとれ」。ふんとに。これだからまったくアレは…。
ところで (てくるで)、さっき「新山は学費を払ってない」と書いたが、 実際には「払ってない」というのは間違いで、RA として給料もらってるのだから、 「お金では払っていないが、労働で払っている」というべきであった。 いちおう「労働の対価」ではあるな。この点、日本のガクシン君 (学振の奨学金をもらっている博士学生のこと) とは違う。 ただし実際には学振に通るような学生はちゃんと真面目に 研究してるのが多いから、あれはそれなりに労働の対価といえるだろうけど。
で、何が言いたいのであるか???????
起きたらすべてがどうでもよくなっていた。
ところで中国で開発されたプログラミング言語って見てみたいような気がするなあ。 (日本で開発されたプログラミング言語はもういいです)
ns0.nic.ad.jp
じゃなくなっていたことを今さら知った。
手動 query するとき、ついクセでこのアドレスを打ってしまう。
どうでもいいが、お名前.com でドメイン取るやつはアホだね。
(とか言って、セキネさんの会社はこのアホレジストラにがっしりわし掴みされているワケだが)
tabesugi.net もほとんど固定 IP みたいなもんなんで いちおう dns を動かしてるけど、これを本当にネームサーバにしてしまうと オフライン時に unixuser に転送できなくなるんで結局委譲してない。
(しばしなにか言いたげな顔をして去る)
いま思いついたのだが、メールアドレスはなんで いつもメールアドレスのように見えるのだろう。 web にメールアドレスなんか書いておくから spam の対象にされるんだが、 そもそもメールアドレスというのは「一目見てメールアドレスとわかるような格好」をしているから いけないのであはないか? (電波、電波。) つまり、メールアドレスをふつうの日本語とまったく区別できないような形にすれば 問題は解決するのだ!!
(伏線消化)
「人生の落伍者」の反対ってなんて言うんだ?
精神は物質に影響を与える (!)。
でも格下。幕下。目下。軒下。そして
どういうことかというと、こんなコードがあったとする:
"spam"[:n]
(最初の n 文字を切り出す)
"spam"[:-n]
(最後の n 文字を切り取る)
たとえば n == 3
なら、これは期待したとおりの動作をする:
"spam"[:3] → "spa"
"spam"[:-3] → "s"
ところが n == 0
のときは違うのだ!
"spam"[:0] → ""
(○、期待どおりの動作)
"spam"[:-0] → ""
(×、"spam"
を期待するのは間違い)
Python のハッシュは勝手にキーの値をa = { "ふんがあ": 1 } a["ふんがあ"] → 1 a[unicode("ふんがあ")] → KeyError
str()
変換したりしてくれない。
これはオブジェクトを区別できるようにするためにはしょうがないのだが、
EUC と Unicode を比較したりしなければならないコードだと、だんだんゴチャゴチャしてきて、
「文字列をいつ unicode 化するのか」は重要な問題になってくる。
経験的には、「とにかく unicode()
を呼びだすのは入出力ルーチンだけにまとめろ!」ということである。
それ以外のすべての関数では、文字列は必ず str であるか、あるいは必ず unicode であるかの
どちらかを仮定しておき、assert
を書きまくっておくのがいいようだ。
まー、こりゃあ型チェックがゆるい言語のトレードオフやね。
それにしても、chasen の辞書 はすばらしいね (プログラムは、まあ、あれだ、 *cough* *cough*)。 辞書を読みこもうとしたら標準の JISX0208 範囲内じゃない地名まで入っててびっくりした (Unicode 変換時にエラーがでる)。 たとえば「トカラ列島」の漢字表記「吐■喇 (真ん中の文字が範囲外)」とかがそうであるが、 そもそも「トカラ」ってなにやら日本語じゃない響きがするな。琉球語?
きょうはなんとかいう機械学習のワークショップがあるというが、確信的にサボる (なんとなく直感的にダメそうと判断)。 夢の中で、どこかのスーパーのようなところでチーズを買おうとしていたが、 寝ているときは眼鏡をかけていないからか、なんか値札の文字がボヤけてよく見えなかった。 夢の世界には非常におもしろいチーズがあった。チーズはべつにただの Brie なのだが、 「Brie の表皮だけ」というのを売っていたのである。あれの固い皮の部分をはがして、 それが 2メートルぐらいずーっと続いているやつ (元はよほどデカいチーズだったんだろう)。 それは非常に細長いうえに、弧を描いて曲がっているので、 冷蔵器 (よくスーパーで肉や野菜が置いてある棚、なんていうのあれ?) の中に 入りきらないらしく、その前に立てかけられていた。 値段は $4.25 ぐらいだったと思う。オレはそれをみて、 「ふーん、皮だけ食いたいやつがいるのかあ、変わったヤツだな」などと思っていた。 でもその前になんかストーリーがあったような気がするのだけど…夢なので…。
バカにしてもらっちゃあ困るよ、オレは、 溜め息をつくのはなかなかウマイんだよ。うん
「スラッシュトッド日本」といえばどうしても 1ch.tv が連想的に 思いだされるのだが、まだあったのにはびっくりだ。 なんか時間の流れがゆっくりになったように感じる。
今夜はあったかい。-7 ℃もある。
-10℃より上なら恩の字じゃん。あいかわらづ寒いけれど顎はガチガチ鳴らなくなるし、
正面から風が吹いても呼吸困難にならないし、帽子なしでも耳がちぎれない。いやあ、
と、まさに今オレは -7℃ で感動できる人生をすごしているのでありました。
人間、何事も気の持ちようですな。
たぶんいま日本に帰ったら融点を超えています。
(使用ツール: tgif)
「この通りを横切るのが怖い」というときが何度もある。
そしてこのあまりのツメたい風に逆らえず大幅に吹き流されたあげく、
思わず道を間違えいることだってある。冬をあなどるな!
「この寒さはきっと予想気温 -15℃ !!」と思っていたが、 家に帰ってきて気温をみたらさらにその上をいっていた…
まあ、これはまた人が死にますね、確実に。。。
駅から帰るとき、なにやらあたりがキラキラしていたんだけど、 あれはもしかしてダイヤモンドダスト??
(1010wins より)
HOW LOW CAN IT GO?AccuWeather says tonight will be dangerously cold with temperatures dropping to around 2 to 3 above zero, lower in the suburbs, and a wind chill as low as 30 below. At those temperatures, exposed skin can freeze in 30 minutes. Check School Closings
どこまで下がるのか
AccuWeather によれば、今夜は危機的に冷えこむとのこと。 気温は華氏 2〜3度まで下がり、郊外ではさらに冷える恐れも。 体感温度はこれより 30度 (17℃) ほど低い。この気温では、 露出した皮膚は 30分で凍傷になる危険性がある。休校する学校の一覧はこちら
あまりに寒いと学校が休みになるということを知った。
ぐわらん、ぐわらん、ぐわらn、 (食器洗い器の音)
ナゼ大学に食器洗い器などがあるのか?? などと尋いてはいけない。 米国にはどこにでも食器洗い器があるのである (うちは貧乏だからついてないけど)。 あとさー、うちのアパートにはついてないんだけど、 ふつうの家庭には disposer があるのね。あれって日本でも今はあるのかな。 うちの母親が非常に興味を示していたのだが、オレも興味を示しているのだが、 今だにつかったことはなし。食器洗い器なんていらないから disposer を置いてくれ! でもあれって下水道の問題があるんだってね。
どうでもいいけど、いままで「ホセ・アルカディオ・プエンディーオ」だと思っていたが、 本当は「プエンディーア」だった。しかも、 そう思ってたのはオレだけらしい。 アホやった。でも 「スヴィドリガイロフ・アルカージイ・イワーノヴィチ」のほうはちゃんと覚えていたのでよし。
「スヴィドリガイロフ! スヴィドリガイロフが自殺し た!」 (たしか新潮世界文学はここで改行したはず)
ところで (てくるで)、諦めることを知らなければ真の大人とわいえない。 つうことで、今年こそ、諦めますわよ! しかし一体、何をアキラめるんだろう? それ自体が謎だ。つうか、つーか、ただしれっとして「あきらめまし田」とか いってるだけなんではちっともそれっぽくならない。 真の妥協というものは、それ自体で (par se) 迫力のあるものでなければならない。どっちだろう。
どうでもいいけど今だになんで「ところで」と言うたびに「(てくるで)」という 文字列を追加するのか自分でも謎。まあ枕詞みたいなものってことで。
そろそろ、この「誰もつっこんでくれないけど一人で爆発」というこの癖をなんとかせねべなるめい。
そろそろ: 永久にこない時間のこと。用例「〜そろそろ本気を出すかな」
“都合の悪いときだけフザける人間”
dumpmbox.prl
というダサいスクリプトを
走らせて来たメールを片っぱしから stdout にダンプさせ、こっちでも同じように
deliver.prl
というスクリプトを走らせて qmail-local で再配送する。
我ながらどーーーしょーーもない機構だ。
なにも間違ったことは言ってませんよね、今のことろ。
本当かな?
まあどちらにしても帰ってき。
ドラゴンボール.gz
」というあまりにもベタなネタを思いついてしまったのだが、
さらにさらにまずいことには、そのことをここに書きつけたくなってしまった。
おちこむ話だ。でしょ。オコチム! (は、ビールの銘柄)
もうダメだ
どうでもいいけど (よくないけど)、
「ある NFS サーバに頻繁にアクセスしてるクライアントホスト」を
てっとり早く調べるにはどうすればいいんだろ。
nfsstat じゃ相手先ホスト名まではわからないし、
いまのところ tcpdump -n -i eth1 udp port 2049
とかやっているのだが、
もうすこしスマートな方法はないもんかね。
キイボードを打つ職業の人は手のヒエをどのようにして解消しているのであろうか? 新山は手が冷えてくると、いつも洗面所にいって水道からお湯をだして じーーーっと手をつけているのだが、これをやりすぎると手荒れするな (タダでさえ乾燥と強風のためガザガサなのだ、ニベアは欠かせない)。 これをやっているといつも思い出すのが、むかし中学生のころ、 冬になると清掃のゾウキンがけがほんとにつらくて、唯一の楽しみは 終わったあとにゾウキンをしぼったバケツ (ブリキ製の) をすすいで、 当時は校内に数箇所、お湯の出る水道があったので、そこからお湯をくんできて みんなで中に手を入れて「あったけええぇ」といっていたことである。 ちなみに同様のくせは高校になってからも教室のストーブでやっていた。 どうでもいいけど、日本の公立学校はまだあのメンテナンスが大変な でかい煙突つきの石油ストーブを使ってるのだろうか? それともあれは寒い地方だけなのかな。 今でも思うけどよくあんなの火事にもならずに運用していたものだ。 でも親の世代はさらにすごくて「石炭ストーブだった」というから時代が違うのじゃよ。
ところで、石油ストーブといえば新山がまず思いだすのが アラジン ブルーフレーム なのだが、これってオレが 5歳ぐらいのときすでに家にあったのだが、いま web をみたらまだ売ってんのね。 しかも「レトロな感覚のストーブ」ということでなにやらファッショナブルな価値が つけられているらしいことにびっくり。見てみるとこれは「暮しの手帖」 ストーブ商品比較で一位にランクされたことがあるらしく、暮しの手帖ユーザだった うちの親がいかにも買いそうな商品だったということがわかった。
ちなみに話はさらにどうでもよくなりますが、新山が「エセ自然派」と呼んでバカにする 人々がいるのだが、かれらはみな以下のような特徴を有しております:
そういやー「オゾン発生器」はどうなったんだ? オゾンについていえば米国でもトンデモはあるらしく、 「オゾン入り」などと書かれたミネラルウォーターがあると聞いた。どこだっけ。
今日知った単語: 船井系、Maharishi Yogi
ふと考うたのであるが、オレの人生って、 切れかかってるトイレの蛍光灯みたいなもんだな…。
ふと考っった。ふと、
(一生やってます)
もっとも、だからといって独占 OS がこの世から消えてほしいなどとは つゆほどにも思っていないわけだけど (なくなったら混乱するからね)。
そして Windows は嫌い。
一流シェフの味を
ご家庭に!
一流シェフの味を
ご家庭から!
年ごろを住みしところの名にしおへば来よる波をもあはれとぞ見る
ここでいう「エセドキュメンタリー」というのはカワグチ探険隊とか、徳川埋蔵金シリーヅなどのことです。。。
軽めのドキュメンタリーといえば、むかーし (10年ぐらい前、新山はまだ高校生だった) 青島幸男と高見知佳がやってた「追跡」という 30分番組があって、 あのノリがすげー好きだったんだけど、今はそういうのあるのかなあ。 主婦向けらしく、身近なテーマが多かったのがよかった。 「はじめてのおつかい」とか大家族とか、基本的に 「暮しの手帖」風ネタであった (そして新山は 「暮しの手帖」自体も大好きでアル)。 青島幸男もあのへんまではマトモだったのに、 その後都知事になってから一気に評判落ちたね…。世の中きびしいのう。
あれは新山にとっては「少女漫画 = じつはスゲーおもろい」という認識をもつきっかけとなった本であるのだが、 酔った勢いで人から借りたもので、今となっては「感動した!」ということしか覚えてなく、 題名はおろかストーリーすらも覚えていないのである。 表紙の絵だけはぼんやりと覚えているのだが、日本に帰ったときデカい本屋で大島作品をあさってみても さっぱりそれっぽいのが見当たらないのだ。そして、新山に本を貸してくれたその人はいま音信不通になっている (し、どうせ尋いても覚えちゃいないだろう)。なんともこまったことで。
そういやー大島弓子のストーリーってわざとらしくなくていいよな