^ up
< 2月 (2) へ。
2005年 2月 (3)。
Last Modified: Tue Mar 1 01:41:55 EST 2005 (03/01, 15:41 JST)
なんか出てくる場所ちがってなかった?
そこにはだれかがいる。
まちあす先生の書いた暗号化ライブラリのソースを読んでいると、次のような表現に出くわした。
padsize = enc_pad + !!(nbits & 7);
なにこれ? こんな演算子あったっけ? ソースは純粋な ANSI C である
(この人は非常に厳格なソースをかく人で、コンパイルオプションにはいつも
-ansi -Wall -Werror
がついている)。
2秒ぐらい考えて、これは否定の否定 !(!(nbits & 7))
であることに
気がついた。でも否定の否定といったら元に戻っちゃうじゃないの。
これってなんか意味あるの?? と思ったら、あった。
つまり C ではこれは整数を boolean に変換するはたらきがあるのである:
!!0 → 0
!!1 → 1
!!2 → 1
...
なるほどね、うまいねこりゃ。しかしこれって可搬性のあるやり方なんだろうか?
ANSI で通ってるからいいのかな。
(追記: そういえば python でも int(bool(x)) とやれば同様の方法が実現できるな、
こんなコードを書く奴がいたら悪だけど。こんあ)
うー寒い寒い。おもては雪が舞ってるし、風もビュービューとスゴ強い。
まるで 1月に戻ったみたいだよ、もう 2月も末だというのに…
って、明日からもう惨月じゃねーーかよ!!
オレの人生もまるで 2月のようにきびしい (と、人はよくこういう例えを使うのがスキだ、
新山はべつに好きではない)。いやしかし真の人生の試練はまだやってきてないような
気がするから、いまはまだ 12月ごろというべきなのか。だぅーでもいいよ。
このように、比喩をあてはめすぎることはある意味危険を意味する (なにが?)。
日本語がだんだん狂ってきてるけれどもそんあ (=そんな) ことは気にしなえ。
あしたは大雪注意報だってよ。冗談じゃねえ。
しかしいっぽうで「大雪」と聞くとある意味ワクワクするのも事実である。
これにワクワクしないようではあなたはもう年よりか、あるいは雪国の人間ではないか、
あるいはフサンスの国王は禿であるかのどれらかだ。
…たしかにこれはつもりそうな勢いでふっている。
粒がでかいのだ。いま気づいたのだが雪の粒が小さいときは
どれも均一に見えるのに、粒が大きいときは遠近の差が目立つために
見かけの大きさにバラつきがでる。そして、たぶん風の影響も
大きくなるので動きに幅が出てくる。つまり、おもろいのよ!
あれ、もう 10時すぎかと思ったら、まだそんなでもなかったね。
いい買い物をしたよ。
空は薄明るく、雪はまだ積りつずけている。ふんとにむう。
オレが日本人のかく web 記事 (ブログロとは呼ばない) で読みたいのは、
べつに世間の動向に関するご意見でもなければなにか専門的な情報の流出でもない、
ごくふつうの人並みの生活である。新山は基本的にはブログロをバカにしているが、
ひそかにそういう日常的な視点でおもしろいものを書く人がいないかと
暇さえあれば探しているのもたしかだ (べつにブログロでなくてもかまわない)。
だが、そういったサイトはほんとうに少ない。全体の 0.1% 以下ぐらいじゃないか。
そして自分でそうしたものを書こうとしてみて (そしてそれが不可能なのを目の当たりにしてみて)
わかるのだが、そういったことを「読めるように」書くのはとてもむずかしい。
じつに細密な観察力が必要だ。結局のところ、当たり前のようなことを書くのが一番むずかしい、
というどこかで見たような結論に落ちつく。しかし、たいていは、どの日記もなにか特殊な
イベントがあったこと「のみ」しか記していない。しかも書いてあるのはたいてい
「感想」である。そんなもの他人に書いて通じると思う? あるいは PC の話題やテレビや
漫画の話でお茶をにごしているサイトの多いこと多いこと。見(ら)れたもんじゃない。
そんなことよりオレが読みたいのは、ある種の現実性をもった個人の生活の「記述」なのだ。
それはべつに匿名化されていてかまわない。できれば自分と全然境遇の違う人の生活が読みたい。
そいつはタンスに何が入っていて、冷蔵庫の中はどういうレイアウトで、ハエをたたくときには
何を使っているのか? そして、玄関の前に咲いている花はなんなのか?
これはぜいたくな要求かもしれないが、いまだに web 上でみかける
大多数の日記の情報は非常に「薄く」、また偏向しており、読んでもただ頭の中を
文字が流れ落ちていくだけのような気がする。というか、本人があとでその日記を読んでも
ちっとも楽しくなさそうな日記がほとんどなのである。
ただし、そうじゃない人は絶対どこかにいるはずなのだ…。
そして、そういう文章を探すのと同時に、自分もまたそういう記述をかくように努力しなければ
ならないと思う。
またヘンな夢を見たよ。かなりヘンだった。
新山がなにか資格試験のようなもの (詳細は謎) を受けているのだが、
その会場ではなぜか同時に高校入試もやっていた。
で、1日目はまあ別にどうということもなかったのだが、2日目になって
(夢の中だから時間が早くタツのです) 会場に行ってみると
「あんたの試験は、 2日目の会場がこことは変わった」と言われて
「ええ? そんなの聞いてねーよ!」とガーソ。で、「どこなんですか」と聞くと、
その受け付けにいたおばさんはいきなりブ厚い辞書のようなハードカバーの本をとり出し、
なにやら調べている。その本を見ると「高校統一入試○○会場・徹底詳細」というような
タイトルがついている。ヘンなの。そして「2日目の試験会場は、
『○○バーガー (名前失念、だけど日本っぽい名前だった、定吉バーガーだったか
清定バーガーだったか)』って名前のハンバーガー屋でやってるから」という。
なぜかオレはその試験会場にくるまでに駅前を通ったことになっており、
そのハンバーガー屋についての記憶があるらしい
(夢の中ではよくそういう「一時的に作られた記憶」なり、心配なりが生成されている)。
「『○○バーガー』って、あの駅前の?」と尋くと、
「そう、そこの店長に○○さんっていうおばあさんがいるから
(またも名前失念、ウメだったかトメだったか、とにかくバアさんっぽい名前)、
彼女に尋きなさい」という。しょうがないので会場を出て駅まで戻ろうとすると
後ろからアパートの大家 (いまいるこの NJ のアパートね) が追っかけてきて
「オレも行くから、車に乗せてってやるよ」という。いま考えてみれば
この場所 (どこだか知らないが日本であることは確実) に彼が出てくることは
非常にオカシイのだが、その時はなにも感じなかった。
「なに、あんたも試験受けてんの?」というと、そうだ、という。
で、「そんじゃー悪いね」と彼の運転する車に
乗せてもらうことになったが、なんか非常にあぶなっかしい。運転がアレというよりも
道がすげーーー狭いのだ。ほぼ車 1台がやっと通れる広さしかない。
しかも歩道がないため、人が平気で車道を歩いてるし、おまけに側溝や河があるのに
ガードレールはないという危険さ。で、「こりゃヤバそうだな」と思っていると、
やっぱりそのうち河に落ちた。その時の記憶は一瞬なくなっている
(それにしても夢の中で記憶がなくなるって一体どういうことなんだ?
まあ、どうでもいいのだが、リアルな夢だった)。
そのあと、気づいてみたら自分たちはなぜか水の上にプカプカ浮いていて、
河は緑色のわりとキレイな水だった。河というより「運河」といったほうがいいかもしれない。
で、なぜかその場所ではちょうど「とびこみ大会」のようなものをやっていて、
新山たちは車でそこに飛びこんだので参加者と見なされたらしくみんなに歓迎されていた。
気づくと大家はすでに「ヒャッホー」とか言いながら飛び込みに参加している。
おい、試験はどうなったんだ? しかしすでに新山の頭の中からも試験のことは消え去っていた。
で、その河の中には茶色く錆びた橋だか鉄塔だか、でかい鉄製のオブジェが立っていて、みんなその上から
水の中にとびこむのだが、オレもためしに登ってみるとすごい高さで
「うげーこんなとこから落ちたら死ぬわ、ぶるぶる」と思っているうちに、
なぜか落ちた。…ら目がさめた。
別にオネショしてなかった。
でも、こういう夢での空はいつも青く晴れている。
そして新山の夢に出てくる水はたいてい澄んでいてうつくしい
(しかも今回は錆びた鉄塔がよく映えていた)。人によっては夢に色がついていないというが、
オレは生まれてこのかたモノクロの夢を見た記憶がない (覚えているかぎりでは)。
なんでだろう?
ついでにいうと夢自体も非常に「物語的」なときがあり、
そういう場合は新山は物語にはほとんど関与せず、ただ映画のカメラのような
視点でずっと眺めているだけなのだが、ときには「黒子」として世界に
干渉できることがあり、登場人物のてきとうな雑用 (カーテンを閉める、など) を
やってあげることもある。「全編アニメでできている夢」もごくまれに見る。
声優・効果音つきで。しかし、それに類似した既存のアニメを見た憶えがないし、
声優の声も自分の知っている人ではない。
こういう経験をする人が一般的にいってどれくらいいるのかわからないが、
他人が経験していようがいまいが実に不思議な現象だ。
いったいなぜだろう? いつも思うのだが、無からなにかを想像できるはずがない。
絶対データをどっかから仕入れているはずだと思うのに、いまだにわからない。
これが電波の電波たる所以なのだろうか…?
かうものりすと:
画像と写真は同じではないよ!!
なぜかむしょうに本屋に行きたくなり、紀伊國屋へ。
2時間近く時間をつぶす。出るときは敗北的な顔つきをしていた。
なぜならいつものように買いすぎだからだ。
だって高いから。文庫本しか買わないのに高い。ちくしょうめ。
抱えている本が増えてくるとだんだん焦りが見えはじめ、
最後のほうになるともう本棚を見ないようにしながら
足早にレジへ向かう。
てくるで、また本の話をするが、どうせ手元に置いておくなら
「何度も読む価値がありそうな本」を買いたい。ようするに、スルメのような本を
買いたいということである。一度読んだらもういいや、
という感じの本 (小説はたいていそう) は、なるべく図書館で借りてすます。
といってもこっちの Donnel 図書館にはそんなに日本語の本はないから
「どーーしても気になる!」場合は買ってしまうことになるが (このあいだの小川洋子とか)。
ほんとうは実用書でいっこ面白いのがあったんだ。
「この数を英語でどう言うか?」という題名で (詳しくは憶えていない)、
「18歳未満入場禁止」とか「妻は妊娠5ヵ月です」などの表現を英語でどう言うか?
ってやつ。けっこう応用っぽいし辞書的だし欲しかったのだが、文庫本ではなかったし
$29 もしたのでやめる。ほかにもハードカヴァーのやつはたいてい立読みはするのだが
買うまでにはいかない。ところで、紀伊國屋はいつのまにか店内の配置が変わってた。
いままで 2階にあったコミックのたぐいは 1階へおり、1階にあった語学関連の
書籍や技術書が 2階に移されている。やっぱコミックのほうが売れるからだろうか?
ちなみに英訳コミックもけっこう数があるが、そういうのはべつにココで売る必要もないじゃん…
と思う。そういえば去年ドイツへ旅行したとき、フランクフルトの近くの Hanau という駅のキヨスクで
「ぼくの地球を守って!」ドイツ語版が売られていたのを見たときはびびった (というか、引いた)。
が、それはどうでもいい。
さて、久しぶりにコンピュータ関連の日本語の書籍をざっと眺めたのだが
(眺めただけ、手には取らなかった)、どれもこれも大変つまらなそうに見える。
というのは、どの本も非常に表面的なことしか扱ってなさそうだからだ。
ここには計算機の理解を促進するようなものが何もない。コンピュータというのは
もはや趣味でいじるものではなく、すっかり「業務」として定着しているということだろうけど、
中学生ぐらいのコンピュータ狂いのガキが背のびして読みたがりそうな
「おもしろ本」がぜんぜんないのだ。ちなみに新山の場合、
そういう本は Oh! MZ であった。いまのコンピュータ関連書籍にはもうああいう雑誌の
入りこむ余地はなさそうに見えるが、これは非常に危険だ。「自宅サーバのたて方」とか
「Flash MX 入門」とかそんなのぁどうでもいいんだよ。かといって、
「プログラムはなぜ動くのか」みたいな、老衰寸前のオヤジしか読まないような
与太本でもない。日本人の子供に計算機の知識が浸透しないのは教育制度のためばかりではないと思う。
まえにここにちょっと書いた "Hardware Hackings for Geeks" のような本
(これは米国のませたガキなら読むだろう) って日本で売っているのか。
しかもそれは完全にガキ向けじゃなくていい。「ませたガキなら読みそうな本」でいいのである。
どうでもいいが、Amazon で「なぜプログラムは動くのか」で検索したら一件もひっかかんなかった…
Amazon のくせにこの手落ちはなんだ! 「なぜ」の入る位置が違っているが、そのくらい考慮すべきだろ。
Edit distance 計りゃすぐだろ。こーいうときこそセキネ社の…以下略。
University Pl. にあるやや高級そうな食料品店に寄ってみた。
いままでここは高そうで (Zagat Rated だし) 敬遠してたのだるが、
入ってみてビックリ! なんと、この店はスーパーのくせに
学割が効くのである。
もっとはやく知っときゃよかったね。これからはここで買おっと。
そういえばきょうの紀伊國屋で、スウェーデン人とおぼしき女性が
もうひとりの日本人女性とムーミンについて話しているのが聞こえてしまった。
「やっぱ、スニフって呼んでた?」「呼んでた!」とかいってる。
「ニンニの話って知ってる? あの話はある意味とても哲学的よね」…
非常に割り込みたい会話だったが、なんとか耐えてその場を離れた。
ああ知ってるよ! 知ってりゅよ!
誰かとムーミンの話してええええ!! でもそれができる人は新山の近くにはいない。
これまでの中東和平のプロセス:
-
パレスチナ.自爆テロ();
-
イスラエル.ミサイル攻撃();
- 1.〜2. を 10回くり返す。
- 停戦合意。
- …そして 1. へ戻る。
高校生のころ、大学はなにかをする「やり方」を教えてくれるところだと思っていた。
実際には、日本の大学は何のやり方も教えてはくれない (実験以外は)。
ただ「これこれがこうなっている」という宣言的事実を延々と教えてくれるだけである。
これはヨーロッパ式だからこうなのだろうか? でもまあとにかく、情報系の学科がそれだと
ほとんど卒業しても使いものにならないことは容易に想像できる。が、いっぽうで
「やり方」だけを教えてもそれでは専門学校と同じになってしまう。両方やるから 4年間必要なのだ。
でも、いまの場合だと、ホントに 4年も必要なのか? っていう疑問がわくよね…。
つまんないことを書いてしまった。
Contemporary arts はモノそのものを見るのではなくて、
「それを見ている人々を観察する」のがおもしろいということをきのうふいに発見した。
“救う”“救われる”という動詞の無意味さ。
それで救われる気持ち。
42番目のメルセンぬ数を (2進数で) 表示する Python すくりぷと:
print '1'*25964951
この結果はあまりにデカいので、BitTorrent で共有することをおすすめします。
気がすむかどうかが重要だ。
(そろそ暗くなってきた)
google://たべぎす/
その目は、こういっていた。
「…笑えよ。 笑えっていってるんだよ!
笑わねえとどういうことになるか知ってるのか、おい。」
もちろん、村八分にされることは恐しい。
だが、本当に恐しいのは、「『村八分にされたこと』にされること」なのだ…。
人間がみな過去のことなど都合よく忘れてくれるというのは幻想である。
そいつらはことあるごとに爆発し、一生、あなたが意識のあるうちに離れることはできない。
だから、なおさら武器を捨てる必要があるのだ。
まあ、しかし、武器を捨てても腕を捨てないかぎりは無駄なことだ
が。
<うl>
先々週の継続 (continuation).
&あmp;
♪ 雪ふるな雪ふるな雪ふーるーなーーー (onpu)。
このように、(onpu) をつけることによって、たとえ何も曲を作曲 (← いま気づいたが、これは、腹が腹痛だっ!)
していなくても、あたかもさも歌っているかのように、聞こへる。
こわいこわいタプルのワナにひっかかった:
>>> 'ab' in ('abc',)
False
>>> 'ab' in ('abc')
True
1要素のタプルは Python の構文設計における数すくない腐った仕様だ。
何事も完璧ではありえないので、油断がならないな。
もおーー また雪がドカドカふってるよー もう信じらんな〜い
この世には 2種類の暗号がある。妹があなたの手紙を読むのを防いでくれる暗号と、
政府があなたの手紙を読むのを防いでくれる暗号だ。…
私が手紙を書いて金庫にしまいこみ、その金庫をニューヨークのどこかに隠してから
それを読んでみてくれといっても、そんなのはセキュリティとは言えない。
どこにあるかわからなくしただけだ。しかしその金庫と設計図を相手に渡し、
世界じゅうのもっとも優秀な金庫破りにまったく同じコンビネーション錠つきの
金庫とその設計書を送りつけたとしても、誰も手紙が読めなかったら、それがセキュリティだ。
-- Bruce Schneier
大学のドアを開けたらそこは白くかがやくきつねの銀世界だった。
空まで薄明るい。心まで明るい。らーららーららー♪っと。そんなわけねえだろベケケ (= 「馬鹿か」)。
てくるで、へれんのオフィスの本棚が落ちたらしい。
たいして物を載せたわけでもないのにドサっと来たという。
オレの部屋にも本棚が落ちたら 1台確実に死ぬマシンがある。こわいねえ。
久しぶりの「Google で発見」。ネットにはまだまだ奥がある。
(そのキーワードをここに書いたりするもんか。それは、一種の証明なのだ)
いつもだと? いつもなんていう言葉 (= お言葉と言葉は違う、それはそれのようなもの) 使わないでほしいね。
なぜならそれはいつもではないからだ!
「私は、いつも、そのことを、気にしている」
ウソをつけクシャミする 0.5 秒前は気にしてないだろがあああ!!@
さてさて、ここにいつも人目を気にして生活しているひとりの青年がおりました
(「青」いかどうかはこの再どうでもいい)。
彼は買い物の途中で道に迷いましたので、トコヤへいきました。
すると…
(ここでサイコロをふって、出た目が整数だったら 5年前に戻る)
なんか、インドっぽい名前なんだって!
ひろびろ。
マンハッタンにおける危機。
自分だけを守るよ
キリる文字: Cilillic
すでに忘れ去られた検索エンジン Goo にも Goo Lab があった。
http://labs.goo.ne.jp/
なんかデザインがダサいなあ…。
「日本語自然文検索」で「イラクの大統領は誰」と質問すると
ほぼ 100% の確信度で「ブッシュだよね?」と返答されたので笑った。
おまえは正しいよ!
だから「この回答が役に立った」と送信しておく。
ふうほう。今日もだんだんとサムくなり、オレはハラがへったぜよ!
理解よりも 誤解 のほうがやさしい。
したがって、残念ながら、人に理解させるよりも、人に 誤解 させながら生きたほうがラクなのだ。
これ、わかる??
さいきん、残り物ゴハンが多いなあ…
いま、窓の外を象が跳んでいった。
無分別な!
よろよろん
きょうは久しぶりにセキネさんと 2時間ちかく話しこんでしまった。
まあ、基本的には「セキネさんがなにかアイデアを話し、新山がそれを叩く」という
構図である。なんか日本から研究者を沢山呼びたいって話なんだけど、
新山の意見では、いまの自然言語処理の研究なんかぜんぜん研究とはいえないし、
こんなものはそもそも学問とさえよべないし、かりに“有名な”研究者や学生を寄せ集めたところで
スゴイもんが出てくる見込みなんかない、ということである (こうなったのもみんな Google のせいだ…?)。
で、それなら完全に割り切っておカネ儲けの話をするならまだやりようがあると思うんだけど、
でも研究ってことになるとなあ。まあこれは新山の個人的な価値観による評価だから、もしも
「Google を超える技術を研究したいです!!」とかいう熱意あふれる
学生 (熱意だけじゃダメだが) がたくさんひっかかってくれば成功するかもしれないけど、
オレ自身はまったく興味がないな〜。
そもそも「Google を超える」などという、その程度のしょぼい目標が
この分野のゴールだったんですかね? あまりにむなしすぎる。
でも「うん、そうだよ」と言われて撃沈。ええ、ええ、そうでしょうとも。
そもそも、なんでわざわざ NY でやる必要があるんだよ! 軽井沢か那須高原あたりでやれよ!
と言ってみたが、これは釣りエサだってことで。まあいいけど。
とはいえ、最近の言語処理の科学からの乖離がハゲしいというのは
セキネさんも認識しているらしく、そういえば昔はタナカ先生とかも
認知科学とかに興味があったようだが、今ではそんな話はトンときかないな。
誰もかれもいちばん面白くて同時に難しそうなところはやらないのだ。が、
これは社会からの要請という面もある。評価が難しそうなプロジェクトには予算もおりない。
たぶん醍醐世代でみんな懲りたからもう大衆はだませないだろう
(こんな話はタナカ先生の前じゃ絶対できませんね)。
まあ、新山は今のところな〜んにも背負ってないし、ボスに対する義理もあんまりないので、
「ま、せいぜいがんばって」というだけなのだけど。負け犬と呼ばれようがオレはもう逃げるのさ。
そうだ、そうだ、こないだ TaOS についての論文を読んだときに思ったことが
「問題を発見することの重要さ」ということなのだ。新山はセキュリティの論文を読んだときは
ここに何か書くが、自然言語処理の論文を読んでも何もここに書かないのは、それは
どの研究成果もほとんど書くまでもない程度のことだからだ。
いまの自然言語処理では、問題はもうすでにあらかじめ決まっている。
言語処理の学会論文ってのは、さしずめ企業のお偉いさん向けに書かれた
「わが社の販売戦略の報告」に近い。「わが社はこれこれこーいう戦略をうって
ライバル社に差をつけ、こんだけの売り上げになりました」というのが延々と並んでるだけ。
でも、ゴールはいつも決まっている。もっと売れ! ということなのだ。あっそ。
これに疑問をはさむ奴なんかいない。売ってどうなるの? とか、売ると本当に幸せなの?
とか、そもそも一体、何を売っているのかという質問を
した奴は相手にされない。売れば論文がかけるのだ (でも、実際には、売らなくてもかける --
これは他の人には内緒だよ)。でも、それじゃ学術的に重要な進歩は
生まれてこないだろうな、と思う。
「そもそも『売ること』とは何なのか?」という問題をつきつめて考えた論文が
いちばんおもしろいのだ。もっとも、そんな論文はどこをさがしても載っていないのだけど。
で、とくに言語処理の場合それに輪をかけて不幸なのが日本語と英語で研究成果が
共有できないということ。米国の学生を呼ぶんならまだ救いがあると思うけど、
日本の学生呼んだってさあ、彼らのほとんどはただ「センセーに言われたことやってるだけ」
って人々だよ? (新山もそうでした、ハイ。) しかし彼らを責めるのはおカドちがいというもんで、
これが日本での学生に対する社会の期待なのであり、彼らはそれにただ応えている
だけだということは、認めなければならない。どこの会社も
「創造的な人材」など欲しくはないのだ。ホントのところは。
いやーオレもそんな単純な事実がやっと今ごろになってわかりましたわ。
遅いですね。
(追記) いや、実際には、たぶんほんのちょっとの「創造性」は、あったほうがいいと思う。
でも、ほんとに、ほんのちょっとでいい (たとえば適切なタイミングでウケるギャグを言うとか)。
ありすぎちゃダメ!
(さらに追記) しかし、この手の収束と発散の兼ね合いは、(世界的にみても) ホントにむずかしい。
たとえば一時期はやった人工生命ってどうなったんだろ?? アヤしすぎる研究は
逆に電波な人々を呼びこみ収拾がつかなくなってしまうことも多そう。大変だなあ。
へれんがオフィスを 7階に移したので、またプリンタ設定で非常時間消費。
なんで XP はこうもダメなんだろう?
授業終了。ネムかった…
そういえば今日もうひとつセキネさんにブチまけた不満がある。それは
自然言語処理の研究者の中に、その研究対象 (ようするに、英語やら日本語) を好いている人々が
実はほとんどいないということである。とくに出自が計算機科学の場合はなおさら…。
オレは語感や文字感や行間が好きなんだよ!
あるいはそこらへんにただよう意味の空虚さたる表現のその空虚さ性が
(あとこの意味不明ぶりも)。
形態素や構文木という言葉を、その罰当たり性に気づかずに恥ずかしげもなく
使う人間がいたとしたら、あまりに近寄りたくない存在だ。
行きどまりに向かって走ることのむなしさ。
「あ、行きどまりだった」ということを確認するために我々は走るのか。
なんつう非経済性yo
yo-やく Comかすとの "Premium Service" なるものを取り消したぞ。
今月から料金がへった。
お前ら、引っ越したドサクサに、勝手に追加すんなっての!
(にもかかわらず、いまだにプロバイダー料は高い。
tabesugi.net のこの回線で $43/月だよ、くそったれ)
はて? 今日はなんか、キゲンがお悪いのでしょうか??
う゛ぇつにそんなことはないよ? いやあ日記って楽しいなあ
Ky. Yr. いっぱい Ar.
てくるで野沢温泉村にはぜひとも生き残ってほしい。
古くからある地名で「温泉」なんて入ってるのはココだけじゃないかな。
電車の中でアレきょうは人がすくないなあ? と思って大学に来てみたら
今日は Presidence Day で休みだったということが判明したがそれがどうした。
きょうのマンハッタンは最悪だ。きのうグジャグジャの雪がつもったので、
場所によっては (とくに village 付近は)
排水がちゃんと整備されてないので、歩道と車道のあいだに幅 1m ぐらいの
細長い水たまりが歩道に沿ってデレーーーーっとできてる。
交差点ではそれが 2m ぐらいになっているとこもあるので
(交差点にも排水口がないのだ! 信じらんない!!)、文字どおり通れるところをさがして
あっちこっちジャンプしてまわらなければならない。車道にも著しくミじドンがたまっていなさるので、
車がスピードを出して脇を通るときには車道からとっても離れなければならない (変なニホン語)。
もぅー、最悪。
おまけに空は曇って霧雨かあるいは霙 (みぞラー) のようなものがちらついている。
きょう一日とけないのかな。人通りも少ないし。
ちなみにきょうは nylug ミーティングがあるんどあ。
(←「あるのだ」と打とうとして間違えた)
するほん酸。
Oren's Coffee に寄ったらカードのスタンプが満杯になっていることを指摘される。
いったいこれ、いつからためてたんだっけ? かなり時間がかかったような気がするが…。
きょうはまた 1 から始めるのでここに記しておくので次第。
午前中は David の照応解決器をなんとかしてこっちのマシンで動くようにしたが、
こいつに与える入力データ形式がよくわからず中断。
ちなみにこれは Ralph が書いた Jet システムの一部で、
全体のソースは Java で書かれており、コード量はすでに3万行をこえている。
これに MaxEnt のパッケージや Collins の java 実装を加え、
さらにあれこれワケわからん jar ファイルを追加してようやくビルド可能に。
たぶん新山のシステムは 10近くのこうしたソフトウェアに依存している。
で、それらは組み合わせることなんか全然考えられていない、つうかそもそも
それが開発されたマシン以外の環境で走ることなんか想定外なプログラムばっかなので、
それらをひとつにまとめて、特定の環境で動かすだけでかなり苦労する。
さらに、こいつらの入出力形式はてんでバラバラなのじゃよ。
だから途中であれこれ変換スクリプトをはさむ必要がある
(これは Perl + Awk + Python + sh で混合攻撃)。
しかも、書かれている言語はみんな違うのだ:
ほとんどの場合、コードにはこちらで手を入れないと動かないし形式も合わないから、
ソースをもらってきて改造するのだが、新山が研究をするためには、最低でも上の 5、6 の言語は
すべて実用的に読み書きデバッグできるレベルにないと話にならない。
べつに趣味で沢山の言語を知っているわけではなく、知る必要があるのである
(おまけに、どれも新山が好きな言語じゃないという不運)。おまけに、
ライブラリがまたしっちゃかめっちゃかで、あるものは expat を使うし、あるものは独自に sgml を解析するし…。
こんなのってアホらしいよ!
唯一の救いは英語だから文字コードの違いを考えなくていいということかな。
しかしデータ形式は S 式だったり、SGML だったり、ただのテキストだったりするので
そこらへんの処理はめんどくさい。ついでにいうとコーパスの形式もまちまちで、辞書とか
学習データの形式もまちまち。
ま、こんなことにグチってもしょうがないけど、
これじゃあグチりたくもなるじゃないですか…
いつでもオレの仕事はインテグレーションが一番大変、ってのが多いような器(き)がする。
これは前世の悪業がもとで与えられたバチか何かなのか?
腹へった
(追記)
しかし、一方では、こういう低水準なメカニズムをまったく知らずして研究者たる資格はない
(と、いうか、新山の意見では、あらゆる計算機関連の仕事をする資格がない)
と思っているので、ある意味ではこれは意図的なものだ。
ま、オレはあきらかにどうでもいいことに首をつっこみすぎだと自分でも思うけど、
これは geeky な人間に定められた宿命とでもいうものだよ。
つうか、そもそも「オタク」という語は、中森明夫が使っていたときは
圧倒的に否定的なイメージだった (らしい) のだが、いったいいつから
"hacker" や "geek" の意味の一部をとりこみだしたんだろうか?
…そういえばまえに部室かどこかで「オタクというのは完璧主義だ」というような話が出ていたな。
完璧主義というのとはちょっと違うと思うのだが…なんだろうこれは?
つうか、新山の場合は「興味があるところを掘り下げていったら、
自然に多くのことを知る必要にせまられた」というかんじなので、
自分としてはただやるべきことをやっているにすぎない。
むしろ、「プロ意識」というのはそういうもんだろうと思う。
(まだ新山はプロになれていないけど!)
「自分の専門分野」というものを決めて、そこから出ないように生活する、
というのは到底まじめな生き方には思えない (なぜか日本では好まれるが) 。
なぜなら、そんなに厳密な境界を決めることは
本来不可能だから。そもそもオレが留学しようと思ったのはべつに留学がカッコいいと思ったからではないし
(実はそれはちょっとある)、べつに海外暮らししてみたかったわけでもないし
(実はそれもちょっとある)、ただ単に「必要だと思ったから」なのだ。
これは程度の問題だが、必要とあらば専門外のことでも首をつっこむし、
留学だってするし、なんでもやりまっせ、という覚悟のようなものが新山の追求する方向である。
それで時間ぎれになったらかなしいが、ま、人生は長いんだし大丈夫でしょ。
現時点でそれをできているかどうかはわからないけど。まだまだだよな。
(そもそもオレが本当にやりたいことは自然言語処理なんかじゃないのda,
あんまりボトムアップにやってもあれなんで、
それまでに疲れ切ってしまわなければいいんだけど…)
大学には人はいないが、メールはあっちこっちから来る。
みんな仕事はしているらしい。
Google のランキングでマーケティングをするやつ発見。ふーん、ああやるのか。
ダガトキニハタノシクナイコトモ
nylug みーてぃんぐ。Novell に買収された元 Ximian のひと?
今日はたいして技術的な話でもなく、そんなに面白くなかった。
おもに Novell のオープンソース動向のようなものを話していたが、
いま Novell で開発がすすめられているアプリケーションを 2つ紹介していた。
ひとつは Hula (ふーら) で、
これは GMail スタイルの WebMail サーバである。自身が httpd 内蔵、
IMAP, POP3, LDAP 対応、そして Calender 機能塔載で、これは CalDav を経由することにより
将来的に Evlution や Thunderbird、 Outlook と連携できるようになるそう。
でも、「ふ〜ん、そう。」って感じなんですが。SMTP サーバの機能ももっており、
OpenSSL 以外はぜんぶ自前で用意しているらしいが、こりゃまたデッカくてワケわからんもんを
やりだしたなという印象。なんでトランスポートまで自前でやるわけ?
スケーラビリティのため?? 使いたくねー。日本語対応については興味もないし聞かなかった。
つぎは Tomboy というやつ。
こっちのほうがおもしろいかもしんない。これはようするにデスクトップ上の PostIt
(Mac ユーザ向けの用語でいえば「スティッキーズ」) に Wiki の機能を加えたものなのだった。
WikiName を入力すると自動的にその名前で新しいウィンドウが開く。また、
これは Gnome 版デスクトップサーチともいえる
Beagle と統合されていて、
Dashboard に単語を入力すると対応するウィンドウがポップアップする。
ま、これも凝ったインターフェイスではあるが、やはり新山にとっては
「ふ〜ん、そう。」である。なんしろオレはデスクトップという概念が全然必要ない人間だからな。
あまりありがたみがわからない。飲み会でもうちょっとツっこんだ話が聞けるかと思ったら、
この人は開発者じゃないそうなんで、じゃあいいやってことで、さっさと退散。
しかし、こういうアプリケーションではつねに感じることだが、
あいかわらず日本語などの言語はほとんど眼中にないという印象。
いっぽうかの国をみればいまだに「日本語をインデックスするには形態素解析が必要」などと
もっともらしい顔でいってる人々の多いこと。なんでみんな黙ってるんだろう?
それはおそらく、どうでもいいからなのだろう…。かくいう新山もどうでもいいので以下略。
もう道路の雪はだいぶとけたが、明日もサムそうだなあ。
(Broadway や Madison Ave. など広い道では除雪されているが、細い道にはいるとあいかわらずだ)
夕方に軽食をとったので晩メシを食うほど腹もへっていず。
豆腐があまっていたので豆腐素敵にしようと思ったが、つくりかたを知らなかったので
「こんなモンは小麦粉つけて適当に焼きゃいいだろう」と思ってショウガと一緒に
醤油をつけて焼いたら、小麦粉がこげてまっくろになった。失敗じゃ。
てゆうか油がすくなすぎたんかしらぬ。
でも、ま、味はそんなにひどくなかったので。
そういや、豆腐ステえキって片栗粉がいるんじゃなかったっけ?
(あ、それは揚げだし豆腐か??)
しかしこういうものを作ると真面目にサケ (日本酒) がのみたくなった。
新山はふだん自分から酒を飲みたいと思うことはほとんどないのだが、
これはご飯のおかずにはちょっとあっさりすぎるし、なんかキツいものを
飲まいと合わなそうだからねえ。どうでもいいが、新山は熱燗がのめない (臭くて)。
聞かれもしないのに書きますが、日記なんてそんなもんた。
はーっはっはっは
はーっはっはっはぁ
ねむいぞこら
^ up
< 2月 (2) へ。
Yusuke Shinyama