… 3.7 になったので、いちおう index.html だけは更新したが、 あいかわらず何の動きもなし。終わっとる。3.7 から SHARP Zaurus が正式サポートになったらしいが、 これ、日本でしか売ってないのに (しかも表示はぜんぶ日本語)、 外人がガンバって日本語解読してインストールしてるのな。すごいよみんな。 それにひきかえ日本のおとなしさは一体なんなんだ。まえに翻訳チーム宛に 「Zaurus サポートしたんだけど、日本人からなんかコメントない?」という通知がきたが、 だれか応答したのかな。日本人がアホなわけでは決してないのに、 あまりにひっこみ思案すぎるせいで、海外からは「奴らは、ただ結果を吸ってるだけ」と思われるとしたら かなしいもんだ。
どうでもいいが、OpenCVS はいつリリースされるん??
Naist のイメージ (語感的):
Jaist のイメージ (語感的):
…というわけで、語感的にいえば、「ジャ」のおかげで jaist のほうが naist よりはるかにインパクトがある。 しかし同時にアヤシゲな雰囲気もあるわけで…。 名前があるというのはいいことばかりではないわなあ。 それにしても、「じゃいしょく」というのは数ある Jaist 関連の名詞の 中でもおそらくトップクラスの衝撃度をもつと思われる。 新山はすでに「じゃいしょく」でメシを食った経験があるので、 jaist にはもう行く必要性を感じない。
てくるで (ところで) 奈良を「ナラ」と呼ぶのはじつはほんとうに 渡来人がつけたからという説があるらっし。おおいにアヤしいが…
あしたの予定:
なんだかつかれてるようだ。つまりカタカナが多い。
(さいきん某所での影響が顕著に現れているような気のする、そういうオレは Python ユーザ)
てくるで (ところで)、次世代 DVD の規格まで米国様のご決断をうかがう日本人は よっぽどアメリカン (とあめりか映画) が好きなんだね…。
char*
に落とすしかないんじゃない? Boost には tokenizer があるようだが、
たいして楽にならなそうだし、STL でも word << string;
とかいう操作が
できたらいいのだが、どうやらそんな仕様はないらしい。
C++ におけるこの手の非一貫性にはうんざりだ。三流言語。
C++ でなによりも謎なのは「デバッグ過程」である。テンプレートと pthreads と例外を
使いまくった C++ のコードを gdb でデバッグできるやつはこの世にいるのかね。
(地獄にならいそうだ。)
(追記: もしかして、strstream を使えばできるかも? と思ったが、飽きたので無視)
あやしかりける。$ dnsq ns visa.co.jp a.dns.jp
てくるで、うちの駅前で毎朝配られているフリーペーパーには以下のものがある:
「数回前の hackathon からスローガンをつけたんだが、 それは『黙ってハックしやがれ』というものだ。だから hackathon はふつうのカンファレンスとは違う。 人々はぺちゃくちゃおしゃべりするために集まるんじゃない。プロジェクトがすることをするんだ。 他のプロジェクトではディスカッション会議をするところもあるが、俺ならそんなのは talkathon と呼ぶだろうね。 俺たちは議論はしない。ただやるだけ」
いまさらな話だけど OpenBSD はきわめて体育会系っぽい、汗くさいコミュニティだと思う。 この「とにかくひたすらコードを書け」というのは部活の夏期強化合宿と変わんない。 しかしこのストイックさにはある意味惹かれるものがある。 ほかのプロジェクトじゃこんなことやんないもんな。 Theo は実際に会った人間しか信用しない (cvs アカウントをやらない) という噂もあるし、 OpenBSD がかなり団結しているというのもうなづける気がする。 そして毎年これでほんとうに OpenBSD が強化されるので、まさに強化合宿というにふさわしいのである。
)このペエジをこれ以上バカらしく見せないために一部削除しました。(
ピザが救急車よりもはやく届くのはアメリカだけ!!-- UrbanDictionary/America
「それで、John Dvorak って一体誰なんだ?」
「Dave Qwerty の有名な競争相手だよ」
あー今日はもう翻訳できないな。頭ボケてて
ひさびすりにfrom __future__ import generators False = 0; True = 1 def enumerate(seq): i = 0 for x in seq: yield (i,x) i+=1 return
from __future__
なんて使っちまったぜ。
どうでもいいが、このペえジで「ひさびすり」という言葉に慣れてしまったために、 いまや実生活でも思わず「ひさびすり」って言いそうになる。自分の掘った穴に自分で落ちるの図。
$ cd /src/net/mozilla $ nice make -f client.mk MOZ_CO_FLAGS=-PA MOZ_CO_TAG=FIREFOX_1_0_4_RELEASE
でもこれ、cvs-mirror.mozilla.org が偽装されてたら元も子もないよな。 ssh 経由じゃなくて pserver だし。
仕事に戻りましょう。。。
(追記: しかし、たまにプログラミングのできるやつがいると、 ただの「実装君」になってしまうのだそうな。なんでこう両極端なんだ)
乾燥を書いておくと、たいして面白くなかった。途中から見たので ストーリーがよくわかっていないのだが、にもかかわらずなぜ最後まで見れたかというと、 絵が本当にスゴかったからである。だから絵画鑑賞としてはオッケー。 でもスゴいのは絵だけだった。 あいかわらずじつに日本的というか、細かい技術力はトンでもなくすごいのに、 全体としてみるといいモノをつくれてないよね。「人間がロボットを差別する」というネタもいかにもお約束的だし。 でも手塚治虫はある意味そういう「お約束」を世の中で最初に確立した人かもしんないから、 ここでお約束をくり返してみるのは (彼へのオマージュとして) 意味のあることなのかもしんない。 なにがオマージュだ笑わせるな馬鹿野郎。菓子の名前か? DDI (どうでもいい)。 で、人間とロボットは結局和解したわけ? しかし根本的な問題は何も解決されておらず、 あんなんじゃまた 30年後ぐらいには同じことのくり返しだね。 …この手の差別というのは、差別する側にとってみれば人種差別とまったく状況は同じである。 そして人種差別が永久になくならないように、ロボットへの差別も (かりにできたとして) 永久になくならない。人間というのは学習しないのだ (たかだか数十年ぐらいしか生きられないうえに、毎年なーんも知らないガキがぽかぽか生産されてくるんだから、 どうして長いスパンでの「学習」が可能だろうか?)。 しかし、学習しないところが大事だとも思うのである。 かりに「記憶が遺伝する」種族というのが存在して、前世の記憶をすべてもって生まれてくるとしても、 そんな人々はきっと生まれたときから世の中のすべてにおいて達観していて、 恋愛とか結婚とかもしなそうな気がする。だから種としては長くは続かないんではないか。 結局、人間というのはいつまでも学習しないから、日々、車輪の再発明したりして楽しく生きていけるのだ、 ということになる。オレはこれからも絶対に学習なんてしねえからな。
科学や技術においては、人間は本当に「進歩」しているのかというと、 ま、これは新山の周囲だけの話かもしれないが、学会などの状況をみるにつけ、 この言明もあやしくなってくる。文学や哲学は「進歩」したのだろうか? 言語学は? 科学や技術が進歩したからといって、すべての人間がそのステップを 理解しているわけではない。消費者の立場でみれば、鎮痛剤を飲むのと祈祷師に頼むのに どんだけ差があるというのだろ。
アメリカ人のいう匿名と日本人 (=とくにツウちゃんねる) の匿名はじつは まったく質が違っている。アメリカンのいう匿名とは「身元はわからないが、 なにか強烈な意見を言う」という使い方だ。これに対してツウちゃんねるの場合は、 匿名でなにか新しいことをいうわけではない (99% の場合は)。 つまり、アメリカ人は匿名でも他人と区別されることを望むが、 日本人は逆に匿名を「みんなと区別がつかないようにする」ために使うのである。
たとえば、アメリカ人 A 氏の匿名投稿というのはこんな感じだ:
これに対して、日本人 B 君の匿名投稿はこんな感じになる:
ようするに他人との差異を強調するのではなく、 他人との差異のなさを強調する。 はっきりいって、ここではべつに B君は書きこんでも書きこまなくても あまり世の中に与える影響に違いはないんだが、なんだろうね、これは。 目的が「情報の伝達」ではないと考えればそれはオッケーだ。 いや、きっとたぶん目的は心中だ。 (もうワケわかなんくなってきたのだで意味冥府)
こないだの lispnyc で聞いた話を思いだした。 あるプログラムを開発して、自分ひとりで使う労力を 1 とすると、 それをオープンソースで公開するまでの労力は 10倍以上になる。 ドキュメント整備やらなにやらが大変だからだ。新山の場合はべつに 共同開発をするわけでもないし、ただ「webページに置くだけ公開」なので さすがに 10倍はかかんないかもしれないけど、それでも気をつかうことはたしか。 とくに cgi のような本質的に危険なコードを公開するのは気をつかう (できればやりたくない)。
かうもの todo: めんつゆ、バター、乾燥パセリ、海苔、オリーブ油
てくるで、sentence splitter の性能がよくなき。"〜" で囲まれてるところがマズそうだ。 それと、文頭にある余計な地名を取ってしまう。これはその前の preprocessor の問題。
てくるで、大井競馬で 1300万円の大穴が出たそうだが、 大井競馬ジョーってまだあのキッタならしいところなんだろうか。 ところで「馬番より枠番連勝のほうが配当が高くなる」という奇妙な現象は、 仲間うちで「大井った」と呼ばれていたが、これが地方競馬で一般的に見られる現象なのかどうかは不明。 ちなみに学生および未成年者の馬券購入は法律により禁じられています。 でもギャンブルが好きな人って、あんまし理解できんよ、ホントに。
空はカラリと晴れわたり雲ひとつない。 気候は乾燥していて涼しく、こんな天気がずっと続けばよいのに…と思わせる。 まあここには梅雨がないからしばらくはこんな感じでじょじょに暑くなっていくわけだけど。
.
いやあ、秘密を持つって大変なんですね
(急にダークなことを話し始めるまでの間が大切)。
MUSIC IS NOT TOO LOUD. YOU ARE TOO OLD.
じつは、
この四角 → ■ は
この四角 → ■ よりも、画面の奥にあります。このことを照明してください。(50点)
ほんたぅーは (本当は)、 もっと早くにかえるつもりだのたっがだ (もっと早くに帰るつもりだったのだが)、 某所から電話がかかってきて 1時間ちかく愚痴につきあうはめに。 いやーー、向こうも大変そうだなあ (人のこといえないが)。しかし新山は、もともと 「大企業というのは優秀な人を集めてバカなことをさせるところだ」 という印象をもっていたが、最近その印象はますます強まる。 やばいなあ。社会に出る前にすでに社会不適合社になってしまうよ。 なてしまうよ。なてしまうあるね。ゼンジー上海。
LATimes のレイアウトが変わったので、きのうからずっと webstemmer を走らせていたが、 2,400ページをクラスタリングするまでに 10時間以上かかった。quadratic の悲劇。 まあ、こんなことはそう頻繁にはないだろうと思うんだけど…。 Webstemmer の弱点は、サイト全体がレイアウトを一新したときに まったく何も取れなくなってしまうことだ。そして、この一ヶ月は改編期だったらしく、 じつに多くのサイトがデザインを変えた。NYTimes も変わったし、Washington Post も変わった。 NYPost はログインが必要になったし、Boston Globe も変わった (つまり新山はこれらのサイトから毎日記事を集めているわけです)。 Google News や Columbia の Newsblaster などは 「どのページが記事か」を判定するのに 絶対 TDT っぽいやり方で記事ごとのクラスタリングをしているに違いなく、 オレもそれをやればいいのだが、今のところめんどくさくて実装してない。 だいたいクラスタリングっつーのは面倒くさいんだよ。論文が沢山出ているが、 結局のところ、ここからわかるのは決定的な方法が存在しないということだ。 だからアプリケーションごとにあれこれ違うやり方を試さねばならず、 オレにはそんな暇はないのである。 奴ら (Columbia の連中) はあれ自体がでっかいプロジェクトだし、 おまけに専門のプログラマーまで雇ってるじゃないか。別に新山は あれと同じことをするわけではないけれど、一人でぜんぶやるのはきついよね…。 誰か手伝ってくれるっつうなら話は別だが。うちのグループの誰も いま新山のやってることの全体象をわかってなさそうなので、 それはあきらめている。まあ博士学生らしいといえばらしい。 にもかかわらずあんまりオレが悲哀を感じないのは、適度に狂っているからだろう…。 (おそらくほかの人は新山を見て「痛ましい」と思ってるのかもしれないガ)
てくるで、最近自宅の 80/udp に PlanetLab からよくアクセスがくるんだけど、なんでだろう。 udp なのよね。 それとここ数日になって、53/udp に (おそらく) DNS 問い合わせがくることが異常に多くなった。 うちでは DNS を出していないのにである。なにか新手のワームだろっか?
で、思ったんですが…。
きょう、ある新聞記事で、「『国が公表したデータなのに、誤りがあるのはおかしい』と怒る会社員(30)」 という一句を発見して、非常にアレだと思いました。なーんか、コイツのほうがおかしいよな。 「国が公表したデータ」 = 「絶対に正しい」という思いこみはどこからくるんだろう? そりゃ国が公開したんなら正しい確率が高いだろうが、 お役所だってミスはするだろうに。ときどき思うのだが、日本人はよく 「相手が絶対にミスをしない」という仮定を置いて行動しているように見える。 日本の完璧主義に慣れてるとそうなるのは理解できるけど、これはとても危険ですね。 日本人の平和ボケというのは、他国に攻めてこられないという「国際的平和ボケ」もあるけれど、 すべてのものが完璧に動くと思いこんでいるという「日常的平和ボケ」もあるわけです。 いざというときに全員パニックしそうだよなあ。もともと日本人つうのは集団で パニックしやすい国民性なんではないかと思える。
TODO: 花かうこと。先週の花は失敗だった。やっぱ、あんまりパッパラパーな雰囲気の (= 枝分れが多いということ、一本差しには向かない) 花をかうべきじゃない。
Subject: Dissertation Assistance Dear Yusuke: Please allow me to introduce myself. I am writing to let you know that I have been providing thesis and dissertation support services for graduate students in the social and other sciences for over 20 years. ...
ようするに「あなたの博士論文をお手伝いします」というものだ。 このアドレスは博士学生の一覧から取り出しているのだと思われる。 ばーか、手伝えるもんなら手伝ってみやがれ!
てくるで、 AbiWord-2.3 には文法チェッカがついたらしい。 Link Parser というのは妥当な選択に思える。 こいつはためしてみる価値があるな。
誰かが Slashdot で言っていたが、自然言語処理をやっている人間は こういう実用的なオープンソースプロジェクトはほとんどやらない、という。 思うに、言語処理家 (あれ、誤変換だ) というのは工学屋じゃないと思っている人が 多いためじゃないかと思うが、かといって連中は科学者でもないんだよな。 中途半端な存在。
どうでもいいが、日本ではなぜ risks や crypto-gram のような 記事をかく日本人がいないのか (Risks に投稿してる有名人 2人はのぞく)? crypto-gram については日経 ITPro が翻訳しているらしいが、 ごく一部しか訳されてないし、しかもセンセーショナルな記事だけを翻訳している。
そのあと家へ帰ってきて夕食は久しぶりに肉じゃが。 …のつもりだったが、なぜかダイコンが余ってたので、それを入れたら 肉じゃがとは別のシロモノ (だいぶつ) になった。どちらも煮るとあまり区別がつかず、 ジャガイモかと思って口に入れるとダイコンだったりするので、なかなかマルコフ連鎖 (意味不明)。そぅーーいえばむかし東工大で 「だいぶつ先生 (大佛先生)」って読まれてる (べつに呼ばれてるわけではない) 先生がいたなあ。 どーーー−−でもいーけど。
さらにどうでもいいが、SOHO の AppleStore にある「天才バー」は いまや 6am 〜真夜中までオープンするようになったんだそうな。 Apple はなんでこなに必死なのだろう? それほど Mac はブっこわれるってことだろうか。まあ、正しいけど。
きょうの写真: