雲は曇らない。
しかし Python は数少ない「ひとめぼれできる言語」のひとつだと思った。 Scheme にもそういうところはあるが、Python のほうがなんとなくフラ〜〜と自然に入っていける。 Perl や Ruby や C++ は好きになろうと努力しなければ おそらく絶対好きにはなれない言語だ。結局、日本で Ruby が異常に流行っているのは 「自分自身の感覚をアテにできない人が多い」というだけのことにすぎない。 彼らは他人からプッシュされたものでないと使う気になれないのである。 これはとても気の毒なことだ。 ま、ファッションも音楽もすべてマスコミに流行らされる国だからよ、あすこは。 しかしひるがえって、なぜ自分はそうならなかったのかを考えるとわからない。 やっぱ親の影響だろうか?
さいきん、美術館やギャラリーめぐりをしていてわかったのだが、 じつはオレは抽象絵画がわりと好きらしい。結局のところ美術館というのは、 美術作品を見に行くというよりも自分自身を見に行くところなのだという気がしてきた。
世の中を SF的にながめる人とマンガ的にながめる人。 オレは後者のほうだ。いや、降車のほうだ。
__強調__
しておきたい。
てくるで、日本じゃノーネクタイとか言ってるらしいが、 日本がどれほど CO2 を削減しようととなりの中国と米国からガッポガッポ出ているのに、 それって何なの? ただの誤差じゃん!
どうでもいいが、Google News で「県別ニュース機能」ってのがあると便利なんだけど… (べつに Google News でなくてもいいのだが、誰か個人でそういうサービスをやるやつがいてもよさそうなものだが)。 Asahi.com のマイタウンや地方新聞の記事ばかりを集めるのである。オレは地方版のニュースに 興味があるんであって、全国版の記事なぞどうでもよいのだ。 しかし、いまの Google のやり方じゃ無理だろうな。データすくないし。 それに、米国版 Google でさえ実現されてない機能を日本で実現できるワケがない。 もともと米国の新聞は全国紙のほうがマイナーで (USA Today 以外にどっかある? CNN なんかは web だけみれば全国紙っぽいけど) 地方新聞が普通だから、 たぶんアメリカ人には「全国紙のなかの地方版」って考え自体が理解されなそうだ。
ところでさあ (ほろこでさあ (てくるで))、
「道草を食う」ってのは
まさに馬が道に生えている草を食って先に進んでくれないことからきてるんだね。。。 ・・・。
ちなみに新山はこの論文が終わったら激ヒマというわけではない。 べつの仕事があるのだ。そっちを早くやんなきゃいけないのに、くそーーーー。っ
あまりモーモー言ってると牛になります。
私たちは科学的な人間であるので、このように物理的な本がたかが数秒でその内容を 変えたりすることはありえないと信じている。
つまり、あなたがこの数秒のあいだにすっかり変わったのだ。変わってしまったのだよ
「ホっん」ってどうやって発音するんだ?
けっきょく (ケッキョキ)、いまだに論文を書いています。 あぁーーもうオレってば頼まれるとイヤといえない性格なのよねーーーこれ損。 しかしグチりたくなる欲求はとどこおるところを知らず (まちがい日本語)。 なにがムカつくかというと、結局 (ケッキョキ) この論文書いても だれも幸せにならないからだ。オレはこれがつまんない論文だと 信じているし、こんなの面白いと思うやつがいたらどうかしている。 去年 coling に論文出したやつは、まだごく一部の人にはウケるだろうという 確信があった。しかし今回の論文にはそれがない。誰も面白いと思わないのに投稿。 せめてオレ自身が面白いと思ってられりゃいいけど、それすらないのだ。 これが不幸でなくて何なのだろう。しかしもうひとつの「義理」という制約があるが、 いったい誰のための義理なんだよ?? 主催者のヤマモト先生は論文集まらなくて 困ってるらしいけど、人気ないもんはしょうがないんだから、 もうそういう結論にしちゃえばいいのに。わざわざ水増し用論文を 送ることがまともな解決策とはとても思えない (しかし、まー、社会に出たらこんなことはよくあるよ、と言われそう)。 てゆうか、この手の 学問領域におけるマーケティングって好きになれないんですよ。 伝聞によれば、言い換えについて最初にあれこれ騒ぎ出したのはサトウ先生らしいけど。 日本にいるときからそういうことは山のように見てきたが、 それで本当にスゴいものが出てきたためしってないでしょう。 ただどうでもいい論文が無駄に生産されてきただけだよね。それとも、あるの? あるいはこれは秋葉原でみんなどうでもいい電化製品を買ってるのと同じように、 これは経済活動の一種と考えればいいんだろうか。しかしほとんど税金でやってるのに 経済活動もねえだろうと。個人的に新山は (基礎研究をおこなう) 研究者というのは 生活保護を受けてる人と立場は一緒であり、それ相応のつつましさが必要と考えている。 まあ、もっとも自立して働いてる人がつつましくなくていいか、というと、 そうも思わないけど。でもアメリカからはいくらでも搾りとって OK だと思います。
帰宅後、中華料理テイクアウトをむさぼり食いながら論文を手直し。 つーか、なんとか書き直したが (全部ではないが)、 あいかわらず自分で読んでも面白くない。なにより恥ずかしいのは、 基本的な手法が 2年前に出した論文とほとんど変わってないことだ。 ただ細かいところをうだうだやってるだけ。お前なあ、 そんなことをなあ、2年もやるなっつうの。 どうせインチキなんだから! と、おもわず自分に言い聞かせる。オレは聞いちゃいない。まったく
この前とって忘れていた写真など:
ま、今までずっとそう思いつづけているのだけど。 これはナンとかなっているのだろうか? そもそも「ナンとかなる」って何がどうなるのよ??
まあ、はっきりいって、新山が中国人に親しみをもちだしたのは ニューヨークに来てからのことである。まえから興味はあったし中国人ともわりと話す機会はあったのだけど、 日本にいるとなにかと差異ばかりが強調されがちな 中国人や韓国人だが、こっちにいると白人や黒人とくらべて圧倒的に親近感を感じる。 それはなにか理屈をこえた感覚であって、ほとんど「血の近さ」とでもいったもののようだ。 いっぽう NY にいる日本人はみんな日本にいる「ふつうの日本人」のような カッコをしていないので (みょうに気取ってるか、黒人ファッションを真似てるか、 あるいはどっか狂ってるかのどれかだ)、チャイナタウンにいるとまるで日本の どこか田舎の街で見るような顔を見ることができ、そこがとってもいい。
さて、大学に来るとセキネさんから論文の内容に関するメール (というか、文句) がきた。 よーするに、「こんなんじゃダメだから全部最初から書き直せ」といわんばかりの 内容であった。締め切りは 3日後である。
でももうそんなのやりたくないんですよ。どうしましょ。
しかしこれだけじゃ確率は出ないので、けっきょく表をみて確認した (だせー)a = [1,1,1,1,1,1,1,1,6,16] b = [0,0,0,0,0,0,0,4,2,17] sa = sum(a) sb = sum(b) ss = float(sa+sb) t = [ a1+b1 for (a1,b1) in zip(a,b) ] ea = [ t1*sa/ss for (t1,a1) in zip(t,a) ] eb = [ t1*sb/ss for (t1,a1) in zip(t,a) ] chia = [ (a1-e1)**2/e1 for (e1,a1) in zip(ea,a) ] chib = [ (b1-e1)**2/e1 for (e1,b1) in zip(eb,b) ] print 'df=', len(a)-1, 'chisq=', sum(chia)+sum(chib)
ジツハコンナニアッタ。やってらんね
つまり、記事をクラスタできなかった (=類似記事がみつからなかった) ニュースだけを集める。 こうするとマイナーなどうでもいい記事ばかり集まるニュースサイトができるに違いない! うわー、それってすげえ楽しそうに思えてきた。しかし実はこれは Google News よりも 格段にムズいだろう。なぜなら、クラスタしないってことは、それだけノイズが多く乗るってことだから。 これはほぼ確信しているが、Google News ではクラスタリングによってどのページが 記事かそうでないかを分けている。つまり 「複数の新聞サイトでより多くの類似ページがみつかるページ == 記事の可能性高し」 という判定方法なのだ。だから数が少ないデータに対してはおそらくかなり弱い、 というか、ほぼ無力だと思う。もともと Google って数の暴力に頼ってるダケだからな。 現在、地球上で使えるデータを好きなだけ使える立場にいてもあの程度、 というのを見せつけられると、まあいろいろ考えさせられるものがある。 たぶんもう精度的にはあれで頭打ちって感じなので、彼らの残る武器は JavaScript だけか…。
てゆうか昔は Google サーバいっぱいもっててすげえなー、と思ってたんだけど、 いまやどこの企業でも数千台のクラスタぐらい当たり前に持ってるということを知り、 にもかかわらず大したことやれてるわけでもないというのがわかって、結局これからはもう 「量で勝負」な時代じゃないんだ、ということだ。 まあ、新山はそんな世界にはもとから興味ぬいので、ある意味これは期待どおりであるが、 周囲にはまだ「量で勝負」な人々がいっぱいいる。これがアメリカンな方法として 世界じゅうに広まっているとしたら、あまりに罪な国だ。
へえー。こんなのあるんだ?
しかし、集中できないときにはどこに行こうと集中できない。
りす君が目の前の木でもそもそやってる。こいつはシッポがでっかいので、 そしてそいつがモサフサと動くので、さしずめ木の上に巨大な毛虫がいるかのように 一瞬見えるあなたはきちがいだ。
ズーっとなにを悩んでいるかというと、いま書いている論文における 「一貫したテーマのなさ」についてである。…
ほかの研究者が何と言おうと、新山はすべての学術論文には一貫した主張というか、 問題に対する筋のなにかとおった切り口、あるいはスタンスのようなものが必要だと感じている。 つまり、なぜ、いま「その問題」を扱うのか? その問題はどこから生まれてきて、 なぜそれが重要で、そしてそれを解くことによって学問分野にどのような 貢献があるのか? こうしたことをふまえて、論文の結果をこの分野において特定の部位に 位置づけるようにしなければならない。そしてその立場は一本の論文の中では 一貫していなければならない。でないとうまく文章に流れが出ないのだ。 実験結果が出ても、ただその方法と結果を 書くだけではだめで、それに正しい意味づけを与えてやらねばならないのである。 すくなくとも、そう努力はすべき。前はこんなこと気にもしなかったのだが、 さいきんとくにそう思うようになってきた。この日記と同じように、 論文にも「オチ」が必要なのでありますね (まあ、この日記のオチがわかる人が この世にいるかどうかはおいといて)。そして、それはなにか 「新しいこと」でなければならない、と思う。だけど今回の実験には とくに新しい切り口なんてないのよ〜〜〜♪ (こう書くと歌っているように見えるが、実際そうである。ウソ) だからすでに出てしまった結果に対して後からこじつけを考えねばならず、 それが大変に後めたい。経済学者と同じで、はっきりいってこんなもんは 後から解釈しようとすればいくらでも言い訳は考えつくものだ (オット)。 でもオレはそういうのはイヤなんだよ〜〜〜““““。今週はかなりこのせいで ストレスがたまっていた。あと数日間せいぜいグレてやるから。
でんでん関係ないが、「カルザイ (Karzai)」と「ザルカウィ (Zarqawi)」の区別がつく人います? いや、いませn. 英語でもつかねえ
さらに関係ないが、ザルカウィのヒゲ面写真をみて「泉谷しげる?」と思った人はオレ以外にも500億万人ぐらいいるはずだ。
<Br>
「コッキイだって?」
「うん」
「コッキイか…」
「うん」
「そういえば君は云ったね?」
「うん、そう」
「それだと。」
「それか…」
(ここで雨が落ちてくる、1杯2杯と)
「明日は曇り空だな」
「ろが曇りと曇り空は同じでないそれはよく考えてみればわか」
「どうしたんだい? かっこ疑問。」
「どうしたんだい? かっこ疑問」
「きみが ACK を送信するまで待っていたらずぶぬれになったじゃないか! どうしてくれる羊羊羹羹」
「この開けたヨウカンを…」
「明日も曇り空か…」
「さてみなさん」
「とりもなおさず」
だけども金がなかった。鉛もない。 それは明け方になればわかるかもしれないが、どのみち今日はもう日が暮れている。 あいかわらず時計の梁は吹きつづけているので、きょうは家全体で時間を計らねばならない。 これが炊き上げに要する影響を加味するには時間が必要だ…つまり、時計がってこと。 ケーブルからもれ出る電磁波が紫色に見えたとしたらそれはあなたにとって責任です。
ひさしぶりに有意味なこと書いちまった
それにしても。
このアイデアは Saltzer の論文を読まなかったら出てこなかった。 やっぱ偏った分野の論文しか読んでないとダメだと思う。現在のたいていの自然言語屋は
どうでもいいが、例文を説明するときに他に人名が思いつかなかったので (Alice, Bob, John, Fred はすでに使用済だった)、 おもわず "Ami" と "Yumi" を使ってしまった。敗北だ。 これ以上の敗北がありえようか (“いや、ない”・大合唱)
アメリカ人は総じてフレンドラーだが、中にはそうでない人も沢山いる。 フレンドリャーは名古屋人。
ところでハンソデとハンソロって似てるよね? 語感が。
ドアが閉まります
マモナク
ドア
あれからちっとも Traiss のソースが公開できないので、いいかげんはがゆい。 とりあえず現在のスナップショットを公開しておく。 ドキュメント一切ないのでまだ他人が見ても動かないと思うけど、 まあ一応 proof-of-concept ってことで。 まだセキュリティ的にあやしよなあ。 cgi-httpd に依存してるとこあるし…そもそも cgi 動かすのに chroot してるやつはどれくらいいるんかいな? まえに Apache でやろうとしたらタイヘンすぎて挫折したんだけど。
てkurude, 金曜日の停電は通知不徹底だったらしい。 我々計算機屋にとって、停電の日時はすんげーーー重要ですよね。 コンピュータなんてもろいもんだ。21世紀は平和な世の中になるかもしれないが (でも、ま、少なくとも今のところそんなに平和でもないが)、 まちがいなくこれは歴史上いちばん脆弱な世の中になるだろう。
もしかしてうちらは世の中をより脆弱にするために働いているのではないか? いつも思うのだけど、オレは「単純でうまくいく」ものを見つけたいんであって、 「複雑でうまくいく」ものには興味がないのだ。
一部の人びと (元ユナボマーとか Bill Joy とか) が心配するような 「機械の人間に対する優越」などということは将来にも決して起こらないだろう。 むしろ、複雑すぎるシステムが勝手に崩壊していく可能性のほうが大きい、 というかこれはほぼ確信としてある。そうなったときに、もしオレが 万が一 (?) 生きのびていれば、いったいどんな責任のなすりつけ合いを見ることになるんだろうね?
どうでもいいが次の adblock リストはかなりよく効きますね:
http://ad*
*adserv*
*adServ*
*/ad/*
*/ads/*
新山はうざい flash や javascript もぜんぶ adblock に入れてしまっているが…。
しかし実際には、この寝不足は F1 中継 を見ていたため だということが判明。 (ハハが見てたのか? 実際には父につきあってただけじゃないのか?)
親子そろって大ウソつきな家庭です。
。、 。
てくるで、彼のメールでひとつだけ許せないのは、ヤツが二人称として "you" のかわりに "u" を使うことである。一人称の "I" を小文字で "i" と書くやつはいるし、 それはまだ許せるんだが、"u" はいかん。なんか知らんがムカつく。しかしそういうヤツも 実際に面と向かって喋ってみるとべつに普通なんだが、とにかく文字には文字の事情があるのだ。 新山は日本語でも英語でもメールの文面をみてヒトを判断するが (べつに文章のキレイさや句読点を 見ているわけではない)、「ここまでなら手を抜いていい」という一線があって、 "u" はそれを大きく超えているように思はるる。つまりそれは「私」という一人称のところを つねに「 σ(^_^;) 」と書くようなやつだ。これは実際にはやられたことないけどかなりムカつくよ、きっと。 こんなこというと日本の一部の人々とは意思疎通が不可能なんかもしれないが、 別にオレは疎通しなくてもいいっす。
どうでもよろい (=どうでもよろしい) が、しかしオレはこんなふうに略語をいちいち カッコ註釈付きで書くんなら最初から略語なんか書かなきゃいいと思うのだが、 それはどうでもよろい (=どうでもよろしい) が、えーと、何書くんだっけ? そうそう、新山はどういうわけか「一人称」「二人称」を「ひとりしょう」「ふたりしょう」と 読んでしまうのだ (⇔ 読ろんでしまふ)。でもふつうこれは 「いちにんしょう」「ににんしょう」と読むのが正しいと思う (= 正統な読み方なのだと思う)。 まあどうでもよろ (= どうでもいいが)。はて? 最後の「が」はなんだ? なぜ勝手に「が」を含むんだこの野郎この野郎前置
詞。
もうも (← 「どうも」の typo) 最後が「ろ」で終わっている単語に親しみがあるようの気のする。
いや Google ってすばらしいですね。 (さいきん、日本語の検索はほとんどこんな用途にしか使ってないような気がするが)
これって曲をパターン認識してんのかね? ためしてみたいが、オレは携帯もってないのでできない。
もうそろそろいいかげんに寝ろって? うんもう寝るよ。おやみす
ところで (てくるで)、きのう「軽蔑」という言葉を使ったが、 「軽蔑」というのは「こっちが正しい」とき (あるいはそう思いこんでるとき) に はじめて使用できる言葉であって、新山のほうには正当性など何もないのだから 他人を軽蔑する四角などない。こういう場合はただ 「ムカつく」というべきだ。まあ、しかし、この感情は重要である。
return [ ev in (ev,nents) for events.iteritems() if 2 <= nents ]
まあさ、実際にはアセってどうなるわけでもないケドね…。 らっちょもねえ (方言)。
ある事情で久しぶりにアクセスログ (IP 一覧) を見てみたのだが、 さいきんまたロボットがおそろしく増えている (とくに inktomi)。 ほかにもワケわかんないところから大量 GET があった。 これがロボットの仕業なのかどうか知らないが (user-agent などはとってないので)、 試験的にページのクロールを禁止してみることにした。 これでロボット類がどのくらいまで減るのか興味ある。
ところで、IP 一覧におかしなものを発見した。以下はここ数日間の記録である:
49 128.122.140.70 (← 新山のマシン)
30 128.122.140.231 (← ?)
33 128.122.140.251 (← ?)
128.122.140.70 はいつも新山がつかっているマシンで、 日記をかくときにここからプレビューしているから、そこからのアクセスが多くなるのはわかる。 しかしそれ以外の IP はなんなんだろう。NYU からのように見えるのですが、きっと 誰かが IP 偽装をしてるんだね! いやー不思議だなあ。
べつにこのページがどこかの知らない人から見られてコケにされる分には いっこうにかまわんが、日頃からすぐ近くにいる人間がさらにネット上でも こちらの一挙手一投足を監視しようとしているという感覚は、 まあ、率直にいって「ウゲーーーーーっ」って感じです (といっても、見られて困ることは書いていないが)。 いやいやもちろんこれは IP 偽装のせいで、実際に同じフロアからだれかが 見ているなんてことはあり得ませんけど!
ちなみに、新山はこういう人々に対して (そういう人々がもし仮にいたとして! これはあくまで仮定の話ですけどね!) アクセス制御したりとか 見ないようにお願いするなどというバカなことはしない。 こういった人はなにをやってもどうせこっそり見るだろうし (web公開をやめない限り)、 そもそもこういう人々は小物なのだから、ニッコリ笑って軽蔑しておくのが正しい対応だと思う。
まあ、これだから、アクセスログなんてもんはできれば取らないほうがよいのだ。
それにしても、ロボットを除いてもなんでこんなにアクセス数があるのか謎だなあ。 個人からのアクセスは全部で 30hits/日 ぐらいが理想なんだけど…。 あいかわらず referer をとってないのでどっかでサラし者にされている可能性はあるが、 このサイトは既存のブログロとちがってバックトラックも何も受けつけないし、 他人にリンクしてるわけでもないので (そもそも見てすらいない、例の 2箇所を除いて)、増える理由がみあたらない。 このページはあくまで「誰の意見も聞かないし、自分の意見もたいして語らない」のが ポリシーなのである。もしみんな Google でヘンテコなキーワードから検索して来てたとしたら コワいよ…。というより、その場合は人々の感性にむしろ感心する。 新山が望むのはそのような世の中です。
「潮汐発電」って近未来って感じがするよなあ。 たしかグスコーブドリではクーボー博士が開発した未来の発電方式として潮汐発電が出てきたが、 宮澤賢治の時代は今以上に SF 的だったろうと思う。
オフィスに来てみたらいつのまにやら停電が起きていた。こんなろ〜〜〜!! 昨晩どうもサーバにつながんないのでおかしいと思ってたんだよね。
事前に何もアナウンスなかったので、なにかが事故ったらしい。
フロアの一部はいまだにブレーカが落ちているらしく、部屋のなかでも
動いているコンセントと動いてないコンセントがある。サーバ類は全滅だが、
ファイルサーバをふくむ 2、3台のマシン (全部ではない) は
自動的に復活してた。しかし新山にとってはだいじなデータの入っているディスクが
イカレてて、fsck でしばらく研究できず。くそったれ。しかもディスク自体に
すでにエラーがあるらしく、-a
をつけると
「ヤバいエラーがあるよ〜ん、手動でやってね!」とおこられてしまう。
こういうときこそ yes
の出番だっ! と思って
yes | fsck /dev/hdc1
などどちゃると
「-a をつけないときはちゃんと端末から起動してください」とか言われるし、
ムカつく。なんか次第にホワホワした気分になり、頭ん中でレゲエが鳴りだした。
悪態、悪態、悪態、悪態、
どうでもいいが、今日はこのドサクサのため図書館 (= テョチョカン) に行けませんでいた。 明日は休みなので、月曜いくかね。
またもや Python か。
ようやく fsck は終わったが…大量のファイルが lost+found
にお亡くなりになられた。
しかし見たところ、新山所有のファイルはいっこもないようなのでとりあえず放置。
Web サーバも死んでるのだけど、こまるのはオレじゃないから別にいいや。
「こんだけ複雑な環境に依存してるのに、ちゃんとした管理者を雇わないと
いまにひどいことになりますよ」とは再三言っておいたのに聞かなかったほうが悪い。
新山がいなくなったらどうなんのかな〜〜ここ。
きょうの占いcookies.txt
:
Lucky Numbers: 16, 24, 27, 8, 36, 41
うらっかわ:
Shui-guo 果子
オイ! 間違ってるじゃねーーか!