寝不足でフラーレンな日々だが、かまわず大学に行こう。
結論からいうと、これは手品のような方法によって可能なのだが、その仕組みはなんだかややこしい。 みんな何度も質問して、ようやくわかったという感じだった。 基本的なアイデアは、暗号界では有名な Oblivious Transfer (なんて訳すの?) をもとにしている。
これでいいんかいな。なんかちがうような気がするぞ。 とにかく、ループの上限が定められているプログラム (ようするに原始再帰関数ということになるのだろう) は 基本的にみんなフィードバックなしの論理ゲートに変換できるので、ある程度一般的な計算を この枠組みで実現できるということだった。かれらは実際にこれを Java を使って実現している。 まず SHDL という言語でプログラムを書いて、それを仮想論理ゲートに変換してネットワーク経由で送るのだ。 しかしこれは毎回暗号化が入るので多大なネットワーク帯域と計算力を必要とする。 なんだか実験がよくわからなった。これは理論的な研究なのではないの? …と思ったら、 彼らは実装も大事なようで、わざわざよくわかんない文脈認識機能つきエディタや、 イスラエル-米国間の WAN を使って実験している。ぐりむ先生もそこにいたのだが、彼いわく 「Java のシリアライザは the worst of the worst !」ということで、 かんじんの評価のところでズッコケた発表だった。概念自体はおもしろかったので、まあいいけど。 たまーに暗号っぽい話を聞くとなんか頭の中の使ってない部分がギコギコと動くようだ…。
それにしても、今日のもうひとつの学習は、 ヘブライ語圏のひとびとはみんなああいう英語の喋り方をするのだとわかったことである。 Zvika もそうだし、AdaBoost のおじさん (名前失念、Yoav なんとか氏) もそうだった。 そもそもイスラエルって先進国だかそうでないんだかよくわかんない国だよな…。 ヘブライ大や Technion にはかなり有名な研究者がいるらしいけれど、 日々報道されるあの治安のアレぶりを見ると欧米なみの国だとはとても思えない。 それとも、あれはごく一部がやたらと強調されているのだろうか??
という印象。
ところでジグザグとギザギザって振幅の違いだけの話じゃないよね。
てくるで「右も左も」ってはいうけど「左も右も」とはあまりいわないよね、あんまり。あんまり田。
ところで、きょう sunrise mart でステキな商品をみつけた。 「ミルメーク」である。いやはや、日本のスーパーでもほとんど見たことないのに (というか、そもそも探す気がなかっただけだが)、こんなところでお目にかかるとは! で、思ったのだが、いまの小学生はちゃんとミルメークをありがたがるようにしつけられているのだろうか。 新山が小学生のころ、なぜか給食のときに人気があったのはミルメークと「いかリング」で (オレはあまり好きじゃなかった、なぜなら、ときどき骨が入っているから)、 何か貸し借りのようなことがあると「おまえ、つぎの給食んときに、いかリング一個な」というぐあいで 貨幣の代はりとして使われたのだが、現在でもそういうことはあるのだろうか。
どうでもいいけど「かわる」って字はむずかしいね:
shift_jis
から utf-8
になった。
これは今日変わったはずだ。なぜならきのうまで
google://ほげほげ/
のリンクがうまく動いていたからである。いまではこれはもう動かない。
書きかえねば。めんどくさいなちくしょう
末尾に '&ie=shift_jis'
を加えれば動くようだ:
google://ほげほげ/
ちなみに「出雲 礼緒奈」というのは新山の IP (68.37.211.*)
から書きこんだときのものである。
localhost (127.0.0.1)
から書きこむと「デイビス富雄さん」という非常に
アヤシゲな名前になてしまふのだが、しかしこのあやしさがなかなかいい味だしてるのでほうっておこう…。
うん。そゆこと。うん。
さいきん、この文章群の意味不明度がさがりつつあるので、 これは非常にのぞましくないことだ。気をつけねばねれねい。
ひゃっほう!
そういうものがない状態。
ドーでもいいがね…
胸ポケットに櫛を入れたままで大学に来てしまった。 いつもここになんでも入れておくくせがあってこまる、オレは。
また始まった! 「もう誰も信じない」症候群!
parser にはべつに文全体を無理して解析してもらう必要はなく、 自信のある箇所だけを示してもらってもいいわけだ。 各部分における確信度を表示してもらえると助かる。
腹へった、ちくしょう
昼飯 (きょうはまた dosa だった、あのおじさんが愛想よくてなんかいいんだ) をくったあと、 ミーティングと授業とトークが続いて何もやる暇なし。 awk の W を見てきたが、A や K にくらべて一番活発なかんじのおじさんだった。 彼は最初数学者だったのだが、それからベル研にいって、管理職になったので嫌になって G へ行ったんだそうな。それで今は G でコードを書いているが管理職っぽい仕事を しなくていいのでシアワセだ、といってた。トークはまたもほとんどおなじ内容。 G 社の人がしゃべるのはこれで 3回聞いたが、3回ともほとんどおなじことしかいってない。 技術的なことはほとんどなにもなし。GAPI の話も SOAP ですよ、ってことと、あとは スライド 2〜3枚だけ。GFS とロードバランスについてやや説明があったが、 社員の多くがネットワーク屋であるということだった。まあ、そうだろうな。 しかし聞くたびに思うのだが、あそこってなんかいい加減な会社だよなあ、と思う :
思うに、彼らの唯一革命的な発明とゆーのは PageRank なんかじゃなくて 「信じられないくらい安いハードを、信じられないくらい大量に買って使う」ということだろう。 そもそもあすこのハードって台湾かどっかから仕入れてきたバッタもんばっかりで、 チップの上には文字さえ書いてないらしい。にもかかわらず人々は G 社のテクノロジーが 最先端だと信じるのだるから、ブランドって怖いね。
砂糖水をのみすぎた。
またもや論文。長い。
Chasen の地名辞書は異様にでかい。67000語も入っている (おそらくアサハラさんが一生懸命集めたのだろう)。にもかかわらず、 ムカつくことに、ほとんどの地名はたいていの人が知りもしないのだ。 これは絶大なるもったいなさである。この資源を有効活用しない奴はバチにあてられるべきである。
というわけで、chasen のムダにでかい地名辞書をたっぷり堪能してもらうために 日本全国地名しりとり なるものを作ってみました。以上。
まあ、死者がなければ日本ではニウスになんないと思うので、 親への連絡はとくにしないことにする。
Ben から faculty candidate とのミーティングがきょうあったことを聞いた… ダメじゃん! おいおい、オレにはなんの連絡もなかったぞ? と思ったら、 ちゃんと 15日に Cole からメイルを受け取っていたことが判明。 埋もれてました…。
どうもさあ、もうあんまりいっぱいメール受けとりたくないよ、見落すから。 オレはなんしろ天下の「がさつ君」なので…。あぁ
$ perl -e '$/="\n\n";print"\\documentclass{article}\n\\setlength{\\oddsidemargin }{-18pt}\\setlength{\\textwidth}{510pt}\n\\begin{document} \\small\n";for($i=0;$ i<100;$i++){$_=<>;@a=split(/\n/,$_);print"$i . \\begin{tabular}{|p{6.2in}|}\\h line\n";foreach$_(@a[0..@a-1]){if(/^\#/){next;};s/\$/\\\$/g;if(!/^DOC:/){print"{ \\tt $_}";}else{print$_;}print"\\\\ \\hline\n";}print"\\end{tabular}\\vspace{4pt }\n\n";}print"\\end{document}\n"' t > t100.tex && latex t100.tex && xdvi t100
ああそう
よーかーったーネ〜〜〜〜ーー!!
もーなんなんだろねこの暑さは?? 夜12時の時点で 25℃ ある。 これじゃ寝れねえ! いきなり熱帯夜だ。きのうの夜もかなり暑かったけど、 今日は大学を出たらムワーっとして、「うわ、ジャケット持ってるオレはバカか?」と思った。 どうでもいいが今日はずっと朝からマトモなもん食ってなくて今とても ハラがへっているのである。
どうでもいいけど外国暮らしする日本人男はなぜヒゲをのばす傾向がアルのか。 そこに隠されたスタイル TV 的な根底思想とは。こちらの西洋人には 「スレテオタイプ知識人の風貌としてのヒゲ」というのはよく見かけるが (たとえば Ralph なんかサマになってる、「すてきなおじさま」風)、 日本人でヒゲのばしてるやつに賢そうなやつわいない。 オレは絶対そんなことしないからな!
しかし CS 界で一番ヒゲが似合ってるのは McCarthy だと思う。 ああそうか、髪もヒゲも白くなんないと似合わないのか??
この歌なんだっけ?
そしてもうひとついいと思ったのは、彼の楽器の吹き方がわりとしっかりしてて、 自信にあふれていることであった。つまりあんまり細かいところでトライしない。 これは何についてもいえるよね。前にも地下鉄の車内で、黒人でイラストを 描いてるおやじをみかけたのだが、揺れる車内で画用紙をもって少しずつ角度を 変えながらしずかに描いているのだが、なんというか、手つきに迷いがないっつうか、 描く線の一本一本にえらく自信があるようなのである。あれでちゃんとした絵ができるってのは、 かなり熟練じゃないとだめだろうな。絵や音楽の細かい機微についてはわからなくても、 ああやって実際に作っているところを見ると、「それが上手い」ということだけはわかる。 そういうこと。
…同じことをプログラミングにもあてはめるとどうなのか。おそらく熟練した プログラマーというのは、あれこれ悩んだりしないのだろうと思う。 作っては消し作っては消し、ということもせずに、大幅な改造するときでもドバっと改造し、 変数名は一発で決め、あとでちまちましたリファクタリングなんかしない、というところだろうな。 もちろんそんな人が沢山いるわけはないけれど。
あれについては、あした書こう。すこし追加実験もしたいしね。
それは象をこなしているウワバミの絵でした。
などというふうにやるのである。各コマンドは「直前の」コマンドの結果のみを記憶しており、 いちおう文脈を意識した操作が可能である。で、まったく同じものを cgi にして web からアクセスできるようにしたらどうか? よく思うのだが、あの web メイラのインターフェイスというのが いちいち何か操作するたびに reload したりして、うざくてしょうがない。 web でもコマンドを入力させろよ! そのほうがずっと早いし実装も簡単だ。 とくに address book を設定したりするのなんか、GUI でやるのはアホだと思う。$ mshow -sortbydate -thread date:-10 in:csphd subject:meeting (csphd 属性をもつメールで最近きたやつで subject に "meeting" を含んでいるメールをスレッド表示) 1 from: ... 2 from: ... ... $ mshow +12 (12番のメッセージを表示) $ mnext (その次のメッセージを表示) $ mreply cc:sekine (そのメッセージに返事、ただし cc: にセキネさんを入れる)
メーラを書くときの問題は、メッセージが数千通になったときにいかにスケールするかだ。 新山はメールのヘッダを直接見たりファイルからじかに MIME subpart をとりだしたりするので、 1メッセージは 1ファイルにしておきたい。しかし、何千ものファイルを扱ったらぜったい遅くてかなわんので、 どうせすごく古いメールはめったに検索しないんだから、1ヵ月以上前のメールは cdb にしておくってのはどうだろう。 うん、そりゃ便利そうだな。ちょっと作ってみっか。懸案事項は、Python の email パッケージが どれくらい速いかだ…
Rap has spread across the Spanish-speaking world, too, but in few other countries are rappers as political in their lyrics as they are in Colombia.
(ラップ音楽はスペイン語圏でも広まっているが、コロンビアほど その歌詞が政治的なラッパーのいる国もない)
[nytimes, 4/16 の記事]
For optimistic replication to be viable, the system has to be more sophisticated.
(楽観的複写が実現可能であるためには、システムはより洗練されている必要がある)
[Disconnected Operation in the Coda File System]
ああ、「おもった」をひらがなにしてしまった。気持ち悪い。でもこれには理由がある。 「思いつかないと思った」と書くと、「思」という漢字が 2つ続いてしまうためにオカシイなことになるだ。 メタとそうでないものを区別するために、ときどきひらがなと漢字を使いわけたくなる。 しかしこの場合、漢字を使うのは前がいいのか、後がいいのかという問題があるが、 「なかなかおもいつかないと思った」だと連続するひらがな列が長すぎるので パターン認識に異常をきたす。文章というのはこのように絶妙な漢字とひらがなの 出現スペクトルによって成り立っているもので…。
電波。
とりあえず email.Parser
で 2000個のメッセージ (一部 Multipart 入り) の
ヘッダと MIME を parse するのにかかった時間: 5病。
そんなに激遅くもないね。使えるかもね。
オレもかつては自分の頭で覚えきれるぐらいのメモリをもったコンピュータしか 信用しないことにしていたのに…。いまじゃ何が走っているかさえ時々明らかではない。 この気持ち悪さというものを人々はどれくらい知るだろうか…。
なぜ「した」を強調するかといふと、 新山はどういうわけか「〜みたり。」「〜したり。」という連用形で文を終わらせるのが大嫌いだからである。 「〜と思われ。」もかなり嫌いだ。なぜかは知らないが、非常に「けがれた」感じがする。 現実に誰かがこうしゃべってるのを聴いたら、きっと苦虫をかみつぶしたような顔をするだろう。 まあ、電車の中でどっかの酔っぱらいが車内にゲロを吐いているのを見たときのような気分といえばいいだろうか…。
しかし、なにがそんなに嫌いなのか、うまく説明できない。 おそらく断定しないのがいやなのだと思うが、…ああそうだ。 これらの表現にはどれも、なんとなく「自分を咎めないで」という免責事項的な 雰囲気が盛り込まれているような気がする。 つまりこれが新山にとっての「さ」に相当するのだ!! か? だ。間違いない。である。のよ。
おとといの写真をようやくとりこんだ。
けさは家の前でドルリ工事をやっており、うるさい。
あと、hotmail には 6000万人のユーザがいるそうです。もっと多かったか。
4月ももう気づかないうちに中盤になってしまーた。
それは「知識人コンプレックス」とでもいうようなものだ。 あるいは欧米コンプレックスでもいいけどさ。 どうもねー、日本人のかくブログロはかならずそういう傾向なんですよ、ほとんどどれも (目立つやつは)。 一体なんでだろう? その強調のされぐあいはアメ人のそれよりはるかにひどい。 これがブログロがブログロたる、そのうさん臭さの原因だろうな。 日本はたしかにそういうコンプレックスが生まれやすい社会だと思うので、 それがブログロにも表れるのはちっとも不思議でない。 つうかそもそもコンプレックスを持つのを美徳とすら思ってんじゃないか、と。 幸か不幸か、新山は知識人コンプレックスはだいぶ前に失われていた (大学に入ってうだうだやってるとまあだいたいそうなるね、教授とか天然ボケだと)。 ついでに、NY に来て欧米コンプレックスもなくなり、むしろ国粋主義的にすらなってしまった (うそ、これはいいすぎだ、だいたい国粋主義というのはそれ自体がコンプレックスの塊である)。 だいたいアメリカ人も文化的にはかなり欧米 (というよりむしろ欧州) コンプレックスだしさ…。 といってコンプレックスがなくなったからといって問題がなくなったわけではまったくなく、 ムカつくことはまだ沢山あるが、それでも純粋に技術的なことやセンスの問題だけで ムカつくことができるようになったのはいいことかもしれない。
しかしある意味こりゃ最悪でもあるな。
なぜなら、コンプレックスというのはだいたいの日本人に理解してもらえるのだが、 技術的なムカつきはそのセンスを共有する人にしかわかってもらえないからだ。 そういうのは「ただのヒステリー + 電波な奴」と見られてしまう。 たとえばブログロを見ても、コンプレックス丸出しを売り物にしてる人はウケがいいみたい。 Ruby が日本で流行るのもおそらくはこういう理由からだと思われる (この言語を毎度ネタに使って悪いけど)。 よくいわれる他人への迎合傾向も、そういうことが原因なんかもしれない。 いっぽう、新山みたいに「マイナー道でいいが、とにかく妥協せずにやるのだ」というあまのじゃく精神に満ちているやつは、 まったく理解されない (たとえば Ruby の変態文法が嫌だとか)。おそらく彼らはいうであろう。 「新山はわかってねえよ、Ruby で大切なのはコンプレックスに共感することであって、 機能とかセンスじゃねえんだよ!」と。まあそうですが。一億総コンプレックス社会。いいけどね。 それでもオレは日本好きですもん。
こういうことを書くとまたどっかの頭のいい人がリンクしてくれるのでしょうか。
(追記: 最初「どっかのアホがリンクするんかいな?」と書いていたのだが、
その方 (誰かは知らない) がアホとは限らないし、しかもおまけに
ありがたくもリンクしてくださるのだから、敬語で書いておいたほうがいいような気がした)
「あっぶぁ〜〜〜〜」
「キぃ〜〜〜っっ、ひゃ!」
とか騒いでたりする (で、学科長が「あら、すごく若い学生さんね?」といったりする) と、すげーうらやましい。
はっきりいって結婚に対するイメージはこちらにきてだいぶ変わった。 こっちでは妻子持ちでもものすごいアホなことやってるおじさん・おばさんがいて感心する。 やっぱ、ああいうのには憧れるよな…。人間、結婚してからもアホでいつづけるのが大事だと感じた。 それがカッコよさというもんだ。ろ。 つまり結婚は人生の墓場でも出発点でもなく、ただの通過点なのである。 しかし日本ではそう考えるのはむずかしかろうな、それもわかるけど。
ナンでもかんでもわかったふりをしていてはいかぬ!
通常の IEEE 1394 ケーブルの価格の 2倍はする。ふざけそ。なこれ。
そもそも、すべての言語を編集しなきゃいけないアプリケーションってほとんどない。 どうも「グローバリゼーションの幻想」とでもいうものがあるような気がする。 中国語を書くのにいちばんいいアプリケーションは中国人でないとつくれないだろうし、 それは地元のソフトハウスが開発するのが望ましいと思う。 そしてやつらはこんなライブラリなど使わないだろう (設計者にはそれぞれ事情があるものだ)。あるいは、ワープロは無理だとしても、ちょっとしたアプリケーションにも 多言語処理をさせたいということだろうか? しかしそれはあきらかに 売れてから考えればいい話である。それほど誰からも欲しがられ、かつ全世界で機能共通で、 しかもユニークなソフトウエアってそんなにあるだろうか? Photoshop ぐらいじゃない? Office 関連はその国の地域事情があきらかにあると思う (てくるで最近の MS Word は傍点が使えるらしい、やるじゃねえか MS)。 最初から多言語処理を考えるなんてのは、どう考えても overdesign によるコストのほうが上のように見える。 まあいいけどね。やっぱ日本のソフト産業は民間企業がガンバルしかないんだよ、たぶん…。
[追記: 力武さんが言っているように、けっきょく i18n (m17n も含む、やってるのはどのみち同じような人々だ) の問題というのは、 「世界は第二次世界大戦以後からあまり変わっていない」ということにつきると思う。 あいかわらず大多数の西洋人はアジアなんて辺境の地でしかないと思っているし、 中国人は日本大っ嫌いだし、日本だけが「まあみなさんそういわずに国際化について考えてくださいよ、ねえ?」と エヘラエヘラしても誰もとりあってくんない。実際オレも米国に来てから 「1バイト文字だけで用がすむ世界」というのがはっきりいってラクでしょうがなく、 こりゃあ多国語処理なんか西洋人に期待したって無理にきまってらあな、と思った。 しかし問題は、日本のソフトウエア産業は携帯電話なんかと違って弱っちいために、 独自ソフトウエアでやっていくわけにはいかず、 i18n はほとんど欧米 (というより、MS) におねがいするしかないということだ。 完璧主義のせいもあるのかな、わかんない。オチはなし ]
2つの数値 x と y をかけることを考える。 つねに x > y と仮定すると、覚えることは以下の 2つだ。 a と b はともに 1ケタの数字である。
飽きたのでやめることにした。オレにはムリだある。
すすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすすす
やはりあれだ、おれは、あれは、そういうモノではないのか。
そういうムノ
おまえ、あれだろ、おまえそのおまえおまえそのー…おまえあれだ…あの…あれだよおまえおまえおまえ…あれだろ? おまえ…
うちから Columbia までは 1時間じゃつかない。
とゆう、わけだ。どういうこと? つまり、まず最初に 33rd. でおりて、 Times Sq. までいって、そこから 116st. まで行くのに 30分ぐらいかかった。 遠いよ! というわけで見事に遅刻する。しかしさすが Columbia は NYU とはちがって まるで本物の大学みたいだった。キャンパスあるし、なんかやけに明るいし。 きょうはよく晴れていたこともあるが、じつにアッケラカーンとしてよい雰囲気であった。 建物はみんなド新しいしさ。 まあこれはアメリカじゃどこの大学もそうなんだろうな、うちがおかしいんだ。 Broadway に帰ってきたらそのボロさに愕然としたよ、まったくもう。
しかしだねー、今日のトぁーくは「ロボットの認知から言語的な概念を学習する」というものなのですが…。
まあいつもいつもこのテの研究を見るさま思うのですが… (日本語が変)
やらせすんなよ!
…と、思うわけであります。
いや、研究自体はそれなりにおもしろい。現実の (ロボットのセンサーなどの) 身体的な感覚から、 抽象的な概念をフィードバック的に学習させようというもので、 これはもともと Winograd なんかがやっていた「人間による理想化 → ロボットによる行動」の逆をいくものであるそう。 つまりまずロボットにあれこれ行動させ、そこから抽象的な概念を導けるかどうかをみる、と。 そのアイデア自体はいいのだが…。
やらせはシラけるんだあ -よ!
…と、思うわけであります。
なんで人工知能屋 (← 非常にウサんくさい言い方だ) はいつもこういうふうにやるかなあ。 いや、なにが気に入らなかったかというと、このロボットにはカメラが 2台ついていて (この Raplie というのは、人間の片腕の先に 2つの目がついたようなものと考えればよい)、 これがあちこち物体を認知してつかんだり人間の指導をフィードバックして その動きを再現できたりする高価なオモチャなのだが、なんつーか、 わざと「好奇心」とか「疲労」とかいうパラメータが動きに入れてあるのである。 だからこれはデモ (=ビデオ) では少し動くと、「疲労」パラメータが上がり、休む (これはモータの寿命をのばすためということにお題目ではなっている)。 これは本当に台のうえにヘタンとなるのである。だがすこしすると、 また「好奇心」パラメータが上がってきてそれが「疲労」に勝って動きだすということなのだが、 休んでいるときになにか指令すると (これは音声認識を含んでいる)、 「あとにしてください」などと言う。それはやらせだろ! お前そういうふうにコード書いてるだけじゃん、それで笑いとって楽しいか! …と、 思うわけであります。
この手のヤラセはどこまで許されるべきなのか? 新山はべつにヤラセそのものがいかんといっているわけではない、 だいたいこの手の技術はほとんどが「うまくいくところだけを撮っている」ので、 ほぼすべてはヤラセである (新山もむかしは研究室の犬としてそんなことやってました)。 しかしこういう明らかなヤラセをやられると、シラける。芸がない。 どうせこのような研究はほとんど頓挫する運命にあるのだ。 派手なうちは予算もつくし、メディアにも注目されるしでウハウハだろうが、 まさにカネの切れ目が縁の切れ目というか、飽きられたらそれでオワリなのだ (十年以上も目立ちつづけられるほど研究者は新鮮ではいられない)。 まさに「一発芸人」みたいな感じなわけですよ…。 だから研究者じゃなくてアーティストだと思えば腹も立たないのだと思うが、 お前エンターテイナーに徹するならもうちと考えろ。 むしろショーならそういうとこは徹底的に手をかけるべきである。 ここは NY なんだし、showbiz に対する目はキビシイよ? しかし、やはり MIT メディアラボであるだけに、派手さは目立つ。 とにかく派手ならばいいと。やはりそういうわけなのか? しかしこういうのはそんじょそこらのアーティストよりはるかに金を食うわけで、 そんな価値があるものなのかどうか、なんともいえない。
そういえば前に ATR かどっかでやってた「人工脳プロジェクト」ってのはどうなったんだ?
派手な名前つけやがって。そんなことより醍醐世代ではいったい何億円がドブに消えたんだ?
ぶつぶつ。あれと火星探査ロケット一個ぶっこわすのとどっちがお得なのか?
どっちも派手さと有用さ (あるいは役に立たなさ) は似たよーなもんに見えるけど、
素人目から見ると。そして一番問題なのは派手でないために理解してもらえない
たくさんの重要な基礎研究をどうするのだ…。それとも、目に見えないところには
手をかけなくていいの
か? 「かんじんなことは、目に見えない」ということのそれであるよ。
そして、とかく派手なものにだまされやすい一般人をどうにか…。
つうか、そういうオレもただの一般人なわけだが…。まあいいや。知らない。
オレは地味で楽しいことをやるのだ。
今日のハイライト:
先生「…この 7ページ目 のグラフをみると CPU 2 の utilization が時間がたつにつれて下がっているが…
ここから読みとれることは何かね、yusuke? ここでなにが起こっている?」
新山「(うわ、この部分ちゃんと理解してないのにオレかよ!) あうー、あうー、えーと lookup table を見るのに忙しいのかな?」
先生「?? これは utlization だよ? 100% がいちばん load average が高い状態だよ?」
新山「あーっ、あー、そうか、えー? だとすると… ??? これは同期書き込みだから、CPU 1 が coordinator ってこと?」
先生「No, no! (数ページ前のスライドにもどる) クライアントは DDS ライブラリだ! だから Coordinator はこいつだ。
coordinator の CPU はこのグラフには表れてない!」
新山「あっそうすか… (長い沈黙)」
先生「ここで CPU 2 の utilization と throughput はほぼ同期してる。これはなんだと思う?
つまり書きこみの際の throughput はもっとも遅いサーバに bind されてるわけで、ここでは
sucky なサーバは CPU 1 であって CPU 2 じゃない! だとすると CPU 1 は一体なにをやってるのか??」
にこす「なんかやってんじゃないの…」
新山「ああそうだ、つまりハッシュ値の分布が一様でないんだ? だから CPU 1 ばっかりに write 要求が行くと。そうでしょ?」
先生「ブー。正解はこのシステムは Java で書かれてるから、JVM の GC バーストのせいだったのです」
そんなんありかよ! ちくしょう、またやられた。
これまでの一連の授業でわかったことは、とにかく ACID は遅いし、 あんまりスケールしないということだった。だからインターネット上のサービスで スケーラビリティを追求するほとんどのシステムでは、ACID を緩めた semantics を使っている。 しかしたいていこれは consistency を犠牲にするので (今回のシステムでは durability も犠牲にする)、 結局なにをやってもムズイもんはムズイということなんだな。
この授業でなにがうれしいかというと、難しい問題の「トレードオフ」を学習できることだ。 こういうのは、まあ現実社会で仕事してれば自然とわかるのかもしれないけど、 ふつう単一の論文を読むだけではわからないので (なぜなら個々の論文は自分たちのよさだけを宣伝するから!) ありがたいよね。
123
だ!これ、いかにも「総当たり式ですぐに見つかるように」つけたんだと思われる。 あらかじめ忘れることを見越していたらしいが、オレってそんなに賢かったっけ。 これって余計な機能としかいいようがないよな、どのみち鍵がなきゃ開かないんだから。 たしかこのトランクは碑文谷ダイエーで 8600円くらいで買ったんだけど。もう 10年ちかくまえだな。 いまだに「西安」とかいうラベルが貼ってある。 で、またこうやって探索するのはうんざりなので、もっとわかりやすい番号にしておこう。
111
です。
これならもっと早くに見つかるだろう。000
にしなかったのは、
うっかり 111
から探索を始めるとずっと見つからなくなってしまうからだ。
さて、このトランクを次に使うのはいつなのかな。
ところで、「新しい新山のトランク」というのはなんだかヘンだ。
てくるで、いまレシピのサイトでいいのを探しているのだが、 どのサイトもレイアウトがゴチャゴチャしてて使いにくいんだよなあ…。どっかいいとこはないの? たぶん、写真を載せてるせいもあるだろうが、もうちょっとなんとかなるだろうという気がする。 いまのところ見やすいのは、日本語だと E-recipe だ (日本料理以外のレシピにはとくに興味ないし、そもそも海外の日本料理サイトを見ても ありゃオレのいう日本料理じゃない)。 とくに 基本のおかず などの 企画はいいと思う。それにしても、料理関係のサイトや本はいつみてもそうだが、 なんで色使いがみんなこうなのか?
考えてみれば、オレの日記はいつも朝一番は意味不明な言葉から始まる。
夢のつづきを語ろう (カッコとじ)。
てくるできょうは雨ふるのだろうか?
ところで、今日はイタリャーから出向してる学生がしゃべってたけど、彼の英語はモロに ローマ字読みで最初なにいってんだかわかんなかった。だって 「だたばーせ (database)」とか「おくーるえんす (occurrence)」 「ぐらららぁっぷぇ (graph)」とかいうんだぜ? ("ららら" の部分は巻き舌) しかもなんか力点の起き方がどことなくイタリャー語っぽい。 そういえば、むかしイタリアを旅行したときも電車の車掌がいちおう英語をしゃべっていたが "permit" を「ぺるるるみっとぅ」と言っており、いかにも由緒正しいイタリア語っぽく聞こえて感心したものである。 ちなみにそのイタ人学生とはセミナーの始まる前にも話していたのだが、 彼いわく、アジア風外見の人間はみんな区別できないし、そもそもどんな国の人間が そういう風貌なのかさえもよく知らんという。まあ、イタリヤ人にとっちゃそんなもんかもね。 「えーと、こんなカオをしてるのはおもに中国人と韓国人、日本人で…」と説明しだすが、 日本人と中国人を顔だけで見分けるのは難しいというと、そばにいた中国人の学生が 新山をさして「お前は中国人に見えるよな、だって髪型が中国風だもん」。
えーと、この髪はいちおう日本にいるときに刈ったんですが…。
ついでに、シェルにおける一日のコマンド入力回数の統計をとってみた。 去年の 12月 10日からきょう 4月 14日までの 127日の記録である。 自宅でも同じことをやってたので、比較してみる。赤が大学、緑が自宅:
右のほうにあるくぼみは、おそらく日本に帰っていたころだと思われる。 自宅での 1日の平均コマンド入力回数は 332回/日、大学での平均は 574回/日。 大学のほうが働いていてよかった!
このときに使った、グレゴリオ暦からユリウス日を求めるアルゴリズム。 参考文献はこちら。 "Julius" は英語の形容詞だと "Julian" になるということを知らず、 さいしょ "julius day" で検索したがみつからなかった。
def julian(y, m, d): if m < 3: m += 12 y -= 1 return d + int((153*m-457)/5.0) + 365*y+int(y/4)-int(y/100)+int(y/400) + 1721118.5
Python の int()
は、実際には fix()
らしい。
そういえば floor()
は math.
にあるもんな。
>>> int(1.5) 1 >>> int(-1.5) -1
…ああそう。モミアゲが長いのが気になったので、洗面所で切ったらきりすぎた。
こりゃヘン。
病気カー
TBS でブルース・ウィリスが出てる映画をやっている。 (新山の数少ない「名前を知ってる俳優」のひとり)
「こいつって、いつも同じことやってるよね? どの映画でも」
todo: テッシかうこと。もうない
きょうの OS 授業はクラスタリングされたメイルサーバの話だったので やりやすかった。それにしても、hotmail とかはユーザ数どれくらいいるんだろうなあ。 アクティブでないアカウントを含めたら、1000万人ぐらいいるのか? なんともわからない。
「データを、データを、データを!」
彼はいらいらした調子でしゃべった。
「土がなければ、ブロックはつくれないよ」
-- Sherlock Holmes
ところで Broadway + 10st. の交差点 (南西カド) の街灯に描いてある、 サングラスをかけたおっさんの顔は誰だろう? どうしても田代まさしに見えて仕方ないのだが。
これで AWK の作者 3人をすべて生で見れることになる。 だからどうしたって感じだが。それにしても Google は有名人をいっぱい集めているなあ。Subject: [Phd-students] How Google works, and the Google API, guest lecture by Peter Weinberger, Tuesday, April 20 Tuesday, April 20, 5 - 7 PM, 102 WWH 101
…夢の中で、オレは、もぞもぞしたものに向かって何かこんなことを言っていた。
「おまえアヒルだろ?」
(うん、うん、うんうんうんうん、とうなづくような気配)
「…おまえアヒルだろ?」
(うん、うん、うんうんうんうん、とうなづくような気配)
「…?」
(ふいに頭を抱えて) 「わかったああ! じつはクシャおじさんの『クシャ』ってのは、 ヒンディー語で『宇宙の真理』ということだったん! 新発見!!」
そいつがくれば朝がくる。ちなみにこれはシャワーヲアビナガラ考エデシテモノデ、 以後何の関係もない。
きみは「以前画面」を知っているかっ。
どうもさみしいと思ったら、部屋の窓が 3cm ぐらいあけっぱなしでねてた。
「いまプロジェクトを進めている … ソフトウエアエンジニアは二人雇ったよ … アウトソース? いや、それは考えたが安いところがないと … ああ、.NET でもいいよね…」
などと話している。 ターバン巻いたインド人が米国内でアウトソースの話をしているというのは なんだかおかしかった。
ところで (てくるで)、どうしても auxiliary という単語がうまく言えねえ綴れねえ。
おうぐずぃりありー
おうぐずぃりありー
まあそういうわけで…。
それにしても、最近スパミャーの来ることが目立って多いのだが、 Subject: に英語で「なんとかかんとかだぜ, euske.」って言ってるのが多いな。 「Get なんとか! vbvxggh」というタイプよりも多いようだ。 まあ、どーーでもいーけど (DDI)。
階段で 1階まで降りて外がドシャブラーなのを角煮んしたあと、 また 7階まで階段で上がってきた夜に記す。
まあ、それが将来のねらいならいいけどね。
これは 2ちゃんねるなどを見ても感じることだが (どうでもいいけどさいきんあの掲示板は ほとんど見ていない、もうじき 30歳になるという人間が 2ちゃんねるの話題を 追うというのはいいかげん敗北だと思う)、ああいうものに気をとられて、 ひたすら「広く浅く」情報をスキャンする (この雰囲気わかるでしょ) だけで 学生の時間を終えてしまうと、本当に自分が注目すべきこと・ものを 決められなくなるのではないかという気がする。 オトナになってからも「自分さがし」とかいってるアホがいるし。 情報が遍在しすぎているというのはいいことばかりじゃないなあ。 選択肢が少ないために「おりゃっ」と決めてしまうことがいい場合もあるのだろう。 どのみち完璧な選択は不可能なのだから。
追記。オッカムの剃刀によりこのテのことは考えるだけムダなので考えないことにしよう。 こんなのは某 web 評論家 (砂の数ほといる) にまかせておべかいいさ! okeba.
とど: そーいえばこないだ日本に帰ったとき、ちゃんと成田でオミヤゲ (きんつば、14個入) を 買ってきたのをすぃーーーっかり忘れていた! つぎのミーチィングのときにみんなにくばらなければ。
電車の中では論文を読もうと思ったらすだーた (インド人) に会った。 かれはシステム屋だので、「さいきん OS の授業とってるんだよねー」という話をする。 「TOCS の論文は非常に長いね、システム屋の論文はみんなこうなの?」ときくと 彼いわく「暗号のジャーナルペーパーはもっと長いらしいよ、60ページ超とか…」。 それに、かれらは学会論文も長いそうだ。そもそもシステム屋の学会って (NSDI などのプログラムをみても)、 そんなに沢山の人が発表するわけではなさそうなので、「自然言語屋の学会なんか制限 8ページで proceedings の厚さがこんな (→ ←) だよ」といってみせたら驚いていた。違えば違うもの。
そういえばまえに改札口がこわれていてインターホンに「カモーン!」とか 言われたことがあったけど (これだけじゃ意味不明)、このことはまだかいていなかったっけ。 うふっす!
チボー家、ちぼっーけ、まっちぼうけ〜〜 はっくしゅ てっびょうし ♪
この「♪」のぶぶんは「ゆーにーろくろくえー」と発音してください。
あなたと私との、約束です。
todo: zipf かうこと。法則は買わない。i don't buy it!!!
どうやらハラがへ減ってくると頭おおかしい度が高まるらしい。わかりましょうが、 、。
<rb>
とっておきのストスレ解消ホウがあります。
用意するもの:
方法 その1 (その 2 は ) :
ほんとにやってみたら味噌汁だった。 材料がないので、ダイコンと、豆腐と、ホワイトしめじのみを使って「白一色」にする。 でも白味噌は使えない。そんなものはこの世界にはない。にもかかわらず、だ。
損益は 最初から 分岐している 分岐していないのは お前だけ
さてさてこうも変わるもんですかね??