ほんらい「悲しい」とか「腹が立つ」などの感情は、 意味を理解しなければ出てこない。しかし「楽しい」という感情は、 意味を理解せずとも成立する場合がある。これはよく考えてみれば すごいことだと思うんだけど。
トークが終わってからアラビア語の固有名詞について質問したのだが、この話もおもしろかった。 機械翻訳では外国語の名前処理はつねに難問であり、これだけでいっこの 研究分野になっている。 アラビア語では名前もやはり root と pattern からなっているのだが、 アラビア語ネイティブの人は外国の名前もまるでアラビア語の root からできているかのように 活用させるらしい。ちなみに英語圏におけるアラビア語の名前には、 従来から 「カダフィ問題 (カダフィ大佐の名前が Qaddafi, Gaddafi, Kadafi, Kaddafi ... などと表現されて一定しないこと)」 というのが存在していたが、同じようにアラビア語圏には 「Schwarzenegger 問題 (シュワルツェネガーの名前がアラビア語の綴りで 10通り以上にも表現されている)」 があるそうな。どうでもいいけど、英米人に「Schwarzeneggerって綴りを書け」というのは、 日本人に「憂鬱って漢字で書け」といっているのと似てんじゃないか。細かいところはみんな覚えてない。 そういえばむかし (中学生ぐらいのころ) 新山は「疑」の字をよく「ヒ」と「マ」の部分を逆に書いていた。
さて、論文の直しも終わって、あとわ提出するダケだ… と思っていたら、おいコラぁ! オンライン提出のためのサイトが落ちてるじゃないか! このバカめ。
明日は暑くなるようだ。ひさびさに図書館か美術館か本屋に行こうかな。
FedEx のサイトはすごいとは思うが、非常に使いにくい。ついでに言うと 電話サポートはさらに使いにくい。音声認識を使ってるんだが、 ちょっと受話器にノイズが入っただけでも「Sorry, I didn't quite get it. Your option is ...」と繰り返される。おまけに、さらに進展 (?) すると 「問題を口頭で説明してください」とかいって文章を入力させるんだぜ。 音声認識相手に。で、言ったところで結局わかってもらえず、 customer representative (=人間) に forward されて、 もう一度アカウント番号やらなにやらを全部最初から言い直さねばならない。くそったれ。 なんとかなんないのか、あれ。
From: Heow Eide-Goodman Subject: [Lisp] Lisp Meeting, May 9th 7:00 at Trinity Please join us for our next meeting on Tuesday, May 9th from 7:00 to 9:00 at Trinity Lutheran Church. Peter Seibel presents: "Practical Common Lisp" "Should we vacation in Bali or Monaco?" ....is the query put forth to Miss September. "Well Peter," she says with perfect lips "Bali has better food, but Monaco has the 'Sushi-Girl Backrub Team'".
べつに有名人が好きなわけではないが、なぜ Heow のアニキはいつもこんなに濃い人ばっか連れてこれるのか 不思議でしょうがない。
それはそうと、5月5日は Courant に David Freedman がくるらしいよ。 かれは統計学者なので、アカデミックなトークはとても 新山にはついていけなそうだが…。
バカっぽーーーーー。もう新打法が飯ですね。\author{ Yusuke Shinyama \hspace{2in} Satoshi Sekine \vspace{8pt} \\New York University\\715, Broadway, 7th Floor\\New York, NY, 10003\\{\normalsize \tt \{yusuke,sekine\}@cs.nyu.edu} }
てくるで (とこ)、「愛国心」の定義が話題になってるようだが、 「自分の生まれ故郷を、世界の他の地域と同程度に尊重する態度」 ってのはどうかな。あえて「国」って言葉は入れない。 なぜなら新山は「国」ってのがなんだかいまだに直観的によくわかっていないから (というか、最近なおさらわかんなくなってきた)。 しかし「他の地域と同程度に」という部分は絶対ほしいところだ。 ここからは、なんとなく 「自分の故郷を含めて、世界のどの国 (地域) も差別・逆差別しないこと」という ニュアンスがくみとれるから。 そして、そういう態度が最終的にはもっとも「自国を愛する」ことになるのだ、という、 どことなく禅っぽくて逆説めいた主張を誰かが言う必要があるんじゃないか? そしたらすげーカッコいいし、独自性が出ていいと思うんだけど…
そもそも本当に日本人にとって問題なのは、 つねに「自分を (相対的に) 落とす」ことが美徳とされてるってとこだろう (といってもこの美徳は表面上だけのもので、ほとんどの日本人は 内心非常にプライドが高い、というのが新山の印象だけど)。 日本が中国やアメリカに対して及び腰というのは、たいてい 「自分を落としすぎ」なのが原因なんであって、なにもフツーに対等に接すりゃいいのよ。 しかし他人の目を気にするよう骨の髄まで鍛えられた人間にとって、これは簡単なことではない。 「愛国心」をうんぬんするセンセー方がいつも「自分の国 (地域)」というような意味の言葉しか使わないのがムカつく。 日本には内省的な人間が少ないらしいので (←もちろんこれは、新山の勝手な推測)、 「自分」を基準とした絶対的な価値観というのはいつかかならず暴走するに決まっている。
yes
を実行する。
xterm の saveLines
属性やフォントの大きさにより難易度が変わるという画期的な遊びです。
資格は一切必要ありません。ちなみに新山はビットマップフォント使用で saveLines = 1024 で、
3回に1回成功する、といった具合。
table
の引数やら位置やらをあれこれ調整して、
同時に単語が 1コだけはみ出してる部分をなるべくけずって
行数をかせぎ、それでもだめなのであっちこっちの図表を小さくして
なんとか 8ページにおさまった。
ある図などはこれ以上縮めると改行位置がズレて
逆にページ数が増えてしまうという現象がおこっている。
フモーーーーーーっ! 不毛どころか無毛であるが、
これらはどっちのほうが毛が少ないの? 「非毛」というのは
ポリシーとしてやってるような気がする (何が? 何を?)。
H嬢はこういうときに最初のタイトルと本文との間のスペースを縮めるといってたが、
おいおい、そりゃ禁じ手だろ。
それから、複数の著者の住所が同じときイッカショにまとめるやり方がわからん。
ふたつ並べて書くとおそろしく間抜けに見える。
とにかく TeX は不毛なソフトウェアだ。原始的なわりには
意味もなくデッカくて複雑だし、おまけに亜流がいくつもあって互換性ないし、もう最悪。
いつ脱却できるのやら。研究者をやめれば脱却できるだろう…が、
脱却する先が Word じゃなあ。この状況を比喩的に表現すると、
てくるで日本では Xbox360 は「弥勒王」と呼ばれていたりするのか?<br
しないな、やっぱ。
…してきたので、回転するイスにのってぐるるるるるるうるっるるるっっrるるっと廻ってみる。
都合の知るかぎりでは、ワシントヌ・スクワーには 4箇所、計 7〜8本の染井吉野が生えている。 いま、ちょうど満開だ。実際には満開をやや過ぎたあたりかもしれず、葉っぱ出ている。 しかしけれども周囲に櫻の花びらがゼンゼン落チテナイので (このようにカタカナで書かれた部分は 「落チテナイ」のように関西風に発音する)、しごくつまらない。 ひどく。ああ、ひどいね。今日の夕食はピザの予定。
ところで (てくるで)、「バカスカ」とか「ギャースカ」の「スカ」って何だろう?? これもぜそぜそ関係ないが、長野の方言に「タークラター」という、他人を罵倒するときに使う形容詞があるが (用例. 「ったく、あいつはタークラターだで!」)、これもじつは意味コ不明だ。
追伸: devious (ヒネた) と dubious (疑っている) は混同しやすいから注意。
ところで、ふと思ったのだが、
たとえば、 こんなの
てくるで (ところで)、きょうはようやく H嬢が
"#!
" の意味を理解したらしい。
よくやった。これでようやく「なんにもわかってない UNIX素人」から抜け出して、
「さっぱりわかってない UNIX 初心者」のレベルの仲間入りである。
ちなみに現在の新山のレベルは「まるでわかってない UNIX 初心者」といったところ。
SPECIAL SEMINAR ANNOUNCEMENT Time: Thursday, April 20, 2006 at 11:00AM Place: 719 Broadway, Room 1221 Host: Yann LeCun Affinity propagation for combined bottom-up and top-down clustering Brendan J. Frey, University of Toronto Clustering is a critical task in the analysis of scientific data and in natural or artificial sensory processing. Existing techniques either are bottom-up and make pair-wise decisions when linking together training cases, or are top-down and represent each cluster using a parametric model, while alternately assigning training cases to clusters and updating parameters. I'll describe an algorithm that we call `affinity propagation', which for the first time combines complementary advantages of these distinct approaches. Affinity propagation can use sophisticated cluster models, but operates by propagating real-valued messages between pairs of training cases. Because affinity propagation replaces the estimation of model parameters with a step that considers many potential models and many possible cluster assignments, it can find better solutions than strictly bottom-up or top-down methods.
HRgHRmST (はらがへりました)
どうでもいいが、ブラジャーのサイズがデカくなるにしたがって A, B, C, ... と呼ばれるが、 Z を超えたら台風と同じようにギリシャ文字使用で「γ-cup」とか呼ばれるようになるのか。
(追記: 服のサイズも S, M, L, X, XX, ... ではそのうち XXXCVI とかになることは目に見えている。なぜ A からにしなかったのか)
Refreshments will be served at 11:15 AM Friday, April 7, 2006 - 11:30 AM Room 1302 Warren Weaver Hall 251 Mercer Street New York, NY 10012-1185 Speaker: John Whaley, Stanford University Title: Program Analysis with Binary Decision Diagrams
(12:59) …いまこのトークから帰ってきたところだが、いまだに興奮冷めやらない。 ひさしぶりに大当たりのトークだった。 基本的なテーマは先週の人と似ており、 プログラム解析 + バグ発見のツールについて研究している若僧 (新山とたいして歳はちがわないと思う) だったが、 いや、ああいう研究者になりたいもんだと思う。 まさに「脱帽」である。なにがいいって、まずプレゼンがしっかりしてるのがいい。 背景説明のところでも既存の研究がどういう流れで、自分の研究は その中でどういう位置づけなのかということをきっちりわかりやすく説明している。 新山はこの研究でおもに使われていた BDD (Binary Decision Diagram) というものとその最適化を知らなかったんだけど、それの説明もポイントをついてるし、 Datalog については知らなかったが、どうやら Prolog の一種らしいことはわかった。 それにほとんどの説明に図がついているのに好感がもてる。 メインのアルゴリズムの説明も、あっちこっち飛躍して可能性を探りつつ 足場を固めていく感じの説明ですんごくわかりやすい。 この人はとにかくいろんなアイデアを思いついてそれらをみんな 実装しているので、それらをいっこいっこ説明してるだけで場内からは 「そこまでやるか!」という笑いが起きていた。 今回のトークではジョークは全然なかったが、基本的にお茶目な人なんだと思う。 そしてそしてついでにこの人、後頭部の毛がハネてるのね。 これがなんか知らんけどいい味だしてるのである。 いや、ごちそうさまでした。あとでファンレターでも送ろうかな。
ちなみに彼の一連のツールは SourceForge で公開されている: http://bddbddb.sourceforge.net/
ところで、きのうとおととい 2日続けて Washington Sq. 周辺で大量の映画トレーラーが停まっているのを見かけた。 20メートルぐらいのトレーラーが 10台以上、牽引するコンテナ 20台ぐらいが ずらーーーっとあちこちの通りに並んでいる。よほどの映画らしい。 しかも、夜まで照明つけてずっと撮影してた。どこから電源を確保してんのかわからなかったが、 歩道のそこいらじゅうにぶっとい (3cmぐらいの) 電源ケーブルが何本も這っている。 あと、あのコンテナみたいなのは、一度ドアが開いてるのをのぞいてみたことがあるのだが、 中はリビングみたいになってた。つまりあれは役者の控え室用か? もしかして 1俳優 につき コンテナ 1個が必要なのか? そして彼らは夜になるとサっと撤収する。すげえよ。 ああいう光景を見ると、映画を一本撮るってのがどれくらいカネのかかるものかがわかる。 とーぜんこんな撮影は警察の許可も必要だろうし。そこまでカネをかけて 架空の世界を演出するってのがオレにはわからない。そしてそれが売れる! というのがなおさらわからん。 文字でいいじゃん、文字で。
というかオレは映画を見る感覚で他人の研究発表を評論してるような気がするんだけど、 これはどうなのよ?
どうでもいいけど (どうれもよろ)、さいきんやたら肌や唇が荒れているのは (寒くもないのに!)、 花粉症の薬を飲んでいるせいなのだろうか?
それにしても FedEx の overnight 便ってのはすごいね。 きのうの夕方カリフォルニヤから送って、けさニューヨークに着いちゃうんだよ? FedEx ってまさにアメリカじゃないと実現できなそうなシステムだ。 そもそも日本では必要がない。 わざわざ航空機なんかを使って大量運送しなくても、 クロネコやら日通やらの運ちゃんがガンバってくれるんだからさ。 つまり住むなら小さい国に住めと、こういうことになる。
東証や銀行関連のシステムプログラムは死んでもやりたくないが (あと航空機と原子炉も)、 やっぱ物流ってのは情報システムの花型だろうとと勝手に思っている。 なぜなら、これらはどんな世界であっても必ず必要だから。 しかもこれはコンピュータだけではどうにもならない、 間に人間や物理的なモノが介在する、本当の意味での「システム」である。 これに比べると検索エンジンなんかチャチいもんだ。 クロネコや JR の情報システムを設計する SE というのは、さぞかし幸福だろうなあ。 あと製鉄所とか半導体工場とかもかなりスゴそうだね。
ちなみにメンフィス大学には FedEx 技術研究所 があるって知ってた?
e50194631365d97c91f0da5d0c6d8fb7495ca69a
非常に落ちこんでおります。
とやるつもりで、うっかり$ rm なんとか.iso
とやっちまった。うわーうわーーー助けてーーオレが悪かった。 こういうときは Control-\ が役に絶つ。$ vi なんとか.iso
方法: ターゲットにした人間に向けて、そいつが普段 (仕事などで) 受けとっていそうな 内容のメールとほとんどそっくりの (しかし自動生成したデタラメな) メールを日に 1000通ぐらい、 ランダムな間隔で送る。そうすると、そいつはほとんど仕事ができなくなる。
この攻撃に対処する技術は今のところない。 現在の spam フィルタは、「真に悪意のあるspam」は最初から考えられていないから (「悪意ある」というのは、こうした spam に広告の目的はなく、 ひたすら個人を苦しめるために送られるため)。 spam というのは、ふつう他のメールと内容的にかなり目立った違いがあるのが普通だ。 だから人間がざっと読めばある程度 spam だということがわかる。 しかし「真に悪意のあるspam」は、それがわからない。むしろ受け取り手の普段のメールに できるだけ似せようとして作られているから、 spam フィルタではとうぜん判定できないし、 人間が時間をかけて判定するしかない。にもかかわらず、こういうランダムな文章を自動的に生成するのは、 それを判定するほどむずかしくなく、機械的にできる (可能性が高い)。 だからこれは本当に強力な攻撃になる。 いまでもたぶん特定の個人に恨みをもつ人間が 20〜30人ぐらい集まれば、 この手の攻撃はできるだろう。
もしこのために特定のアドレスやメールサーバがブロックされたら、 複数のアドレスやサーバから出せばよい。「精神的 DDoS アタック」である。 たかが TCP のレベルでさえ DDoS 判定は難問なのに、 これがもっと高度な知識を使わないと判別できなくなったらいったいどうするよ?
こうなるといずれ人はメールを DomainKeys などで認証して 「知っている人」からしか受けとらなくなるだろう。すると、ある日どこかの見知らぬ他人から 電子メールが来て運命の出逢いが! 、といったことはもうなくなる。 電子メールの「開放性」というものは、おそらく永久に失われることになる。
ちなみに、個人の手にできるネットワーク帯域が広がったことによって、 こうした個人攻撃はこれからますますやりやすくなるだろう。
とうぜん、電子メールじゃなくても精神的 DoS は可能だ。 ツウちゃんねるなどで特定の個人 (あるいは組織) に対する誹謗中傷が ずら〜っと並んでいるスレッドなどは、ある意味、この精神的 DoS 攻撃の 原始的な形態といえるのかもしれない。ビル・ゲイツなんかの有名人も 彼は世界一 spam が多いらしいから、すでに精神的 DDoS アタックを 受けているだろう (でもこの場合、個々のメールを出してるのは人間の集団であって機械じゃない)。 google に対しては、(google がランクを下げたがっている) 大量のゴミページがこれに近い。けれどもこれらのページというのは現時点では まだ「広告」がしたいのであって、 google の性能を落とそうとして悪意で作られているわけではない。それに 複数のページ作者が協調しているわけでもない。これがもし「悪意のあるゴミページ」が 協調して世の中に増えだしたらおそろしいことになる (少なくとも、google にとっては)。
こうした攻撃も、これから P2P などの通信が普及するにしたがってやりやすくなるだろう。 「ネットの出現によって個人にもパワーを!」と言いつづけた結果は たぶんそういう世界である。新山はそもそもネットがいいとも悪いとも思っていないので、 どうなろうと文句を言うつもりはない。だけどこういう危険をまったく考慮しないで ネットとかブログロを礼讃してるだけの人間はほんとうに罪深い。
ところで (てくるで)、キミは Capricorn Technologies の PetaBox を知っているかっ。 1PB (ペタバイト = 2^40バイト) のストレージが 2億円だそうな。 しかも消費電力は 50kW (= 500A) なんだと。ふーん。何個のクラスタなんだか知らないけど、 場所代と電気代と人件費あわせたら合計いくらぐらいなんだろう? 1PB もいらないが、80TB ラックがいっこあれば、セキネさんも しばらくはハードディスク容量でうだうだいうこともないだろうに (もうこの手の話にはつくづく嫌気が差した)。 いっこ 2000万円ぐらいで買えるわけ? Cisco のルータより安いじゃん! そういえばかつて (10年ぐらい前に) 東工大の情報処理センターに 1TB のストレージが入ったときは 学内の機関紙 (「東京工大クロニクル」っすよ) に載ってたような気がする。いまじゃ 1TB っつったら 日立の HDD を 2コ買ってくりゃ終わりだもんな。
研究の話。いままで 4時間かかっていた実験が 40秒で終わる! … つもりであれこれ改造してきたが、たしかに速くはなったけど、いまだにバグがとれない。 つうのはデータベースの mappings が複雑になりすぎてワケわかんなくなっているからで。 やばいなあ。コードは python で 1000行もないんだけどね。
「Python 1000魚ぅ」はいつも新山がアルゴリズムの複雑さを判断する基準になっている。 メインのアルゴリズムだけで 1000行こえたらそいつは複雑すぎだから没。 しかし、最初の段階で 1000行超えていても、ダイエットしてるうちに ドカンドカンと激ヤセして 200行ぐらいになることもあるので油断ならぬい。
tinaminiSin'yama ha... あれ? オフってた。ちなみに新山は速さよりも 単純さ (コードの短さ) を重視する傾向があるようだ。単純さはメンテナンスの容易さにつながり、 ひいてはコードベースを長生きさせることになる。計算時間のオーダーが 変わるんなら話は別だけど、たかだか 2〜3倍のスピードアップで コード量が 2倍になるよりは、遅くても単純なほうがいい。 そんなにスピードが重要なら C で書けってことで。
どこよりも早く!
誰よりも速く!
いつよりもハヤク!
何よりも歯屋苦!
どのようによりも889?
あれ? 5つしかないよ? あっこれだ
なぜよりもhyk!!
<NOSCRIPT><META http-equiv="refresh" content="0;URL=no-js.html"></NOSCRIPT>
寝る。
きょうが 4月1日ならあしたは 10月1日だ!
結論: 日本では欧米よりも約 20倍 荒らしが多い。