Last Modified: Sat Mar 1 09:44:43 EST 2003 (03/01, 23:44 JST)
でも、たしかバンジージャンプの起源というのは 「男女が飛び降り心中するんだけど、じつは女には別な男がいて、 女は心中したように見せかけて足にロープをつけていて生きのびた」 という言い伝えじゃなかったっけ。とすると、あそこの国 (どこだかは忘れた) では 心中するのかなあ。しかしこんな言い伝えが残っているということは、 やっぱ「心中なんてバカらしいからやめとき (あるいは、男ってバカ)」という教訓があるような気がする。 ああ、そういやーむかし UFO が来るとかいって集団自殺してたアホな新興宗教もいましたね。 でもこういうのはどれもちょっと違うんだよなあ。太平洋戦争末期の日本なんかでは ほんとうに「日本全体で心中」な雰囲気だったのだろうが、新山はべつに ほんとに死にたいわけではないのだ…。
こんなことを考えたのは、きのう Owen と話したときに、 祖国に対する考え方というものが彼とオレでは違うということに 気づいたからである。たとえば Owen は次の総統選挙には投票したいし、 台湾をよくしたいという。でも新山の目的はそういうのとはちょっと違うのだ。 べつに自分の国がよくなるか悪くなるかはどうでもいい (まあ悪くなるよりはよくなったほうがいいけれど)。 けど、たとえばこの前の 9.11 テロみたいな事件がもし東京であったとしたら、 自分はその場 (すくなくとも日本国内) にいなければならないと思う。 なぜだかそう思う。まあそれで死んだら運が悪かったわけだが、 「離れていてよかった!」とは思わないのだ。なんでだろう? やはり一番近い概念が「心中」のような気がする。 あーもうなんだかドツボにはまりそうなのでやめとく。
自分を肯定できるのは自分だけです。
yu@gi~[50047]$ ll /memo/cur/ total 384 -rw-r--r-- 1 yusuke 62145 Jan 16 23:52 11.html -rw-r--r-- 1 yusuke 93779 Feb 1 12:33 12.html -rw-r--r-- 1 yusuke 54073 Feb 10 18:15 21.html -rw-r--r-- 1 yusuke 45677 Feb 19 14:55 22.html -rw-r--r-- 1 yusuke 42559 Feb 28 21:09 23.html lrwxrwxrwx 1 yusuke 7 Feb 19 14:54 cur.html -> 23.html drwxr-xr-x 5 yusuke 4096 Feb 18 22:48 img/
これは今でこそほぼ脱却できたから書ける話なのだが、 新山は、米国に来るまではかなりの欧米コンプレックスだった。 こんなことを書くのは、日本メディアでの松井の報道を見ていて、 いまだにかなり多くの日本人がすさまじい欧米 (おもに米国) コンプレックスを持っているらしいとふと思ったからである。 しかも日本のマスコミはどういうわけか、このコンプレックスを めちゃくちゃ煽るような報道をしている。これにはなにか訳でもあるのか。 たとえば日本のニュースサイトなんかを見るともうどこも松井はニューヨークでは 超有名人、というように読めるのだが、実際にはぜんぜんそんなことないと思う。 むしろこっちのマスコミはマツイ本人よりも、かれに対する日本からの 「報道陣の異常さ」が珍しがられてるように見える。
で、この落差はなんなのだろうと思ったのだが、考えてみれば 日本のメディアというのはいつもこの手の報道が好きである。 いわゆる「日本人は海外でこんなに活躍しています」的なやつだ。 でもこれは実はコンプレックスの裏返しでしかない。 つまり自分たちはどっかダメだということをいつもずっと気に病んでて、 誰かにそれを否定してほしいわけね。で、米国でそれができたやつがいればなおさらよしと。
技術にもそれがいえる。むかし IPv6 関係とか Ruby 関係のページに 書いてあってうんざりしたのが (いまだったらこの手のやつは他に何があるのかなあ…いや、いまもそうなのか?)、 「この技術/言語は日本発信ですっ!」 というなんだかよくわからない力みかただ。なんかやるせないものを感じる。 これじゃ 2ちゃんねるなんかでよくバカにされてるウリナラマンセーな人の行動パターン (ほんとに韓国人がそういう気質なのかはこのさいどうでもいい) とまったく同じではないか。 たとえば、 Guido van Rossum がどこ出身かなんてオレは知らない (なんか名前からして米国人ではなさそうだが)。 でも「日本発祥ニダ!」という領土権を主張したくてたまらない人が たしかに存在していて、しかもそれが結構多いらしいということは驚きだ。 何かに煽られてるとしか思えない…とすると、思い当たるのは例の一群の 過剰な「日本がこんなに有名です」記事である。 日本のマスコミはますます日本人を煽って自意識過剰にし、結果的に コンプレックスを助長しているようにしか見えない。これは、何かの陰謀なのか?
そもそもこっちに来るまで知らなかったんだけど、 アメリカ人は日本のことなんて全然知らない。まったくといっていいほど知らないし、 おまけに興味もないようだ。「日本のモノが大人気!」とかいう報道は、 ありゃ一体誰がどこで見つけてくるんだろう? ほとんど大ウソに近い誇張だと思う。 日本人がアメリカのことをいつも意識しているのに比べると、この非対称性には すさまじいものがある。で、きょう思いついたのが、これってまさに 「有名人と一般人」の差だということ。つまりふつう一般人は有名人のことを知ってる。 そして有名人に声をかけられたとかいう程度で大騒ぎするのだが、 一方の有名人からしてみれば「あんた誰?」って世界である。 まさにアメリカから見た日本ってそんなかんじなのだ。日本での報道とは違って、 日本はアメリカにとっては圧倒的に「非有名人」で、ほとんどネズミみたいな扱いだ (別にあめりか人に人気の某ネズミではなくて、ふつうのねずみだ)。 つーかこいつらはほとんど日本を文明として認めてないのではないかとすら思える。 そりゃ工業製品はよくできてるが、彼らからすれば「なんかチョコマカした連中が 必死になんか作ってる」という感じだろう。アメリカ人にとっては意識すべき相手は ヨーロッパだけらしく (南米ももしかすると入るのかも)、 日本はほとんどケツを向けられっぱなしに見える。
ある意味、北朝鮮もたぶん日本と同じように 「有名人グループに注目されたい非有名人」なのだろう。 だから彼らのチョーハツは理解できるような気がする。 でもさあ、あすこは某おじさんのほとんど独断で動いてるような国だから 仕方ないとしても、日本人でそれと同レベルなのが多くて、しかも マスコミがそれを煽ってるってのは一体どういうわけよ? それとも、なにか見落してる要素があるのかなあ…。
(そういやーこないだの Linux Expo で、わざわざ JLA のブースに 「日本人が開発したRubyを使ってます」って挨拶にきた外人がいたんだって。 アホか…。いやいや、やっぱオープンソースの世界といえども国籍にはこだわらないとね!!)
結局、なにが言いたいのかよくわからん文章だが、 とりあえず「ネズミ扱いもべつに悪いもんじゃない (新山はネズミ好きだし)」ということである。 (←ネズミを馬鹿にする発言、許しがたい) あるいは日本へ帰ることの正当化。 つーか、新山は結局のところ、つねにこういう態度で生きているわけだな…なんて傲慢。
(Mar. 1 追記) きょうの newyork post をみたらマツイは一面トップ扱いだった。 まあやつは例外的に有名カモしれんが、それにしても日本マスコミがアメ国を意識しすぎなのは あいかわらずだと思う…やはりどっかでコントロールされてるとしか思えない。電波、電波!
外を歩くときに気をつけてることは、寒いからといって 猫背で歩かない! ということである。しかし部屋に帰ってきて 端末をぶったたく (キーボードを打つことをこう呼ぶ) うちに、 フト気づいて窓にうつった自分の横姿をみると、すんげー猫背でとてもカッコ悪い。。。
ちなみにここ2、3日のあいだ作ってたJavaアプレットは これ。 やっぱ慣れない言語は疲れる。。
(この後いろいろ書こうとしてみたが何も書けなかった、 どうやら自分で自分の掘った穴に落ちたらしい)
ところで Python に慣れてしまった人が Java を使うときの注意点:
this
を使う必要ない。
基本的に名前空間はクラス内でしか通用しない。
if
や while
が 2行以上になったときは
中括弧 { }
で囲むこと。インデントだけじゃダメ!
暗黙は
すてきな迷路を通って
くる…。
Scan error: "Unbalanced parentheses", 9, 1
Joyce が書くような小説を読むための (そしてそれだけのための) 支援ツールというものが もしコンピュータにあったらどんなものになるだろうかと考える。 たぶん、通常でない英単語を入力して、これは何と何の合成語である可能性数十%、 というような使いかたをするのだろうが、それってどうすりゃできるかな? いちばんてっとり早いのは、すべての英単語との LCS を計算してその割合を比較することだが、 これはすべての組み合わせを試さねばならないためにむちゃくちゃ時間がかかる。 ispell なんかでは対象となる単語は 1語だけだから速くできるんであって、 もしあれが複数 - 複数のマッチングだったらきっと終わらないだろう。 そうすると厳密なアルゴリズムはあきらめざるをえず、話はよりパターン認識っぽい 方向に向かう。たぶん特徴的な文字およびパターンを抽出してマッチさせるということに なるのだろうが、そんな研究やってる暇人 (失礼) はいるのかな??
オープンソースは技術の監視という面では
たいして解決にならないと思う (レッシグせんせいが何といおうとも)。
たとえば MS のソフトウエアを全部オープンにしたとして、あんなもん誰が読むんだよ?
(たとえば Mozilla のソースで main()
が
どこのディレクトリにあるか知ってる人はどれくらいいるのだろうか。)
かりに誰かが自分のかわりに読んでくれたとして、どうやってそいつの供述を信用するのだろう。
というか、目に見えない技術に関する監視や証言というものがどれくらい
世間から真面目に扱われるのかわからない。たとえばどっかの信頼できる調査機関が
「うちの名誉にかけて言いますが、このカーネルは絶対安全です」とかいったとして…
でも考えてみれゃそんなことはいまでも平気で起こっているじゃん…。原子炉とか飛行機とか。
結局、田舎で農業やってるのが一番いい、という結論に落ちつきそうな気がするんだけど。
つかれたのでまたあとで書く。
ところで appletviewer では動くのに mozilla だと動かねー。 ざけんな。j2sdk のアプレットのサンプルなのに…。
こういう、自分の専門とあまり関係ないような分野で それなりの人がきて話を聞かされるというのは 日本の大学ではあまりない経験だが、こういうのは もっとやってもいいと思う。というか、いろんな人が来るのは 土地柄のためかもしれない。こういうときに都会って便利だよな〜。
でも、遅刻しないこと。
お。これは神だ。 神はこのようなところにおられる。きたなき所へようこそ。
腹へったので帰ろー
ちなみに新山は「チョコレートは明治、ヨーグルトは小岩井」という 頑固なポリシーをもっております。た。がしかしそれはこちらへ来てからもろくも崩れ落ちた。 つーか、スーパーとかで売ってる Danon とか Columbo とか、うまくないんですが。。。 そういやーブルガリア出身の彼は元気かなあ。しかし明治、チョコレートはいいが、 ブルガリアヨーグルトは食えたもんじゃないよね。だいたいなんであんなに 酸っぱいのですか? あれじゃまるで (検閲済)。(検閲済)。(以下すべて検閲)。
さて、電車の中で首すじに「生現」という刺青をしてる黒人がいたのだが、 またもや意味が不明的。現生ならまだわかるんだけど。 あと朝生 (あさうまれ) とか、黒生 (くろお) とかならば。 "life appears" という意味だろうか? それとも "live emergency" という意味なんだろうか。 まあどっちでも意味不明的だけど。 確固-意味不明-国歌。こぇrgぁワかLやつはハン端っxtucci.
google://生現/ (971件)
TODO:
明日はまたミーティングに出れないので報告資料かかねば。その原料。そしてそれ:
やったこと:
で、類似表現抽出のなかでパラメータとゆーか、 調節可能な部分というのは結局どこなのかをまとめた:
そして、言語 (英語) の変化。ああこれはもう dsymni.
などとこんなところでいちいち説明するのは非常にカッコわるすぎてもう氏にたい。
UNIX ですこし大きめのプログラムを make した人ならだれでも、 あのなんだかわからんメッセージがだーーーっと流れるのを見てひるんだ経験があるのではないか。 ほとんどの人の感想は「あうーあうーなんか知らんけど動いてマスよこれ…」 というものだと思う。そしてワケわかんないところで止まったりして途方に暮れるのだ。
(思い出話) むかしは新山はあまり UNIX オタクではなかったので (オタクではあったが UNIX かぶれではなかったという意味、むしろマカーであった)、 まわりの人間が niyaniya しながら EmiClock (なつかし〜!) とかを インストールして「これは make 一発ですむので簡単だよ」とか言ってるのを 聞いても「へ〜 make ってなんじゃらホイ」というぐあいだった。 たしか xcruise をつくったあたりでは見よう見まねで Makefile の書き方を 覚えていたが (ちなみに当時いちばん慣れてた開発環境は Mac の THINK C だったのですよ! ああ、あのころは Symantec もウイルスワクチン屋なんかじゃなくて 先進的なソフトウエア企業だったのに…)、 人がつくった大規模なソフトウエアを自力でビルドした 経験はほとんどなかった。はじめて新山が自力でコンパイルした プログラムはなんだっけ。Lynx かなあ。これももう長い付き合いだな。 当時はまだ多くのプログラムが ./configure には対応しておらず、 Makefile を読んで書き換える方法が主流だった。さいしょにビルドしようとしたとき、 README だか INSTALL だかの英語を読むのに何時間もかかったことを覚えている。 無事コンパイル後の root で make install がこれまた緊張したこと! (当時まだ -n の存在を知らなかった) SunOS4 だ。当時はまだ学科のサーバすべてが NFS でつながっていた頃で、 たしか片山研で動いている Lynx の動作を参考にしたんだよ (その後 curses と端末と termcap の互換性問題にぶちあたり地獄を見ることになる)。 むかしは Solaris すげー嫌いだったんだよなー (自作のプログラムが 何もかもコンパイル通んなかなかったから)。いやーなつかしい… (遠い目)。もう話がわけわかんなくなりつつあるので終了。
gcc はとにかく沢山の人の手が入っていると思うけど、Stallman が書いたのは これのどれくらいの部分なんだろうか? いずれにせよもはや誰も全体像を 把握していないようなソフトだから、しかし、そういう「もはや手が出ない複雑さ」を あがめてはいけない。これは人災なのだ。
.rsrc
というセクションにデータが格納されるということも判明。
ResEdit を使ってた MacOS と比べるとへぼい仕組みだな。
Windows プログラマーの間ではこんなこと常識なんでしょうが…。
ちなみに、MFC しか使えない人間は「C++ でプログラミングできます」などと言ってわいけない。
しかし Linux 上で Windows 用の「ふつうのコード」が クロスコンパイルできるのはかなり便利だと思う。 まともな make が使えるしね。結局いくら VC++ の開発環境がいくら (見た目だけ) スゴそうに見えても、やってることは おなじみのツールで代用がきく程度のことなわけだ。なんだかとっても安心した。
で? それはいいのだが?? 問題は こんなことやってたらもう夕方じゃねーーーか!!! チクショーーーー!! ってことです。ああオレはまた週末をこんなことで。。。(以下略)
だが、すげー楽しかった、ということは認めなければならない。 どうせオレはオタクですよ! つーかきょうは外出るつもりで服着たのに、どうするよまったく (といっても家の中用のだぶだぶしたパンツのかわりにジーンズをはいたというだけの話だが)。
しかし日曜のこの時間なのに、なんでこんなに人いんの? なんかスドウさんもノヴァタさんもいるし。ほかにも結構人いるし。あやしきこと限りなし。 まあいいけどね。。。
ところで下に書いてある「忘れんな」という文字列をみて思いだした語句:
google://あげんな/ (2,660件)
TODO: (もう疲れてるんで適当に)
という歌をいま起きたら発作的に作詞・作曲した (本当は作曲までしたというのはウソである、でも♪マークさえつけときゃ なんとなく歌っているように見えるのだ)。 だって誰かが本当にどこかでニンニク使ってるん死者 (デスモノ)。 なぜか洗面所まで臭っている。 さて、けさはなんでこんなにテンション高いんだ? さっき目ざめた瞬間に思ったことは「ああそういえば -q オプションは いらねーや、とっちまおう」ということだった。 どうやら昨日今日は軽い躁状態にあるらしく、 きのうは 3時すぎまで起きていたのにきょうはふつうに目ざめるし、 まったくわけがわからん。そういえばきのうは統計の本を 読んでいたのにちっとも眠くならず大変だった。 べつに大変じゃないけど。ていへん。底辺? ヤッタネ!!!
てゆうか今日はオレ狂ってる (いつものこと)。 きょうは雨だから家の中にずっととじこめられていると気が狂うよ、 city へ出てみるるにもめんどくさいしなあ…。
これに対して新山をふくむ多くの日本人の理想はまったく逆だと思う。 こちらは最終的に「集合的な意識に同化する」ことを目標としている。つまり心中万歳。 世界をなめらかで平らなものにすること。欧米の個人主義が個性というものをどんどん 「とんがらせる」方向のものであるのに対し、新山が妄想しうる日本人の 完成形はこれとはまるで反対だ。自分の個性はどんどんすり減って丸くなり、 最終的には個というものは消滅する方向にむかう。まるで「1984」みたいだが、 この小説は「多様性は善」とかいうプロパガンダを信じこんでる欧米人だから 恐しく見えるんであって、まったく逆の価値観ではこれは恐しくもなんともない。 そういう世界は、退屈なのだろうか? いや、たぶんそのときは すでに「退屈である」という認識をおこなう主体すら残っていないわけだから 退屈とは呼べない。でも「1984」では実際にはビッグブラザーだけ特別扱いだから これって実はぜんぜん全体主義じゃないよな。だいたい、ほんとにそういう世界が 実現したら、もはや誰も自他の区別をせず、全員が集合的自我としての「we」という 人称のみを用いるので、ああいう独裁者というもの自身が存在しないのである。 北朝鮮とは違うのだ。でもこれって認知システムの崩壊だよな。 そういう状態で人間が生存しうるのかどうかはナゾである。 しかしまあ、“悟りを開く”というのはたぶんそういうことなんだろうよ。 残念ながら、ほとんどの人はそうなるまでには数十年程度の人生では とうてい間に合わないので、実際にはみんな個性的でも没個性的でもない 中途半端な状態で終わるわけだけど。しかしとりあえず、 そういう世界を妄想するだけはしておこうと思う。でもオレには無理だろうなあ、 いまだにこんな自己顕示欲が高い状態なんだから…。 つーか新山はむしろ自身の希望とは 逆の方向につっぱしってるような気がしてしょうがないのですが。 その理想に向かって、2ちゃんねるにはあくまで名無しで書き込んでるわけでしょうか??
まあ、こんなこといってるようじゃ、「楽して儲けたい」とかいってる連中とおんなしだな。おんなし。
なぜならそれはサカナが焼かれるときにだいたいそういう口をしているからで、 仏教徒としては動物を調理するのは罪であるから かならずそういうときはいつも焼く対象に対して感謝の意を表さなければならない (さすがに殺生の禁止までを徹底すると戒律がキビしすぎるので、 その規制は勝手に緩和することにしている)。 だからって魚ごときに感情移入するバカもあれだけど…。 だいたいヤツラはなにを考えてるかわかったものじゃないぜ? 文字どおり「住んでる世界が違う」んだから! たとえ魚が口を聞けたとしてもきっと彼らの日本語は (英語でもいいが) 半分も理解できないだろう。ライオンよりもずっと。 たぶん文法からしてすこしおかしいような気がする。 きっとこんなかんじだ。
「たいへん岩だったですよ? ことが海流ーにから…おまけにぬゆいだっても、 てんでおちらからへ往来へままならぬので…気じけっても、 そもがたゆってちゃしょうがないですから、メバレとげね、 追もってたら、ワル! っときて、おしたらもうのびてましたわ、パロッパロに」
ところでひらがなの「む」って字はなんか「む」って口のかんじじゃないですか?? 形が。
それにしても…。
まったく世間は戦争するかもしれないってのに、 こうして「魚言葉」を苦労して考えているバカも世の中にはいるというのは まあなんとも救いようがない政治。 そういえばチャペックの「山椒魚」を思い出したぞ (それは井伏鱒二だろ!)。
sqrt($4+1)/$3.
NE 辞書の半自動拡張に使えるか?
いや、しかしこれは NE とはすこし違う。だいたい NE の辞書に使うにはタグが必要だ。
これはむしろある単語の意味の「ユニークさ = パラフレーズしづらさ」という尺度を測定しているのではないか?
あるいは「類義語の少なさ」ともいえるかもしれない。
たとえばかなり rare な単語は類義語がすくないために、この値は大きい。
あとは専門用語とか…。でもこのデータが活用できるかどうかはまだわからない。
murder20/src のほう。どうやって正解をつくるか? 多少ルーズでも評価する方法はあるか? いま考えてるのは、「構造までは書かない」ということ。
cooccur をとるときにかんたんな照応解決をいれればもうすこし沢山とれる。 でも照応解決アルゴリズムの改良。やはり prefix/suffix は最低でも一致してないとだめ。 それから「松本容疑者」←「同容疑者」とはマッチできても、 「同容疑者」←「麻原容疑者」にはマッチできない。 これは一方向しか受けつけないように直すこと。 あと、あまりに長さの違う文字列はマッチさせちゃダメ!
共起する単語の分布を考えよ。 分布を仮定することによって、もしかして RIDF のような考えを使えないか?
あともういっこ何か考えたような気がするけど…。 (21:22) そうだそうだ、構文解析をどうやってゴマかすか? ということも考えねばなるめい。きょうもいいかげん KNP のミスには がっかりする。cabocha を使ってみようか。 でもそうすると文節を解析するルーチンを新たに作んなきゃならない。 だったらいっそのこと全部自分で…ということになってくる。 どうしよう? そもそも厳密に構文的な方法でとれるパラフレーズの数はあまり多くないのではないか? これについてはなんとしても正解を作らねばなるまい。 さらに「bunch of 名詞」な考え (これもいいかげんに名前をつけなきゃ、 自分でいってて恥づかしい) を使うのはいいアイデアのような気がする。 あとは?
てゆうかじつはコーパスにいちいちタグづけしなくても 曖昧じゃない文だけ正解に使えば…げふんげふん。 なんか見通しは明るいではないか! と思うことにしよう。
ああそうだ、授業中に教室の中をネズ公が走りまわっていたってこと。 NY にはとにかくネズミが多い。やつらはどこにでもいる。とくに地下鉄には大量にいる。
それだけのことだけど。
授業で Java を書かなければいけないので、めんどいなーと思っていたら Jython があったということを思いだす。 そんならこれを代わりに使えばよいのではないか。 でもいざ *.py をコンパイルしてみたら、おせーー。 しかし web ブラウザで動くというのは重要な利点である。
Jurafsky & Martin からおもしろい引用をみつけた。
しかし、「ある文章の確率」などという概念が、 この用語をいかように解釈してもまったく無益なものであるということは 認識されねばならない。
チームから言語学者がひとり減るたびに (音声認識システムの) 認識率が上がるんだよ。
まあ、心情的にはチョムスキーにやや同感ですがね。。。現実は厳しいのだ!
そういえばこの本にはほかにもいろいろとおもしろい引用が載っている。 なかでも、こんなのがあるのだが、これの原文はいったい何なんだろ?
words people
never use --
could be
only I
know them
ん゛ま゛゛ーーーー!!!
そう゛いえば明日はひさしぶりに゜ colloquia がないな。 久しふ゛゛りというほどのことでもないか゛?゛゛
うん゛。
TODO: 洗濯、税金。Form 1040NR。
しかしこっちに来てからいいことのひとつは、 サカナをずいぶんありがたがって食うようになったということだ。 第一あまり手に入らない。日本食料品店以外のスーパーで売っている鮭とかは 塩づけにしていないから、焼くとかなりナマぐさいし。 それに焼魚を食うのは何か仏教的美意識のようなものを感じる。大げさか。 肉ばっか食ってる連中は成人病で氏にやがれ。
それにしても家の玄関の前ってどういうことよ? それじゃ防ぎようがないじゃん!
ちなみにスドウさんは ACL に出す (らしい) 論文を書きあげたみたいだ。敗北〜。