"cookies.txt"
などで検索すると、何人ものクッキーを
ガッポリ見つけることができた (これがいかに危険かというと、
多くの web サイトではパスワード情報をクッキーに記憶させている。
だからある人の cookie ファイルにアクセスできれば、そいつの web メールなんかはやりたい放題だ)。
Google や AltaVista は彼らがそのことを知らせてから気づき
cookies.txt の全インデックスを削除したが、同じような例はきっといくらでもある。
だから、というわけでもないが、新山は自分のやっている研究にあまり
工学的な興味を感じない。しょせん検索など情報が多すぎるために生じた冗長な作業であって
(どのみち検索で好きな情報のみをあつめたところで人間の脳で処理できる限界などたかが知れている)、
多くの情報などじつは必要ない… (すくなくとも、新山の人生には)。
じつは世の中を悪くするための研究ではないか、とさえ思える (“よかれと思って”)。
それよりも重要なことは、より罪の少なそうな、科学的な探求としての自然言語処理
(人間を模倣するのではなくて理解するという方向) だと思っており、
この確信はこのごろますます深まるばかり。Python や Scheme に興味をもつのもそうだけれど、
オレの人生はいつもミニマリスト的だ。あるいは儒教的なのだろうか、これが?
てくるで、やっぱ Lessig のいちばんの傑作は CODE であってコモンズじゃないよなあ。
W. SQ. にいったら卒業式の準備たけなわ。 まだあと 2日もあんのに、あんなに占領しちゃってていいの?? 前後にもおまつりイベントがいくつかあるようだが。
てくるで、気づいてみたら 大学のホームペエジ が変わっている! いつのまに!! しかもまた意味なくこの JavaScript 要求だ、くそったれ。
きょうも「日焼け牛」で飲んでた。だいぶここも常連化してきたな (店の人は「また来月!」といってくれる)。 きょうのトークは Axiom という 数式処理システムをつくりだしたおじさん (というより、もう「おじいちゃん」って風貌だ)。 Axiom は Maxima ほど有名ではないが、とにかく古い。もう 30年以上も開発が続いている。 もともとフリーで始められたプロジェクト (というか、当時はそもそも ソフトウェアはフリーが当然だったので、「フリーなソフトウェア」という概念自体がなかった) だが、 ずっと Lisp で開発されていて、37年前の Lisp コードがいまだに動いてるんだそうな。 「このモジュールを書いたのは 1967年です」とかいってんだもん、びっくりしちゃったよ… (ちなみに Lisp の最初のバージョンが開発されたのは 1956年あたりとされている)。 当時はとーぜn Common Lisp なんてまだなかったから、もう方言だらけなのな。 そんで、今日のトークは「どうやって複数の Lisp の差異を吸収したか」ということがメインだった。 あとは数学的な話。会場には古い世代の人 (つまり 60歳ぐらいの人々という意味だ) が 沢山きていて、みんな何か昔話で異様に盛り上がっているのだが、その製品名とか聞いても ほとんど新山はもうわからない。むかしは IBM は偉大だった。 まだまだ書きたいことがあるのだけどねむすぎてもうだめ。ゆるして
さいきん、新山が急激に消費するようになった食品として、はちみつがある。 なぜかというと、夜ねるまえとか読書するときとかに何か飲みたいときがあるのだが、 オレは酒は飲まないし、カフェインの入っているものだと眠れなくなるしで (かといって decaf のコーヒーはまずい!)、しょうがないからこれまではハーブティーとか飲んでいた (ラヴェンダーとか、安眠系のやつ)。 しかしあるときふと「レモネードってどうよ?」と思いたち、それからは結構 レモンとはちみつを消費している (レモンはビン詰果汁のみでは全然香りがダメなので、生のやつを切って搾るにかぎる)。 で、はちみつオタクへの道をめざしているのだが… 欧米で使われているはちみつには実にいろんな種類があるのだ。 日本人がふつう「はちみつ」といって連想する味は もっぱらシロツメクサ (クローバー) だが、他にも数種類は売っている。 とーぜん、オレはあらゆる種類をためした。まだ全部について知っているわけではないが、 おおまかにわかった個人的分類を記しておく:
まだラう゛ぇンダーは試してないが、あれもなかなかキツそうだなー。
.com
になってたり .jp
になってたりでバラバラ。
おいおいこれは企業のページだぜ? けっきょく、「お客様への配慮」が足りんのである。 オレが客だとして、もしこういうページをみせられたら、きっと発注しない。 Web デザインの基礎からやり直せ! といっても、べつに新山は「Web デザインの基礎」など わかってはいないのだが、図形的なデザインよりも全体的なインターフェイスのほうが web ではずっと大切だと思う。いくらロゴに手をかけても他がダメならしょうがないのだ。
新山がこういうところで影響を受けているのは、Apple の UI ガイドラインだが、 Web でもその多くは適用可能だ。たとえば GUI のボタンの名前 (Web でいえば、 リンクのアンカーテキスト) は簡潔で極力誤解がない表現にしなければならない。 そしてそうした表現をみつけるには工夫が必要だ。スペースは限られているし、 ユーザの集中力も限られているので、デザインする側としてはテキストの ひと文字ひと文字まで考えぬかなければならない。 よく思うのだけど、インターフェイスのデザインは図形的センスばかりあってもだめだと思う。 言語 (この場合は、日本語) に対しても気をつかう必要がある。 ほかにも Apple のガイドラインでは、 「ここで終了すると変更内容は失われますが、保存しますか?」などの質問に対して、 「はい」「いいえ」ではなく、「保存する」「破棄する」などの選択肢に しなければならない、といっている。そういえば htmllint でも似たようなことで、 href のアンカーテキストに「ここ」などを使うと怒られたよなあ。 Mac は 84年当初からあんなことまで考えてたんだから、やっぱスゲーーよ。
同じようなことは他人のプレゼンを見ていてもいえる。 だいたい、プレゼン用のスライドが下手な人というのは、 「見た人がそれを一瞬で理解できるかどうか」考えられてないスライドをつくるのが多い。 表現が長すぎるとか、誤読しやすい単語だとか、話の流れとマッチしてないとか、 矢印の種類が一貫してないとか (それを見て「この矢印の違いはなんか意味があんのか」と余計なことで悩む人もいる)、 穴がいっぱいある。オチなし
httplib.py
のバグだった。Bug tracker には報告されているが
解決されてない模様。調べてみたら、サーバ側が HTTP/0.9 の response を返したときに
インスタンス変数が十分に初期化されないままコンストラクタを出てしまうことが判明。
1行パッチで直った。これはあきらかに実行パスのテスト不足だが、
まあこんなマイナーなケースで文句いっても仕方あるめえ。
それにしても世の中にはいまだに HTTP/0.9 を返すサーバもそんなにあるんかなあ…。
どうでもいいが (よくないが)、 きのうの Firefox のバグはじつはかなり深刻だったらしい。 やっぱ JavaScript は使いたくねえよ。そもそも JavaScript を on にして 意味のあるサイトって、 Google Maps 以外どこにもないのに、 それでも多くのサイトで無駄に JavaScript が要求される。やめてくれと言いたい。
計算機による日本語の影響について再考。 よく考えると自然言語というのは時間とともに曖昧性が増えるようにできているのだろうか? たとえば、ひと昔前なら「カメラ」という言葉はほとんど銀塩写真のカメラしか なかったが、いまじゃデジタルカメラの意味で使われることもかなり多いと思う。 でも、標準的な日本人 (あなたのことです) の場合は、 銀塩カメラのことはただの「カメラ」で、デジタルカメラのことは「デジカメ」ってよぶのかな? 「メール」は横文字だったために、「手紙」を置き換えることはなく、自然にこれらが混在できた。 米国でもまだ mail と email は同一ではない。 Microsoft は「2010年ごろまでに "book" といえば eBook のことを指し、紙の本はとくに "paper book" と呼ばれるようになるだろう」と予言していたけれど (その後この予言がどうなったのかは知らない)、この年代推定はともかく、 「追い出された語義」がどういう形態をもつのかは興味あるところだ。 しかし日本語ではこれも「本」が置き換えられることはなく、 「ブック」になりそうな気がする。 しかし本当にカブってしまったカメラについては、 一般的な日本人 (あなたのことです) が銀塩カメラのことを 特に指したいとき何というのかよくわからない。 「ふつうのカメラ」かな? 「ただのカメラ」か? それともやはり 「むかしのカメラ」になってしまうのだろうか。
話は戻るが、もし自然言語がつねに曖昧性を増やすように進化していくのだとすれば、
正直にいえば、firefox をいちおう使ってはいるものの、GUI のブラウザでは これが相対的に一番ましな選択だからという理由にすぎない (まあ、adblock は便利だが、Lynx だとそもそも絵が出ないから adblock 必要ないわけだし)。 ぜひとも使いたいブラウザがあるとすれば、それは自分で書いたブラウザってことなのだけど。
Google などはおそらく「ブラウザも web サービスでできたらなー」と 考えていることだろう。そりゃ無理だ。でもとにかく、 今やブラウザは OS と同じくらい重要な基幹コンポーネントであることに変わりはない。
そういえば、米国でも厳格なキリスト教の家庭では、食う前に十字をきって 「いただきます」に相当することは言うらしいが、「ごちそうさま」に相当することを 言うとは聞いたことがないな。
新山が「ムーミン」を好きな理由のひとつとして、あれを読んでいると、 ムーミンの世界には「食い物の好き嫌いでヒトを判断する」という風習があるかのように見えるところだ。 飛行おに (巨大) がジャムとパンケーキを食っているのを見て、ムーミンたちが 「ジャムとパンケーキをおいしそうに食べている人に、悪い人なんていませんものね」と考えたり、 どっかの革命家 (似非インテリ) が「好物はじゃがいものプディングとニシンなんだが」というのを聞いて、 スノークの彼女が「げーーーっ! ムーミンならそんなもの食べないわ!」と言うところをみても、 そういう感じがする。
計算機の普及以前には、「画像」なんて言葉は「静止衛星画像」ぐらいにしか使われてなかったはずだ。 この例でおもしろいのは、「画像」はべつに写真とは限らないということである。 ふつう、こういうふうに意味の曖昧性が広がるように言語の用法が普及するってことは、 あんまりないのではないか? 実際、カメラで現像した写真は「画像」とは呼ばない。 英語ではいまだに photo とか picture が一般的な気がする。image というといろんな意味がありすぎるし、 すこし専門的なにおいがする。
clap to crap.
きょう図書館で借りてきたインタビュー本が非常におもしろく、一気に読んでしまった。 印象に残った部分を引用。長すぎる?
陳平原 「…広島は不愉快なところでした。専攻の関係で歴史についても研究しているのですが、 ここは日本でもっとも重要な軍港だったのです。中国を侵略した日本軍の軍艦の多くはここから中国へ向かいました。 ただ私が原爆記念館で見たときは、市民がどれほど悲惨な被害にあったかが書いてあっただけで、 対中国侵略の軍事基地だったという加害者の立場にはなにも触れていないのです。 …私が長崎に着いたときはちょうど雨がしきりに降っていました。 まず平和公園に行くと、そこは平和への祈りをメインテーマにしていました。 私は、広島では (原爆の) 告発がメインだったことを思いだしました。長崎のやり方は はるかに共感を覚えやすくなっています。平和を祈るのに反対する人はいないでしょう。… 原爆や戦争について、日本の学者と話すことはできますが、深く つっこんで話したことはありません。日本人は内心では相手のいうことを まったく認めていないということを、私は知っていますから。… もちろん、 反省するのはたいへんな苦痛です。私はよく自問するのですが、 もし私たち中国人が日本人の立場だったら、どのような態度で反省するのだろうかと。 中国人はこのような事を考えるのが得意ではありません。はっきりいって、 中国人の傲慢さは日本人とすこしも差はないんです。ただ、ここ百年ぐらいは 中国が被害者の役回りばかり演じてきたおかげで、中国人は堂々としていられます。 かりに中国人も第二次世界大戦の加害者の一員だったら、罪を懺悔するだろうか、 と私は思うのです。… 今や中国人はどこででも迫害・抑圧されているイメージが あるように思えます。あってはならないことですが、もしわれわれがあの一員だったら、 私たちはどのように歴史を見たらいいのでしょう。私が福岡に行ったとき、 地元の日本人は元寇の侵略跡に案内してくれました。 そこで私はやはり自分にこう問い直さざるをえなかったのです。…」梁暁声 「…商業化社会を迎えるためにはいくつかの環境整備が必要です。まずひとつは平和であること。 日本は第二次世界大戦後、いろいろあったにせよ、平和でした。…アメリカと特殊な関係を結んで、 後見人の役割を果たしてもらっています。その強力な後見人を得て、 国内政治の安定を維持することができたのです。つぎに、政治を完全に政治家たちの仕事にしたこと。 あるいは政治家の役割を限定したともいえましょう。日本の政治家たちは株価の上昇や下落を 招くことはありますが、国情や社会システムを大きく変えることはもはや不可能です。 この 2つの条件をクリアした日本では、一般の国民は戦争と平和に関する問題、政治や社会に関すること、 さらに社会的不平等などの問題をほとんど考えなくてもすむようになりました。 こうすることにより彼らは経済や商業の発展に力を集中できるのです。…」
梁粛戒 「…1944年、私が国民党地下組織の責任者であることがばれてしまい、憲兵に逮捕されました。 日本が降伏する前年のことです。当時、日本人はなにかというと中国人を逮捕していました。 しかし偽満州国で司法官をつとめる私の場合は、司法大臣の許可なしには逮捕できないのです。… 起訴されるまでは、給料もそのまま支給されました。特務課に拘留されていたので、取調べが 一段落したとき、家族の面会も認められました。ちょうどその日は祭日で、わが家にはビール 6本、 パイナップル缶詰 1個の配給があり、妻はそれを持って特務課にきました。取り調べ担当の 小西という憲兵が、一緒に飲もうと声を掛けてきたので、『よし、飲もう』ということになりました。 ところが酒が入るや彼は文句をいいだしました。『ちくしょう、俺は警佐で、日本人だぞ。 俺の家にはビールは 1本しか配給されないのに、満州国人のお前は検察官だから 6本も支給されるんだ。 なのにどうしてお前は抗日するんだ』 …」
-- 莫邦富 「中国人は落日の日本をどう見ているか」 草思社
ところでこの本には、「政治」や「治める」の「治」という字は、 もともとは「治水」の意味だったと書いてある。 つまり、黄河の氾濫を治水する者は一国の領主たりえたという意味らしいが、ホントウかな?
どうでもいいが、Google より悪なのは Amazon だと思うが、あんまり目立たないな。 いま気づいたが Google の強引さ (とアヤしさ) というのはライブドアのようなもんかもしれない。 ただしライブドアがまともに仕事してない (少なくともそう見える) のに比べて、 Google はまともに仕事している。しかし本質的な性格は同じだ。 連中がもとからうさん臭かったのか、あるいはデカくなってからうさん臭くなったのかは知らないが、 まあだいたいこの手の会社にはどこも同じような臭いがただよっている。 いやー昔のヒトはいいこと言いました。“タダより高いものはない”とね。 これ、いったいどこの諺なんだろ? 本当に日本か? でも考えてみればアレだ、理論的にいえば Yahoo も同じくらいうさん臭いはずなのに、 こっちはあんまりそういう雰囲気を感じさせないよなあ。なんでだろ?
ワオー! すげーな。いま Slashdot のほうがほとんど翻訳済みの状態だよ。 これも Traiss 参加者のみなさまのおかげです。つっても、あと 1時間もすれば またドバっと未訳記事が増えるのだろうけど。 まるで翻訳マラソンだ。しかも相手は休みなしだ。
どうでもいいが、いまスゴい意訳を思いついた: slashdot の "fp" を "2" と訳すのである。
seq.append(obj)
→ vec.add(obj)
isinstance(obj, C)
→ (obj instanceof C)
fp = file(fname)
→ BufferedReader fp = new BufferedReader(new InputStreamReader(new FileInputStream(fname)));
'abc'
→ "abc"
新山がなぜ Java が嫌いかという理由が上の 2行に示されている。
ところで (てくるで)、 comp.lang.lisp
での Kenny の議論を読んで、
なぜ Lisper 達が「マクロはよいものである」と主張するのかがわかった。
とくにマクロは安全なプログラミングに役立つのだ。
「マクロといえば #define
」と思っている身からすると
これは信じられないが、問題はC の人間と Lisper との間で、
「マクロ」という言葉のもつひびきがかなり違っていることだ。
Lisper のいう「マクロ」は #define
のように単純なものではない。
Lisp では、マクロを使うのは簡単だが、C とちがって
マクロを作るのは並大抵のことではないとされる。
しかし正しく設計されたマクロは本当に役に立つ。たとえば次のような C のコードを考える:
ここで、
FILE* fp = fopen(...);
...
fclose(fp);
fopen
の対になる fclose
は絶対に必要である (まあ、たてまえは)。
だが、ときにプログラマは最後の fclose
を忘れることがある。こうしたバグはけっこう多い (はず)。
ところが、Common Lisp ではこう書けるのだ:
(with-open-file (fp fname)
...
)
with-open-file
はマクロである。
この変数 fp のスコープはこのフォームの中でのみ有効で、
ここから出るときにかならずファイルは閉じられることが保証される。
つまり「カッコの対応」さえ守れば、ユーザがファイルを close し忘れるという事態を
ふせげるのだ。こういう例は実は沢山ある。たとえば、OpenGL なら、
glBegin()
のあとには glEnd()
がかならず必要だ:
これも Lisp のマクロならこう書けるだろう:
glBegin(GL_POLYGON);
...
glEnd();
つまり、プログラマが「対になっている呼び出し」をいちいち覚えておく必要がない。
これは Lisp のマクロが単純な文字列置換ではなくて、ブロックの前とうしろに
文字列を追加できるようになっているためだ。Python でもクラスを使えば
似たようなことはできるだろうが、煩雑になるし直観的でもない。
しかしかりに Python で似たようなマクロを導入しようとしても、
すでに構文的な制約がきつすぎて不自然なものにしかならないだろう。
つまりここでは Lisp の「なんでもカッコだけで構文が区別できない地獄」は
逆に有利な点として働いているのだった。
これはおどろきだ。やっぱり Lisper はあなどれねー。
しかし、それでも新山は Python だけど…。
(gl-define-primitive (GL_POLYGON)
...
)
今日の馬鹿スラ: ライトセーバーのしくみ
自分で紹介しといて (しかも自分で翻訳しといて) ナンだが、 新山はスターをーズは全然好きじゃないし、スタートれっくも全然好きじゃない。 昔もいまも「男の子向け」の話がぜんぜん好きじゃないのだ。 といって女の子向けの話が好きなわけでもないけど… (しかし少年漫画はぜんぜん読まないが、少女漫画は多少読んでいることを考えると、やや女寄りなのか?)。 ついでにいうと銀河ヒハガはまだ読んだことない。
てくるで、ライトセーバーでもやはりコンニャクは切れないんだろうか?
あっそうだ、来週はコンピュータセキュリティの試験があるんだった。
あっそうだ、今日の夜はコンピュータセキュリティの補講があるんだった。 この授業は習うことが非常に多い。今回の授業で読んだ (というか読まされた) 論文をかぞえてみたら全部で 34本もあった。しかも各々が全然違う研究 (でもシステム屋のあいだでは有名な論文) なのだ。
知ってるよ。けっっ
日本では「ハードディスク」「ビデオカード」という言い方がメジャーなのに対して、 米国では「hard drive」「graphics card」という言い方が (graphics のほうは拮抗しているが) メジャーだ。
Kerberos は基本的に欠陥プロトコルである (彼の偏見入り)。 にもかかわらず MIT はいまだにこれを使っているのはなぜかというと、 リプレースが面倒というのもあるが、MIT では AFS (CMU が開発した分散ファイルシステム) がいまだに使われていて、これが Kerberos と密に統合されているかららしい。 たしかに、いまだに分散ファイルシステムっていったらまともに使えるのは NFS か AFS (か、その後釜の Coda) か、 CIFS しかないもんな。WebDAV はファイルシステムじゃないから却下。 で、さらに Kerberos ではあらゆる認証が最終的には KDC で管理されていて (だから暗号化通信は SSH のように簡単にはいかない)、まちあす先生はあきらかにこれが嫌いなのだが、 一部の人々は Kerberos KDC の集中管理がほんとに好きらしい、という話。
だった。
だた。
てくるで、研究者はじつは考えるのがキライなんではないか、という話。
研究者というと、普通は頭を使う職業のように言われているけれど、 実際には彼らは本当には考えていない。 与えられた問題、与えられた枠組みのなかで、パズルを解くような 問題に取りくむのが好きな人は多いらしいが (誰とは申しません)、 彼らはべつにたいして頭なんか使ってはいないようだ… 少なくとも新山のいう「頭を使う」という意味では。 パズル解きというのはほんらい機械的なもので、基本的には反射の世界である。 そこに内容的な深みを見出すことは (よっぽどの達人でない限り) むずかしい。 つまり、なんて説明すればいいのかな、 「問題から一歩引いて、それを外からながめる」ことができない人が多い。 若輩のオレから見てもそうなのだから、いわんや達観した人から見ればなおさらそう見えるだろう。 みんな自分の問題が本当の問題であるかのように考えているが、 はたしてそれは本当の問題なのか。結局、みんな問題の解法について考えるのは 大好きらしいが、問題そのものついて考えるのはキライなんではないか。 結局のところ、大部分の研究者は与えられた知的なエサを食うだけで終わるのである。 そうでなければ、あんなどうでもいい研究ばかりが量産されることはないはずだ。
ふとそう思った。 まあ、彼らが貴重な人生をどう使おうがオレの知ったこっちゃない。
マイノリティーの血。
google://kebaber/
google://kebabist/
てくるで、あいかわらず Kookle は「々」を検索語から無視しやがる。 日本語のわかるヤツが作ってないことの証拠だ。 これは句読点じゃねーっていってんだろーーが! この点のみは Yahoo の勝チだな。
ニューヨオーク・POST の読者登録ができねえよオー。 ここはいわゆる日本でいうところの「東スポ」的新聞で、 ここから言い換え いんちき表現をとってこれたら 楽しいだろうと思ってクローラを走らせているのである。 しかし今まではタダで記事が取り放題だったのに、2日ぐらい前からいきなり (他の有名新聞と同じように) 登録制のサービスに移行した。 登録はタダなのだが面倒くさい。そしていまは移行時でものすごい負荷がかかっているらしく 登録しようとしても「ごめんなさい」エラーばかりでる。くそったれ。 負荷テストぐらいしろ。
プレゼン練習につきあっていたらまた hobokenized された電車になてしまた。 明日は Ralph がいうところの「マラソン」があるので、たいへんだ。 今日は早く寝ないと。明日の具体的なスケジゥルは以下のとおりである:
きょうの教訓: Swing には純粋にデータ構造のみを扱うモジュールもある。
たとえば javax.swing.tree
とか。
しかしそれを java.awt.datatransfer とまぜていたので、話がややこしくなっていた。
それにしても Ralph もよくこんな複雑な API 使うよな〜。
彼はあの歳で Java をゼロから覚えて GUI も書くし Drag and Drop も
サポートするしでたいしたもんだと思う。ちなみに、Java に行く前は
バリバリの CommonLisp プログラマだったというから、やっぱりスキなんだろうね。。
このプログラムにはもうひとつ問題がある。それは出力が sgml (モドキ) なことだ。 GLARF の出力は S-exp だから、いままではそっちだけ扱っていればよかったが、 これからは sgml と s-exp の出力を両方読んで、統合させなければならない。 おまけにこっちは Parser も dbparser で違う。全部でいったいいくつのソフトウェアが からんでいるんだか、もう数えたくないが、こんだけあるとセキネさんのように 全部を統合したシステムをゼロからつくりたくなる気持ちもわからんではないね。 しかし、彼の oak は使いたくないが…。あれは言語処理についてはある程度知っているが、 ソフトウェアを知らない人がフレームワークなど作ろうとすると必ず起こる不幸のひとつだ。
くそー、また試験と重なってるじゃねーーーか!
明日の todo: I-20 とパスポート持参、OISS。
今日はすずしかった。夕食はあまりものでスープをつくる。
またライブドアだが、「ウォレット」というのはどうにかならなかったのだろうか? どうしても「ウォシュレット」と読めてしまう。そもそもあの会社はなんでも カタカナ名にしすぎだ!
なぜ Google は日本法人を「グーグル」にしたのか? 「…グル」という響きがよろくなき。日本市場にむけては 「ぐーぐる」とひらがな表記で登記すべきであった。 絶対、みんな (= 新山以外のすべての日本人) は「さすが Google、名前の選び方もススんでるなあ〜」といってくれるだろう。
google://カタナカ/ (46,50件)
さて、以上のは戯言。これからが戯言。
言い換えについての考察。 以前、「なぜ人は言い換えるのか」という疑問を呈した人がいたが、 むしろその逆を尋くべきだね。「なぜ人は言い換えないのか??」ということだ (これは Austin がずっと前に研究しているらしい)。言い換えは語義の曖昧性解消とじつは 表裏一体をなす問題であるということにだれか言語処理屋は言及しているだろうか。 これに言及しない言い換え研究はインチキである。なぜって、 「同じこと」を「異なる言い方」で表現したものが言い換えだと人はいうが、 世の中には、「違うこと」をわざわざ「同じ言い方」で表現したものもあるじゃないか! たとえば、古典的な例として
…なに、区別しすぎだって? それじゃー今度はまとめる方向で考えてみよう。 「内定を蹴る」のと「ボールを蹴る」のはおんなじだ。まったく同じ動作であり、 寸分も違う部分はない。 おまけに「殴る」と「蹴る」もじつはまったく同じであり、したがってこれらは 「蹴る」に一本化するべきだ。ついでにいうと、「蹴る」と「食べる」もまったく同じだね。 だから「今日のお昼は、スパゲッティーを蹴ったよ」というべきだ。 つまるところ、日本語に動詞は一個しかいらない。 なぜなら、どの動作もぜんぶ同じなんだから!
これでも不適当だとするなら、どの動作を「同じ」とするのはよくて、 どの動作は「違う」べきなのか説明せよ。なぜそうであるべきなのか。 動作の「同様性」という量が存在するのか? (それらはコーパスで数を数えればわかるのかもしれないね!!) 同様性が 50% を超えた動作は「同じ」動詞を使うべきで、 そうでない動作は「違う」動作を使わないといけないのかもしれない。 そしてそれは誰が決定するのだろう。どこかの法律で決まっているのか?
自然言語に関しておかしなことのひとつは、すべて個人によって解釈が違うようでいて、 じつはすべての人間が「何か」にあらかじめ同意しているように見えることだ (「何か」とは文法のことではない、この「何か」は世界中すべての人間にあてはまる)。 これはプログラミング言語では考えられないことだ。 ではその「同意」は、誰によって埋め込まれるのだろう。 たぶん生まれてから保育器の中にいるあいだに注入されてるんだね! オレの知らないあいだに!
「言い換えとは、同じ内容を異なる表現で表わしたものである」 (×)
「言い換えとは、異なる内容を同じ表現で表わしたものである」 (○)
bullshit.
イヌイットの言葉には 200種類以上の「雪」をあらわす助詞があるといいますし、
ベドウィン族の言葉には 4.2e+23 種類以上の「ラクダ」をあらわす句読点があるといいますし、
ウィトゲンシュタインに言わせれば「それは違うじゃないか」 「いえ、まったく同じようにやっていますよ」ということなのだろう。 あなたはそれを「同じだ、同じだ」と言い、オレはそれを「違う、違う」と主張する。 この結着は永久につかないので、モンティ・パイソンのように、リングに上がって…
あれってどっちが勝ったんだっけ? 最後。
どうでもいいけど、Lenovo のデスクトップパソコンは "Tianjiao (天驕?)" シリーズっていうのな。カッコいいな、なんか。 なぜ日本のメーカーは日本語名をつけないんだろ? (答えは知っている) しかし「速そう」な名前はみんな JR の列車名にとられているような気もする。 「やまびこ S40」とか「ハイパーにちりん 3200」とか「苅萱道心 560X」とか「グスコーブドリ-neo」とか とかゆう PC あったら絶対イイと思うのだが。 さらにまったく必然性がないが (おまけにどうでも飯-ii)、ロシアで PC ができたらぜったい名前は「ドミートリイ」だね! (個人的に好きなのはイワンなのだが、かれは名前的にインパクトがないので没)
てくるで
「苅萱 (かるかや)」っていう響きはとってもスキである。 ちなみに長野駅前には「かるかや山」なる地名がある。 なんやら善光寺に関連する地名らしいが、くわしいことは知らぬ。
問 1. 以下の問いに○か×かでお答えください (10点):
NULL
ポインタの正式な定義は ((void*) 0)
である。
問 2. 上の問いのうち、プログラマの常識を判断するのに使う問題としてふさわしくないものを すべて選び、理由とともに書きだしてください (90点)。
問 1. の答え: 解答があるなどと思っている奴は失格。
問 2. の答え: ぜんぶ不適当。理由は明白。
まぐにたふ ぉん
たべすぎ?
たべすがない!!
やはり言語処理屋にまともなコードを期待したオレがバカだった。ちくしょう
きょうの アホ slashdot: すべての時間旅行者が 過去・未来から 2005年 5月7日に集まる大会。 まあ、ホラふき大集合だろうな、これは。 むかし Yahoo! オークションでタイムマシンを売った奴がいたのを思い出すが、 あれはどこまでいってもイタズラっぽかったのに対して、これは少なくとも 論理を通そうとしているところが何つーか、まじめにアホだ。
ちなみにこの slashdot の書きこみで知ったが、米国にもこのタイムマシン男と同じようなことをやった John Titor なる人物がいたらしい。