2005年 3月 (1)。

Last Modified: Fri Mar 11 10:49:44 EST 2005 (03/12, 00:49 JST)

Mar 10 [Thu]


(07:10)
寝屋川とネワ河は似てるよね。
(14:28)
最近、ふたこと目には「PhD をとるんだからそれくらい考えないと」と言われる。 非常にムカつく。別にとりたくてとってるんじゃねえよ! と言いたい状況であるが、 黙って耐えることにする。。。

てくるで、高額 工学博士と PhD は違います。

(16:18)
まだサムいんかいな? まあいい出てみりゃわかることだ。
(16:33)
サムかったが、それほどでもなかった。 夕方にかけてまだひと仕事せねばならないのでコーヒーを買い、鋭気をやしなふ。

どうでもいいが、今日の新山のシャツには例の空色のバッジがついている。 おそらくほとんど誰も気づかないと思うけど。

「そらいろ」という単語の響きはいいよね。うんいい

(20:44)
ふむ。そろそろ伝家の宝刀である言い訳「コーパスが悪い」を使うときがきたか。 というか、使わなければならないのか? 使う必要があるのか? インチキだなぁ〜もう。
(22:42)
ところで、自動的に学習された表現を調べているうちにヘンな言い換え表現を発見したのだが、 以下の 2つの文は、set と broke じゃぜんぜん違うように見えるが、 じつは X にあるものを入れるとほぼ同じ意味になるのである!

わかるかな? (答えは以下にコメントとして書いてある。このページのソースを参照)

いや、おどろいたね。 まあ、しょせんインチキ言い換えだが。

(00:41)
さいきんの nyc いろいろ。(注意: どれもメチャ画像デカイです)

さいきん気づいたのだが、新山はやたらと遠近感のある景色をとりたがる。 そういうものを面白いと思うらしい。

でじカメを新しいのに換えてから、いつも持ち歩いているので なんかあったらすぐパチリ。いい買い物をしたと思う。

(01:03)
うわっはちみついれすぎた。いれすぎ。

Mar 09 [Wed]


(08:55)
きのうの授業で、じつは毎朝午前 3時 (4時でもいいけど) に root 権限で 実行される以下のコマンド (/tmp にある使われてないファイルを消す) はセキュアでないという話を聞いた。これがおもしろい:
find /tmp -atime +3 -exec rm -- {} \;

アタックの方法:

ここで難しいのは「タイミングをどうやって計るか」ということだ。 以下のような方法がある。

あったまいい〜〜!

(10:24)
「ウシ食うか、さもなくば戦争だ」 by ぶっしゅ

新山は最近全然ウシ食っていない。トリなら食っているけど。鳥インふ。

(12:01)
やっぱりちこくしました。なんで?
(13:38)
停電しルータが動かず、同時に火災警報がきた。
(22:35)
こんぷりめんと

あじゃんくと
(22:38)
研究で使うプログラムを C (や C++) で書くとなぜよくないかという理由。 うっかりアルゴリズムを C なんかで書いてしまったら、 それが精一杯の速さであることがバレてしまう。 Python で書いているかぎり、「その気になればもっと速くなるもんね」という 安心感が得らるる。一生その気になんないけど。 …つまり、安心感のタダ食いが可能というわけだ!

Mar 08 [Tue]


(08:04)
ドイツ語部隊がんばるなー。すげえよ。 しかもカシコイことに plus.html は翻訳してない。 まえまえから思っていたのだが、もしかすると書いていなかったかもしれないので、 いま書いておくが、ドイツはかなりの FOSS 先進国って感じがする。 LinuxTag も SuSE (現在 Novell の一部だが) もドイツだしさ…。 これにくらべると、米国はしょせん MS の手先だ。 Scribus のソース中にあるコメントが全部ドイツ語で書かれていたのをみて、 ああドイツ語を勉強しないとなあ、と考えたのはオレだけじゃあるまい! 今のとこ全然進んでないけど。ほんとは大学のドイツ語講座を取りたいのだけど、 そんなことしてたらセキネさんに殺されそうだから (まだ今のところは) やんない。
(08:39)
オマエが卑怯者だとしたらオレは余興者だ!
(08:58)
end-to-end についての考察。かりに、生成文法の人々がいうように、 人間の脳のなかに形態素解析や構文解析をおこなうモジュールがほんとうに存在していたとしても、 それらは現在の計算機がやるそれよりもずっと下手なやりかたでしかできないだろう (たんなる予想だが)。ではなぜ人間がいつもほぼ 100% に近い解析ができるのかというと (…というより、これは定義があべこべなのだけど)、それは低レベルな層での処理をつねに なんらかの方法で補正しているからだと考える。しかし「情報の補正」というのは、 かならずその情報に何らかの冗長性が存在していなければできない。 自然言語の場合、ほぼ 100% 補正できるのだから、そこにはかなり豊富な冗長性が 存在しているのにちがいない。ではその「豊富な冗長性」とやらは一体どのレベルまでいけば見えてくるのか?

おそらく「補正が失敗した状態」というのが、「誤解」という現象である。 しかし誤解というのはときどき、本来の言葉の意味とはまったく違う意味でとられることがある。 とりわけ対話で起こる誤解はおもしろい。文章だと何度も読みなおすことができるのに、 リアルタイムな会話では、誤解は一瞬のうちに起こり、修復がむずかしい。 このような誤解について研究している人はいるんだろうか? いそうだけど、 新山は心理学に疎いのでぜんぜん知らない。似たようなので思いだしたのが、 将棋 (or チェス) の名人に 「盤面を記憶してくれ」といった研究は聞いたことがあるな。 かれらは (それらしい盤面であるかぎり) ほとんどどんな局面でも 正しく盤面を復元するが、間違えるときはまるっきり違う配置をする、という。 これは誤解になんとなく似ている。つまり彼らには、将棋の駒の配置から まるで自然言語のような意味やらストーリー性をよみとることができる能力があるのだろう…。

と、考えると、人間の“言語的”能力というのは、ちっとも 文字列や音声や手話に限ったことではないと思う。 なんで GB 理論の人々は将棋について研究しないんだろうか? オレは基本的に生成文法を信じてないが、たとえそういうものがあったとしても そこは自然言語の理解にはあんまり関係がないと思っている。 重要なのはもう一方の終端であり、表面的な違いにばかりこだわっていると いつまでたってもそっちへたどり着けなそうな気がするのだ。

「補正」とは、この場合「おそろしいまでの一方的な思い込みによる偏見」のことでしかない。

(10:14)
雨だった。

「ばかなことをしたものだ!」とぼくは翻訳口調で呟きながら、大学へと向かった。

そこは砂場だった。

(11:49)
Wednesday, March 9, 2005 - 11:15 a.m.
Room 1302 Warren Weaver Hall
251 Mercer Street
New York, NY 10012-1185

Speaker: Tong Zhang, IBM TJ Watson Research Center

Title: A Framework for Learning Predictive Structures from Multiple
Tasks and Unlabeled Data
明日のころきあだけど、これっておもしろいのかなあ…。 (直感いわく「おもしろくない」)
(15:01)
気がつくと外は吹雪です

NYキライ

(20:18)
道のジャリ雪が、いつのまにやらガチガチに凍 (こほ) ってゐるのですが。。。
今夜は -10℃、明日も真冬日らしい。

NYキライ

アップタウンの飲み会に行こうかどうしようかなー。もう遅いし。

(00:23)
帰ってきて、もう死にそう。外はふきとばされるほどの強風であり、 道は昼間つもった雪水が凍って砂糖菓子のようにまだらにてかてか光っている (これ、何て言ったっけ?)。 いやはや、駅から家に着くまでにこんな死にそうな思いをするとは!

いくつかの楽しいことがあったが、それはどれもここに書くには適さない (いやはや、「ここ」に書くのに適さないことなど世の中に存在したとは!)。 唯一、特筆すべきことは、はじめて四迷レッドを飲んだということかな。 たしかになかなか変わった味がしたが、まあそういうものだと思えばそういう物 (以下同文)。

今日はキホン的に翻訳口調の一日だった。たまにゃあそういう日もあるさ。

追記。そういえば、はじめて ipod shuffle を見た。 あんなにウスっぺらいなんて予想
外!

Mar 07 [Mon]


(11:05)
ごえっ。今日のころきあは遅刻じゃ。出たかったのに〜〜!
(12:18)
きのうの nytimes はソニーの社長人事をトップ記事で伝えていた。 いつも思うのだが、外人を社長にしてまで成長させたい「会社」というものが よくわからん。あるいは成長させたいのは「ブランド」なんだろうか? それはまるで脳を移植してまで生きたい人のようなもんだと思うが、わかんない。 あれほど規模がでかくなるともはや会社の「意思」というか、「個体性」みたいなものは 一体どこにあるんだろう? ほとんどないんじゃないかな (ワンマン社長をもつ 西武やダイエーにはそれがまだあったのかもしれないが)。

てくるで、「~」をたくさん打ちこまなければいけないのはとても面倒くさい。

(13:23)
またもいんちき質問応答システムを発見。
http://rr.ducr.u-tokyo.ac.jp/

毎度のことだが、なんで「文章で入力」させるんだっ。 どうせ解析なんかしてないくせに。キーワード取ってるだけのくせに。 これはなぜかというと、入力された質問文を記録しておき、 あとで言いまわしの研究用に使うためなのである (たぶんそう、セキネさんもそうやってたから)。 おまけに結果も読めたもんじゃない。日経の記述をみると 「人工知能を利用した…」「意味を理解する概念検索…」などと紹介しているし。 いくら宣伝のためとはいえ、こんな誇張では WIRED どころか「ムー」の世界だよ。

この手のシステムでいつも不満なのは、ユーザビリティテストをちゃんとしたのかという疑念である。 まともな使い手がいればオレなら絶対こんなふうには作らないね。 (= つまり、どうせまともに使おうとした奴なんていなかったんだろうという意味。)

しかしね、諸君! そもそも「欲しい情報」などというものはそう簡単に手に入るものじゃねえのですよ! たとえ砂のマサゴが尽きるとも。いっくら計算機が進歩したってね。

そして、ついでに言わせてもらうと、東大なんか検索しても たいしたもん出てこない。

(15:58)
あたかい。というより、あついくらい。 昼食はひさしぶりに Dosa にすることにした。 Washington Sq. に散歩に行くと、日なたぼっこしている多勢の観光客やヒッピー風味の若者 (ギターを鳴らしている) がいる。露店の Dosa 屋はちゃんと開店していた。 久しぶりにおっさんと話し、Masala Dosa を買う。 なんだか今日のチャトニーは色が違うね?
(20:02)
やはり Pyone はもうちょっと改善すべきだと思った。 awkperl -ane よりも便利である。 「これ awk でどうやるんだっけ?」とかいって man を調べているよりもぜんぜん早い。

げっぷ

(21:33)
帰ると部屋の暖房がなおっていた。やったね。

きょうは早く寝て速く起きるんだぞ!!

Mar 06 [Sun]


(14:11)
どうも暖房がボっこわれているらしく、部屋の中がサムい。ぶるぶる。

あなたには勝手な推測をする権利があり、わたしには思わせぶりなことを書く義務があります。

…だが、必ずしもその法則はいつもうまくゆかない。原因はここにある。← (ななめ下) ここに。

(14:26)
翻訳について再考。もとの英文:
For example, 
"example.com" matches a blacklist entry of "example.com", but 
"www.example.com" does not.
ここでは "matches" と "does not (matches)" が並立の関係として対応している。 で、これをそのままこう訳すと:
たとえば
"example.com" は、ブラックリスト中のエントリ "example.com" にマッチしますが、
"www.example.com" はマッチしません。
こうなる。 これは間違いではないが、通して読んだときになんとなく意味がつたわりにくい。 最後の「…はマッチしません。」を見たあとに、一瞬「え? 何が何にマッチするって?」と考える間がある。 これは間に挿入されているものが長いのと、あとの省略でその挿入句を参照しているためだと思う。

かといって、これはあきらかにクドすぎる:

たとえば
"example.com" は、ブラックリスト中のエントリ "example.com" にマッチしますが、
"www.example.com" は、ブラックリスト中のエントリ "example.com" にはマッチしません。

じゃあ、いっそのこと主述の関係を逆にしちゃったらどうか:

たとえば
ブラックリスト中のエントリ "example.com" は、 "example.com" にはマッチしますが、
"www.example.com" にはマッチしません。
日本語としては、これが一番自然なような気がする。 助詞として譲歩をほのめかす「には」が使えるのも気に入っている。 実際にはこれはいつもうまくいくわけではなく、この場合は「マッチする」が ほぼ同値関係で、どっちがどっちでも似たようなもんだからできたわけだ。

で、これを思いついてから、この差は 日本語と英語の語順の違いのためもあるのではないかと思った。 つまり英語では動詞がつねに前にくるので「左にそろえる」ほうが自然に見えるが、

A matches ... but
A does not ...
日本語では動詞が後にくるので「右にそろえる」ほうが自然に見えるのだ。
… にはマッチしますが、
… にはマッチしません。

でもほんとうかな? どうかな? これ以降は意味不明。

(15:20)
intern() て Unicode には効かないんだね…
(17:55)
かうものりすと:
(19:31)
背景、○○ょん様

あなたのバグを疑ってしまい申しわけありませんでした。
すべて悪いのは私がうっかりリストではなく generator を比較していたからで、

新山

す。

(20:28)
そういえば昨日告白するのを忘れてたから書くけど、 まえに東工大でオモチャみたいな研究やってたときは、なんとなく 「統計って厳密そうでいいよな、みんなやってるし、 人生のうちに一度はそういう rigid なのをやってみるのもいいかもな」と 漠然と思ってた。つまり新山も見事な科学コンプレックスだったわけだ (あるいは「流行に乗りたい君」だったのかもしれない)。 しかしいざ実際に NYU へ来て研究テーマを変え、あれこれな論文を読むようになってみたら、 「なんじゃこのいいかげんな方法論はー! ただ数かぞえてるダケじゃねえか。 こんなら前のほうがまだマシだわい」と思うようになった。 のです。

結論: 「みんなやってるから」という理由で物を選ぶとろくな結果にならない。

てゆうかさー、オレ、学習しないよな。べつに研究の方向じゃなくても、 今まで「みんなやってるから」という理由で選んでもうこりごり、という経験は、 何度もあったのに。わかってたはずじゃん。 もう金輪際こんな理由ではゼッタイに選ばないぞ! まあ、NY に来て得た悟りというものはいろいろあるが、 これもそのひとつだな。

いつも思うのだが、自分の直感や嗅覚を全面的に信頼する、 というのはなかなかできない。しかし最近ますます 「あのとき自分はやっぱり直感を優先すべきだった」と思うことが増えた。 この 10年で自覚できる成長といえばそれだけかな。 これは、自分の感覚がそれだけ養われてきた、ということなのだろうか? いや、あるいはただガンコになってきただけかもしれない。 だいたい、今後とも自分の直感が鋭くなる一方とはかぎらないのだ…。

あー理屈っぽい。バカ野郎。

いっぽうで、年をとるにつれてガンコになる必要はあると思う。 それはある意味スタイルを確立してきたということだろうが、流動的であることが いいとされている社会ではスタイルなんか確立しないほうがいいのかな。 いや、それはなんとなく違うような気がするが…。

あー理屈っぽい。バカ野郎。

(23:55)
こわい言葉: 「よかれと思って」

レーニンも「こわい」って言ってたよ。

Mar 05 [Sat]


(11:53)
ぼえ〜…また寝坊した…
(14:04)
さいきん、ノーテンキでアホなことをあまり書いてない。 これはよくなき傾向だっ!

また現在の自然言語処理業界のアホさ加減を示す おもしろい比喩を考えついてしまったのでここに書いておく。 話をわかりやすくするため、ここでは「言語処理」を「かけ算」として説明している:

  1. はるか昔、「かけ算」という謎に満ちた操作があった。 この計算は人間はできるのに、なぜか機械にはできないのである。
  2. 研究者は機械に「かけ算」をさせるべく、まずは簡単な問題 (1ケタ×1ケタ) から はじめることにした。1×1 から 9×9 までの答えを人間が苦労して計算し、 それらをすべて計算機に記憶させたのである。こうして機械は 1ケタのかけ算なら 必ず正しい答えを出すことができるようになった。研究者は 「やったぞ! これで 1ケタのかけ算の問題は解決だ!」 と喜んだ。
  3. しかし現実のかけ算の問題は 5ケタとか 6ケタのものが主であるので、 たかが 1ケタのかけ算ができたくらいでは実生活にはまったく役に立たない。 そこで研究者はさらに難しいかけ算の問題にとりくむことにした。 ところが、桁数が 2ケタ、3ケタと増えるにしたがって、そのすべてを 人間が計算して記憶させることがだんだんむずかしくなってきた。 数字の組み合わせのパターンが爆発的に多くなってしまうのだ。
  4. あるとき、研究者がひとつの法則を発見した。 「かける数字がどちらも 1 で終わっているときは、その結果も 1 で終わる」という法則である。 これは大発見だった。さらにべつの研究者は「片方の数字が 5 で終わっているときには、 答えの数字も 50% の確率で 5 で終わる」ことを発見した。これまた、大発見だった。 こうして、「かける数字を注意ぶかく観察すれば、その部分的な答えをある程度予測できる」 というアイデアが広まったのである。「統計的かけ算」時代の始まりである。
  5. 統計的かけ算では、研究者の仕事はもっぱら 人間があらかじめ計算しておいたかけ算の結果を大量に集めてきて、 その問題と答えの関連をみつけることだった。いわく「片方の 3番目の数字が 4で、 もう片方の 5番目の数字が 2 のときには、答えには 9 が含まれていない可能性が 82% である」 といったあやしげな相関が数多く見いだされた。科学の進歩により、いまや かけ算の結果は世界中から集められるようになったので、研究者はこれら大量のデータを処理する 必要にせまられ、もはや仕事に困るようなことはなくなった。…
  6. 現在に至る。

この例で滑稽なのは、「答えを出すこと」ばかりに気をとられて、 だれも本当にかけ算の本質をわかろうとはしていないことにある (もしかすると言語学者はそういうことをしたのかもしれないが、これは 計算機科学の観点からみた比喩なんで、今のところ言語学は考えないことにする、 たぶんこの例えでいくと、チョムスキーが発見したのは「かけ算の交換則」ってとこかな)。

新山の根本的な不満は 2. の部分にある。パターンをぜんぶ記憶させて「解決した」というのは、 おそろしく短絡的だと思うのだが、世間的にはそういうことになっているらしい。 2. で出てきた「答えをすべて計算機に記憶させた」システムというのは、 現実世界でいうところの SHRDLU なのだが、あれは場当たり的 (ad hoc) な ルールのよせあつめだった。あれと同程度のシステムをそういう ad hoc な ルールなしで (Brooks かなんかのアーキテクチャを使うなり、 すべてニューロンの発火を使うなりして) つくれるのか? といったら、現時点ではつくれない。 あそこから一般化できる事実はなにか見つかったのか? といったら、何も見つかってない。 ようするに、まだ何もわかっていないのだ。つまり新山の主張は「この手の小さい問題 (toy world) をもっときちんと精査しろ!」ということなのだが、 この話をいろんな先生などにすると、かならず「いや新山クン toy world の 問題はもう解決したよ、それにあれではスケールアップできない」といわれる。 ここで「スケールアップできない」というとき、相手はあきらかに SHRDLU のようなものを念頭においている。いったいどうしてあんなもので 「解決した」と呼べるんだ? SHRDLU はよくできたシステムかもしれないが、 単なるよくできたインチキだ。スケールアップできないのは基本的にインチキだからで、 もっと別のやりかたを研究すべきなのだ (このことについてはいくつかのアイデアがあるが、ここには書かない)。 人間は 3歳ぐらいのときは語彙なんてほとんど知らないが、ちゃんとスケールアップしてるじゃないか。 たぶん純粋なシンボルを扱っているだけではダメだ、というとこまではわかったわけだが、 その先を新山はぜんぜん聞いてないな。

もうひとつの反論は「データは沢山あるんだから、それを使わない手はない」というものだ。 現存するデータからすべての事実が帰納的に学習できるのならば、 たしかにやってみる価値があるかもしれない。そういうふうに信じている人がいてもいいと思うので、 その立場はアリだと思うが、誰もがそう信じているわけではない。 でも、量に目がくらんでフラフラとそっちへいってしまうという感覚もまたよく理解できるんだよ。 たとえば、時間もカネもかかる仕立屋で背広を作ろうとしているときに、 すぐ隣にでっかい「洋服の青山」がドーンとできて、1着 1万円のバーゲン品が 山のようにあったら、「こっちでまじめに作るより、バーゲン探せば一個ぐらいアタリがあるかも」と 考えちゃうってのは、よくわかる。消費社会の不幸というか。しかしオレが不満なのは、 「おいおい、誰もかれも洋服の青山に行っちゃうのかよ!」ということである。 誰も仕立屋に残るやつはいないのか?

(いっぽう、このバーゲン路線がほんとに正しいと信じている人々もいて、 かれらの言い訳リストはこんな感じだ: 「コーパスを使うとデータを客観的に評価できるので、より科学的」 「統計を使うのは低レベルな部分の処理だけ」… 実際には 「コーパスが悪い」「ドメインが違う」って言い訳ばかり聞くし、 そもそも階層的なアプローチが正しいという保証もない (というか、最近その不信はますます高まってきた)。 だいたい「〜のほうが科学的」ってなんなんだ。科学コンプレックスか。 チョムスキーにしろ、心理学で一時流行った行動主義にしろ、ようするに 「科学的」というブランドにあこがれる人々はかなり多いのだ。)

もうひとつの考えられる反論は 「オモチャみたいな研究をしたって実生活の役には立たない」というものだが、 これは外圧にすぎない。数十年単位での研究の話をしているときに すぐに実生活の役に立つわけないだろう。それを言うなら、 どのみちいまの統計的手法だって、実世界のデータを使っていながら、 実世界には何の役にも立ってネーのである。 むしろ、こっちのほうがそろそろ手がつきてヤバくなっているのに、 誰も「こんなんダメだ」と言わない。そもそもの方向が間違ってるにもかかわらず、 すでに大義名分も予算も使ってしまっているので、 ひたすら行きつくとこまで走ってるだけだ…。けっきょく、新山の主張は 「急がば回れ」ということになる思うのだけど、「回る」奴が ぜんぜんいないってのはどういうことなのか?

オレがなにかを見落しているのだろうか? たぶんそうだろう。 そうであってほしい。なぜならここでいっていることは べつに新山の独自アイデアではなくて、むかし GEB を読んだときから すでに書いてあったことなんだから。誰かが「いやいや新山よ、 そんなことはみんなわかっている。… (新山の知らない事実) … という 理由でやっていないんだ」と説得してくれることをほんとうに望んでいる。 「いや、まったく新山のいうとおりだ! だからお前やれ!」 などと言われるのはまっぴらだ。世の中には新山よりはるかに頭のいい連中が 沢山いるはずで、どうしてそういうやつがやらないんだ。 オレはもう逃げるんだから! しかし、考えようによっては、ほとんどの人が実はこれなのかもしれない。 まったく先の見えない方角につっこんで人生フイにすることができる人ってのは、 よほどのキチガイだろうから。

この話題について書くのはもうこれで終わり。

(17:23)
ガーソ! じーんず洗うの忘れた!!
(18:01)
「メルエモン」 だって。笑った。 「世界最高スペック」て、ようするに SPAM 発生装置じゃねえか。しかも名前がメルエモン。 ふんげあ。
(19:03)
さっきトイレで花の水を替えていると、しっだるた(インド人)が入ってきて、言った。 「お前オフィスに花飾ってんのか?」「ああ、好きでね」 「それは、その…日本の flower arrangement はなんていったっけ? オクブナ…?」 「これは生け花じゃないよ、ただの花だ」 「イケバナってのは何がどう違うんだ、それより芸術性のあるやり方でやるのか」 「知らん。生け花ってのはいろいろとその… much more complex ...」 と言いかけて、しかしオレは生け花についてまったく何も知らないので てきとうにごまかした。茶道にしても生け花にしてもそうだが、 あれはお茶やお花そのものよりも「儀式」が重要ってかんじだよな。 ああいう儀式を面白いと思うためにはそれなりの原体験が必要なんじゃないかと思う。 たとえば新山は墓詣りが好きだが、これは基本的に 昔から山の中の墓地へいく習慣があったから好きになれたのであって、 べつに墓詣りの概念そのものが好きなわけじゃないんだと思う。
(21:54)
世界はだまされたがっている。
-- Thomas Hoving
(00:10)
中華料理屋にいたら、自転車売りがきた。 こういうテイクアウトではよく配達を自転車でするので (それも日本みたいなママチャリがないからみんなマウンテンバイクでやるんだぜ、 それで自転車のまま厨房からダーっと出ていくの、これは一見の価値あり)、 いちおう商売道具のセールスマンということになるのかもしれないが、 実際にはとても「セールスマン」などという言葉で形容できる人々ではない。 とびこみ営業。営業っつーか、いきなり自転車を店内に持ちこんできて値段を言うだけ。 すっげーあやしい。「ヘイ、マスター! これ 20ドル20ドル、 ふたつで 30ドル! (あとからもう一人のやつが自転車を運んでくる) 新しいよ!」 …見るとたしかにそんなに古そうじゃないが、 どう考えても中古である。それにしても、20ドルってなんか安すぎない? しかし店のおやじども (調理人は複数いるのだが、みんなゾロゾロ厨房から 出てきて自転車を物色する) が「いらん、いらん!」というと、 そのうち連中はさらに値段を下げはじめ、最後には 12ドルまで下がった。 で、「12ドルで買わないんならもう別のやつに売る、もう行っちゃうよ、 サヨナラ!」といって自転車をもって立ちさるそぶりをするが、 また戻ってきて「なぁ〜頼むよ〜買ってくれよ〜」としぶとくねばる。うざい。 オレはそこで出てきてしまったのでその後は知らないが、 あれってちゃんとした経路で入手した自転車なのかなあ。 日本だと防犯登録とかされていそうだけど (ああ、でもそんなのはがしちゃえばいいのか)、 実にあやしい。あやしかりける。

てくるで防犯登録といえば東京にいたとき、長野からもっていった ママチャリを乗りまわしていたが、よく夜中に環八の田園調布警察署の前で 止められ防犯登録チェックをされた。しかしオレのチャリには「中野警察署」と 書いてあるので、おまわりさんは混乱するのである。東京のチャリなら 警視庁のはずだからね。いつもそれで余計に時間がかかっていた。

(01:13)
もう 1ヵ月以上更新してないですよね。
(01:38)
<div right=align>
"WORSE THAN YOU???"
</div aligh=right>

Mar 04 [Fri]


(13:52)
これは絶対だれかがすでにやってそうだけど、逆方向の readline() (ファイルの末尾から先頭に向かって進む) をサポートする bidi.py というモジュールをつくった。でっかいファイルを末尾から読みたかったので。 今のところ書きこみはサポートしてないし効率もそんなによくないが、 以下のように使える:
fp = BidiFile('/etc/hosts')
fp.seek(0, 2)               # goto the end of file.
for line in reversed(fp):
  print repr(line)
fp.close()

最初はこんなの簡単じゃん、と思ったが、ロジックは意外とめんどうだった。 そして作ってみたら後になって、あんまり使う必要ないということが わかってがっかりda.

(14:33)
翻訳してるときに使う日本語とここに書く日本語は違うという話。 新山はあんまり漢字を沢山使いたがらないが (おもしろいことに、 たぶん昔は漢字を沢山使うことは教養の証明だったはずなのに、 いまや漢字を使いすぎるとかえってバカそうに見えるよね)、 その癖は翻訳をしているときにも変わらないのだが、 「人目にふれる文章」を意識すると微妙に漢字が増えるようだ。らしい。 それは読む人が単語の区切りをみつけやすくするためである。 たとえば「…に加えて」という表現は、たぶんカジュアルな場合だったら 「…にくわえて」と書いちゃうと思うんだけど、なんか微妙に読みづらい。 「に」と「くわえて」の区切りがみつけにくいのだ。だからこれは漢字にすることが多い。 ほかにも、新山が翻訳するは説明書っぽいものがほとんどなので、 以下のような「自己流ルール」があることに気がついた: こうしてみると新山はちっともまともな翻訳者じゃない。 ちっとも原文に忠実でないのだ。しかし「原文に忠実」っていったいなんなんだろう? 説明書の翻訳では、「文」に対する忠実さよりも「作者の意図」に対する忠実さのほうが 大切だと思う。意図というのは、たとえばライブラリ作者が使う側に注意してほしいと 思っていることは、その表層にかかわらず日本語でも注意をひきつけるように書くべきだ、というようなことだ。 でもべつに作者の意図が英文中に書かれているわけではないので、たいていそれは 推測になる。そして推測は結局のところ、ライブラリの働きをある程度理解していないとできない。 こうしたことをまじめに考えている人がどれくらいいるのか知らないが (結構、ドーでもいいことかもしんない)、とくに専門的な文書を 「直訳」してしまうのはよくないことに思える。

しかし、「直訳」っていったいなんなのか。そもそも異なる言語の間で「直訳」などできるはずがない。 すべての翻訳はいちど理解してから自分の言葉で言いなおさなければいけないのだから、 かならず言いかえ (←←注目!) になっている。すると、ほんとうの意味での 「直訳」ができるのは、内容をまったく理解せずに翻訳する機械、 つまり翻訳エンジンだけということになる。

(18:10)
ふんげーa。新山は Fedora ってまだ一度も使ったことないのだが、 それについて質問されても困ってしまうんだな。なんでもベースが UTF-8 だという話だけれど、 それだと euc-jp 一辺倒の日本語処理屋にはきつかろう。新山はべつにいーけどね。 しかしページャに lv を使うのはイヤなんだよな。慣れの問題かもしれないが、 新山はやはり less のほうが便利だ。

メジャーなスクリプト言語で、文字コードの問題について現在のところ いちばんまともに対応してるのは Python しかなく、ある程度の規模のアプリケーションで 自然に文字列処理を多国語化したいということであれば、ほかに選択肢はありえない。 Perl 5.8 の Unicode は、あんなもの誰も使いたくないだろうし、 Ruby は理想論に固執しているうちに取り残されてしまった。 そういえば、Unicode に反対する人って今あんまり見なくなっているなあ。 新山も Unicode はちっとも好きではないが、そんなら JIS は好きなのか? と言われれば、べつにそんなこともない。 日本人がつくったバカな文字コードを使うか、 西洋人がつくった大バカな文字コードを使うかの違いしかない。 そして文字に関して深い蘊蓄があるわけでもないふつうの人々 (新山含む) は、 そんなことどっちだっていいのだ。どのみち日本人は、Unicode よりも限りなくアホな 米国支配の象徴であるマックをよろこんで食ってるじゃないか。 Unicode だってすぐに慣れるさ… (幸か不幸か、日本人はこの手の適応力がきわめて高いと思う)

(02:18)
ときどき、歴史あるファイルをみてじっと考えこんでしまうことがある:
;;;     形態素解析システムJUMAN: 活用分類辞書
;;;
;;;             1990/12/17/Mon  Yutaka MYOKI(Nagao Lab., KUEE)
;;;             1992/02/15/Fri  Yuji MATSUMOTO(Nagao Lab., KUEE)
;;;             1992/11/18/Fri  Yuji MATSUMOTO
;;;             1995/12/14/Thu  Osamu YAMAJI
;;;

どうも 15年前からあんまりこの世界は進展してないような気がするのだ。 もちろんその頃は新山はまだ大学にも入ってなかったけど、あれから 計算機の性能は上がったので、絶対的なスゴそう度は増えたが、 なにかあたらしい発見とかあった?

どうでもいいが、GECOS field の苗字を全部キャピタライズさせるというのは 東工大でもむかしはそうだったが、こちらではほとんど見かけない。 これは日本のローカルな風習なんだろうか? 誰が最初にやりはじめたんだろうか? いまでもやってるやついるのかね?

Mar 03 [Thu]


(09:04)
世の中はどうしてこうも簡単なのだろう? (単純ではない)
(10:17)
セキネさんから去年の 10月号の「自然言語処理」を渡されたので読んでみた。 なんでも「言いかえ」に関する特集号なんだってさ。で、その感想を一言で書くとすれば、 まあ、なんだ、オレには「悪い冗談」にしか見えなかった、ということである。以上。 これが「言いかえ」の「研究」? それはそれはご結構なことで。 純粋に工学として考えれば、それが実際に役に立つ可能性があるなら結構なことである。 しかし言語の研究としては、たんなる冗談以上のものではない。 だけど書いてる人はみんな冗談だと思っていなそうなところがこわい。

唯一、おもしろいのはサトウ先生の巻頭言だけだった。 個人的にはこの方とお話したことはぜんぜんないのだが、なんかスキなんだよねー。 去年の言語処理学会でわかったことだが、この先生はなんとなくシラケている。 皮肉のわかる人というか。にもかかわらずエライのは、 しょせん自分も『踊るアホウ』であることを熟知していながら、 それでも踊ってみせるという愛敬があるところだ…。いいなあ。 これはある種の境地に達していないとできないよ。 それ以外の論文はとくにどうということもなかったが、 セキネさんは「reference として役立つ」というようなことをいっていた。まあ、そうかもね。 せいぜいコピペに励むことにします。

てくるで今年も言いかえのワークショップをやる計画があるらしいのだが、 新山にとっては IWP2003 でもじゅうぶん悪フザケだったのに、まだやるんですね。 まあ、毒を食らわば皿までだな…。

そもそも「言いかえ」というものをなにか独立した現象のように扱うという 姿勢が気にくわない。 気にくわないというよりは、それがれっきとした間違いである ことは誰の目にも明らかなのに、なんでそんなことするのか? その答えもまた明白だ。こんな明白な質問と回答を書いても何もおもしろくない。 おととしの Hirst の講演を聞いて思ったが「ああ結局こいつらは 何もかも『言いかえ』ってことにしたいんだ」ということである。 報道も言いかえ。翻訳も言いかえ。どうせ風呂敷を広げるなら、いっそのこと 分数の約分も、β変換も、リファクタリングも、HTML を PDF に変換するのも 全部言いかえって呼びゃあいいのに。そうすりゃ世の中の現象をすべて言いかえとして 説明できることになり、世界じゅうの計算機屋が言いかえ研究をしだすだろうよ。 そうだ、これからは CFG の導出を「言いかえ規則」と呼ぶことにしよう! ばーか。 この点でも、わかっていそうなのは巻頭言のサトウ先生だけって気がした。 彼は地位も責任もあるエラい先生であるので、とうぜんこんなふうには物事を言わない。 かわりに「言いかえは言語の本質にかかわる問題である… この号さえ読めばあなたもすぐに言いかえ研究者だ」という。うひょひょひょ。 結局のところ「なぜ人は言いかえるのか」といったら、それは 「言いかえざるをえないから」ということにつきる。 そんなことは小学校で「伝言ゲーム」をやったときからみんな知っていることだ。 「同じ内容」を人から人へ伝えているはずなのに、なぜ最終的にはぜんぜん違う内容になってしまうのか? それは人が言葉というものを理解してしまうからだ。 もし、伝言ゲームの参加者が言葉をまったく理解せずに ただそれをそのまま一字一句伝えていれば、伝言ゲーム特有の笑える現象はほとんど起こらないだろう (しかし人はどんな記号列も理解しようとする性質があるので、 実際にはこれはとてもむずかしい)。「理解は誤解」というように、人がなにかを理解したときは、 かならず歪曲 (つまり言い換え) が起こる。逆に、ある情報が言い換えられていれば、 それは「その情報がヒトの頭の中を通ってきた痕跡」である、といってもいい。 つまり「言いかえ」という名前で呼ばれている現象は、すべて昔から謎につつまれた 「『理解する』って何?」的な問題のひとつにすぎない。 つーか、つーーーか、そんなこたぁ何千年も前から明らかだろうに、なんで オレはこんな当たり前のことを書いてんだ! (次第にムカついてきた) 今でもオレは授業なんかで、あることを理解した確認をするのに、それを言いかえて質問してみることが よくある。試験などでも、記述式の問題で聞かれるのは結局そういうことだ。 それらに「言いかえ」という名前をつけてみたところで、なにも問題は解決しない。 「これは、publishえr-subscribえr パターンですね」といっているのと同じだ。 はっきりいえば、まともに認知と理解の問題を扱わない言語研究はことごとくインチキである。 オレもまたそういうインチキ研究者のひとりだが、やってる側がそのインチキ性を わかっていれば、まだ救いがあると思う (自分で言うなって感じだが)。 まあ、新山は地獄へ落ちる覚悟はできておりますがね。

ちなみにわたくしは謙虚な人間でありますので、「言いかえの研究」などは行なっておらず、 さしあたっては「従来より 2〜3件の抽出結果がよくなる、あるいは会社の売り上げを 2〜3万円上げる程度の抽出プログラム (当社比)」作成を目標としております。 これは決っっして控えめな目標ではありません!

と、いうことを口八丁でいかにうまく説得するかが現代の研究者に要求される主要なスキルである。

TODO: できるだけ早くここから逃げだすこと!

(14:33)
ふー。ミーティング終了。 やはりインチキ研究は卒業するための保険として必要だ、 という結論になる。それをやっておけばあともう一個のテーマは好きにしろと。 まあいいですよ、それで。しかしたいていはインチキ研究のほうに時間が とられるような悪い予感がする。ぶらっく。

"DID YOU EVER HAVE THE FEELING OF IMPENDING DOOM?"

(16:09)
ゲンゴとゴンゲ。そのちがいはいかなるものか??

google://atssmsmhgnmd/.

(18:05)
よく見たら「We're juice guys.」と書いてある。アホいことこの上ない。
(18:51)
ああああう Common Lisp のばか! string= と入力すべきところで どうしても string=? と入力してしまうう! こっちは Scheme の述語だ。なんで CL のほうには ? が入っていないんだ そしてなんで Scheme のほうには ? が入ってるんだ? いますぐ CL の述語に ? を入れろ、そして Scheme からは ? を取ればいい。 そうすればみんな同じように不幸になる。おまけにおまけに Lisp-mode のキーバインディングは Python-mode のそれと全然違うじゃないか。C-c < でインデントが左にずれないじゃないか! どうしてくれる!

ぜーんぜん関係ないが、さっき某先生をみた。「へーい Yusuke!」と挨拶されたが、 かれはこのサムいのに半ズボンだった… (上半身は防寒している)。

(19:10)
ha! 2、3センチで大雪!
(19:41)
ところで、まったく同じ単語でもカタカナで書いただけでイメージが変わるものがある。 たとえば「金」を「カネ」と書くとなにやら青木雄二っぽい文脈がつきまとうし、 「車」を「クルマ」と書くとトヨタの宣伝みたくなる (少なくとも新山にとってはそう)。 ただし「人」を「ヒト」と書くのはやや複雑で、種としての人類を表すときは 「ヒト」はカタカナの固有名詞だ。だから? ?
(22:32)
今日も例の Univ. Pl. にある organic のスーパーでお買い物。 学割ばんざい。 ここはうちの近くのスーパーとはぜんぜん違う。 まず、消毒くさい臭いがしない。照明も明るい。店内が清潔。 倉庫みたいな雰囲気なんかじゃない。ボストンあたりにあるスーパーって感じだ (意味不明)。 そして、置いてあるモノのブランドもこれまたぜんぜん違う。パンから調味料から トイレットペーパーまで、JSQ でみかけるメーカーとほどんどかぶってないのだ。 パスタはほぼ De Cecco しか置いてないし。つうか、今まで見たことのない 「Perciatellini」って種類があったんだけど、これは一体なに? 読み方すらわからん。おまけにスゲーぶっといぜ。直径 5mm ぐらいあるぜ。 こんなの茹でたらきしめんより太くなるんじゃないの? ほかにも豆腐とか各種日本茶 (緑茶、玄米茶、茎茶、コンブ茶など) もそろっている。 が、そういうのはさすがに日本食料品店で買ったほうがいいと思う。 あとダイコンや白菜 (なぜか Nappa と呼ばれる) も売っていたが、 これもチャイナタウンのほうが新鮮っぽい。なぜかこういう organic の店にある 大根はどれもこれも細く、おまけにどれも 20cm ぐらいに切ってあって、 ちっともうまそうに思えない。やっぱり大根はまるまると太っていなきゃね。 ちなみに新山は三浦大根が好きだが、チャイナタウンで売られているのは、 たぶん青首系だと思う。てくるでこのスーパーさあ、いいんだけど、問題は マンハッタンにあるってことなんだよ。たくさん買いこんじゃうと 帰るの大変。やはりうちの近所はビンボ地域であることをあらためて思い知らされた。

てくるで、帰りに重い荷物をもってウンセウンセと 5番街 + 12st. を通っていたら、そこに「Forbes Magazine」と書かれた ビルがあることに気づいた。これって、あの Forbes の本社なんかね? どうやらそうらっし

(23:46)
本日 (ほんづち) のひとくち tips。新山は家の PC につながっている スピーカの音量調整を PrintScreen(↓) と Pause(↑) に割り当てている。 Alsa と Sawfish を使っている場合、これはすごくかんたんだ。設定メヌーから "Bindings" をだして、2つのキーにコマンドを割り当てる:

本日 (ほんづち) のふたくち tips。 新山がよくやる「↑」や「↓」の記号はどうやって出しているのか? いちいち「やじるし」で変換するのはめんどくさいので、 skk-rom-kana-rule-list に以下のような規則を追加して、 それぞれ "zv"(↓) "z<"(←) "z>"(→) "z^"(↑) で出るようにする。 Emacs に慣れた人なら使いやすいはず。ついでに【】“”・…などの記号も頻出なので それぞれ "z{" "z}" "z`" "z'" "z." "z:" で出るようにする:

("z{" nil "【")
("z}" nil "】")
("z`" nil "“")
("z'" nil "”")
("z." nil "・")
("z:" nil "…")
("z~" nil "〜")
("z>" nil "→")
("z<" nil "←")
("z^" nil "↑")
("zv" nil "↓")

で、こういうのに慣れてしまうともうウィソドウズはかったるくて使えないわけよね。

ところで、sed-i オプションって知ってた? オレは知らなかった。

Mar 02 [Wed]


(10:55)
あなたが気づかないうちに、一週間は足早にその姿をもう水曜日。ぼうどうにかしでくれ濁点。

あららっこ

(14:24)
空はこんなにあかるく晴れているのに、また雪が降るのかあ。
(15:37)
ぐち開始。(読むのは勝手ですが、誰にも読んでもらわなくてけっこうです)

OpenBSD の日本語ページの翻訳があれからまたさっぱり進んでないみたいなので (というかもう 1ヵ月以上誰も commit してないんだよ)、 ほとんどのリンクを英語ページのほうにはり直した。 これで OpenBSD の日本語版サイトは (今までもほとんど役に立っていなかったが) 実質上ほぼ何の役にも立たないページ群と化したことになる。 表紙だけ日本語の本みたいなもんだ。 バグの報告方法とかどうでもいいページだけがいまだに日本語のままだが (なぜならこれらのページはまったく更新されていないから!)、こんなページだけあっても まったく意味をなさないでしょ。FAQ とか、日々の更新記録とか、セキュリティ報告とかのページが 最新を保っていなければ意味がないんだよ。ほかの日本人翻訳陣からは 1月のはじめごろに 「忙しくて 2週間ぐらい更新できないからよろしく」というメールが来たが、その後は 何の音沙汰もなし。いったい何がどうなってんだ? (単純にノケモノにされているという可能性はありうる。 いままでも新山は彼らとはまったく独立して勝手にやってたから。) まあ個人的にはべつに日本語ページが消えようとどうでもいいので、無理に催促するつもりもない。 日本のユーザは少なそうだし、それに日本語訳をありがたがる人間が一体何人いるのか疑問。 つうか、日本の OpenBSD 情報 があれば 本家サイトの日本語版はいらないんではないかとさえ思える (今の状態だと圧倒的にそうだ)。 新山としても、もともとの担当は OpenSSH であって (こっちは明らかに需要があるし、 ちゃんと更新もしている)、OpenBSD は管轄外だし、最初からそこまでやる時間がないことはわかっていた。 たぶん皆さんお忙しいのでしょうよ。オレも忙しいから今後はもう放置することに決定。 そのうち消されるかもしれないが、知らんもんね。 こういうことで気をもむと意味もなく精神的に疲れる。 めずらしくまともな愚痴をかいてしまった。

(追記: べつに誰も無理してボランティアしろといっているわけではないが、 やめるにしても引き方があると思うのだ…まあいいや)

(17:08)
なんで "Banc of America Securities" は "Banc" なんだろう?

オレの質問はいつも「なぜ」が多すぎるよ。

(17:30)
実験がうまくゆかねいのでテンションが下がってきました。

たぶん原因は、考えなきゃいけない問題が一気にワッと増えたのと、 あと時間的にそろそろ頭が疲れてくるころなんだと思う。 散歩してこよっかな。

もうひとつの要因は、オレの理解してない過程でなんだかしらないが バグが出ていて、途中でエラーが出る (こっちの想定している出力と 違っていて assert でこける) ということである。 なんだよう。なんなんだよう。うるうる。うるさの山。

やはりオレは前置詞の研究をすべきだと思う。 意味の領域に入らないで適当に統計で上っつらをなでるだけ、みたいなことは、 すべきじゃないと思う。もともとこいつには前から興味はあったのだ…。

しかし、いま前に見えるのは、まっくらやみである。

(追記: またひとつうまい比喩を思いついたのだが、現在の統計的な言語処理というのは 社会学に似ていると思う。もっとひどい言い方をすれば、血液型占いである。 ようするに「なにか関連があるらしい」統計的な量をあつめてきて、 誕生日やら服装やらといった表面的な情報だけで個人の性格 (この場合は特定の言語表現) を判断するのだ。だが、そういった研究は あくまで多くのものを概観したいときに有効なのであって、特定の個々人をつかまえて 統計による先入観を適用することはひどい話だと新山は考える。もちろんアメリカ人は全員太っているし ブログロはどこも必ずつまらないし Ruby ユーザは 101% の確率でセンスが悪いけどね! しかし、まじめな話、 世の中には血液型占いを本気で信じている人も多いので、オレがおかしいのかもしれない。いやきっとそうだ。)

(さらに追記: だけども、これが自然言語『処理』という言葉の伝える本来の姿にじつは近いのかもしれない。 かりに社会学のことを「人間処理」と呼んでみよう (こんなことをいったら社会学をやっている人は 怒るかしらん)。「自然言語処理」という言葉のもつイメージは、「人間処理」という言葉のそれと似ている。 なにかディストピアめいた雰囲気を想像するとしたら、それのソフトな版が今ここで起こっていることだ。 ネ暗トピアとは関係ない。いやーーー「ぼのぼの」ファンだったのだけど、アレを最初にみたときはびっくりしたなー。 どうでもいいけど。)

(18:17)
散歩から帰ってくると脊髄まで冷えてた。 延髄まで冷えてた。シンズイ? …うわーうわー近よるな!!    (←何か記述不可能な物品)

どうでもいいけど寒いことのよ。空はきれいだったけど。コーヒーコーヒー

結論: やっぱし David の照応解決器をまともに使わにゃダメだなこれは。 構造がくずれてしまっている。

なにがなんだかわかんない意味構造。 でも、これはじつはほとんど正しい。ほどんと。

(20:58)
カカオは人体に蓄積するのでしょうか?
(22:14)
また温度が低かった。温度が低いことそれ自体はべつにいいのだが、 NY で不満なのは温度が低いのに比例して風も強くなるということだ。 つまり O(n2) で寒くなるのである。やってらんねぇー-。くぬやろ
(23:07)
あっば あっば あっば あっば あっばらーんしゅ〜〜〜〜 (avalanche)
(00:35)
けっきょくのところ、新山が証明したいのは 「言い換えの研究など不可能である」ということなのだと思う。 だが、不可能であることを証明するのは可能を証明することよりも 圧倒的にむずかしいから、これは無理だろう。

そもそも、いもしない神様にみんななぜ祈るのかといったら、 ほかに祈るものがないからだ。 オレもあとすこしの間は祈るフリをしていなきゃね。

(00:59)
ブログロについて補足。 もし世の中に 100% ウソしか書いてない日記というものがあったら、 新山としてはぜひ読みたい。べつに内容はウソでも面白ければいいと思うからだ。 それが本当かどうかなどオレには関係ないし、 そもそも確かめるすべさえない。そういう日記をかけるにあこがれるが、 それはもう精神病 (作話症) だと思うけど。

一度にたくさんのことを考えている人というのは、 要するに、混乱している人だ。

(01:27)
てくるで、いま気づいたんだけど、 "Made in USA" というのは、 スペイン語でいうと "Hecho en EUA" なんだね…。

Mar 01 [Tue]


(10:39)
雪 … ! … !

世の中に許せないものは数々あれど (たとえば自分の顔とか)、 これほど許せないものは少ない。

かもね。

(11:02)
緑色の自信が。
(18:57)
ずっと中間試験のために勉強していて頭がこぼれそうだったが、 ようやく終わって今は頭がからっぽになった。Computer Security の試験だったのだが、 いやー、むずかしかったわ。問題はどんなのかというと「これこれこういう リモート・ログイン・プロトコルがある (公開鍵暗号を使っているが、使い方に欠陥がある)。 アタックを考えよ」とか、「ある "Trusted" computing environment (いわゆる Palladium) では DRM コンテンツの再生にこういう暗号化アルゴリズムを使っていると仮定する。 このシステムに対して選択暗号文攻撃をおこなうやり方を述べよ」とか、 そんなのである。基本的には授業で見た欠陥プロトコルのヴァリエーションだし、 おちついて考えればわかるのだが、制限時間がきつかった。このぶんだと期末試験はどうなるのかな。 たのしみだな。へへっへうg

ちなみに、この授業を受けると、ソースが公開されていない暗号化ユーティリティは 絶対に信用すべきでないということがわかる。というのは、 完全に公開された方式でなお生き残ってるのがまともな暗号のあかしであり、 詳細を隠しているのはそもそもろくな暗号ではないと公言しているようなものだからだ。

だいたい日本の大学でコンピュータのセキュリティを専門にやる授業ってあるのかな。 ないような気がする。あ、あった。情報セキュリティ大学院大学がそうか。 しかしこんなカリキュラムでは全然ダメだろうと思う。ちなみに、このカリキュラムのほぼ半分ぐらいは、 今回のまちあす先生の授業でもカヴァーされている。こんなの2年もかけてやるなよ。 おまけに文系でも入学可なんだと。まあ、今はやりの(らしい) デジタル針woodみたいなもんだろうなあ。 みんなお金持ちなのね。

てくるで、最近考えたのが「液晶プロジェクターの中の映像に手書きできるようなシステム」ってできないかな、 ということである。壁にうつったプロジェクターの映像に指でじかに文字が書きこめたらすばらしいだろう。 スライドに註釈として書きこめるし、ファイルとして保存できればさらによい。 と思ったのは、授業中に先生が板書するのにいちいちプロジェクター用のスクリーンを上げたり下げたりしているのを 見たからである。 もちろんタッチパネルつきの専用のスクリーンかなにかを使えばそんなことは簡単だろうが、 ここで重要なのはそういう専用のデバイスなしでやることだ。理想としては、 USB カメラ (今ではすごく安い) さえあればできるようなシステムである。 いまぐらいの性能の計算機があれば、画像認識をつかってリアルタイムで 人の手の位置を認識するぐらいできると思うんだけど、誰もやってないんかな…。 プロジェクターが走査型ならライトペンの原理を応用すれば位置入力はできるかもしんないが、 いまの液晶プロジェクターじゃ走査してないからムリだろうね。

(23:02)
C++嫌い C++嫌い C++嫌い C++嫌い C++嫌い C++嫌い C++嫌い C++嫌い C++嫌い C++嫌い C++嫌い C++嫌い

…オレは馬鹿なのだろうか?

じつは重度の知能障害があるのだろうか??

い嫌++C い嫌++C い嫌++C い嫌++C い嫌++C い嫌++C い嫌++C い嫌++C い嫌++C い嫌++C い嫌++C い嫌++C

(注: 重度の知能障害がある人でも C++ ぐらいは使えます)

(00:15)
ふーー。こんな時間になっちまったぜ。いま帰ってきてようやく夕食をつくったところ。 今日はサムいから残り物をかきあつめてうどんだよ。
(01:15)
あーーーーーばんめしくったらねむーーーーーーーー

もうなにもやるきがない かなかんじへんかんでさえ ごめんなさい


Yusuke Shinyama