てくるで、高額 工学博士と PhD は違います。
どうでもいいが、今日の新山のシャツには例の空色のバッジがついている。 おそらくほとんど誰も気づかないと思うけど。
「そらいろ」という単語の響きはいいよね。うんいい
わかるかな? (答えは以下にコメントとして書いてある。このページのソースを参照)
いや、おどろいたね。 まあ、しょせんインチキ言い換えだが。
さいきん気づいたのだが、新山はやたらと遠近感のある景色をとりたがる。 そういうものを面白いと思うらしい。
でじカメを新しいのに換えてから、いつも持ち歩いているので なんかあったらすぐパチリ。いい買い物をしたと思う。
/tmp
にある使われてないファイルを消す)
はセキュアでないという話を聞いた。これがおもしろい:
find /tmp -atime +3 -exec rm -- {} \;
アタックの方法:
/tmp/etc/passwd
という空のファイルを作っておく。
find
が /tmp/etc/passwd
を発見。
/tmp/etc
をてきとうな名前に rename し、
かわりに本物の /etc
を /tmp/etc
にシンボリックリンクする。
rm
が起動される。
/tmp/etc/passwd
が消される。
/tmp/etc -> /etc
なので実際には /etc/passwd
が消される!
ここで難しいのは「タイミングをどうやって計るか」ということだ。 以下のような方法がある。
/tmp
に何千個ものファイルを作っておけばスキャンが遅くなる。
あったまいい〜〜!
新山は最近全然ウシ食っていない。トリなら食っているけど。鳥インふ。
plus.html
は翻訳してない。
まえまえから思っていたのだが、もしかすると書いていなかったかもしれないので、
いま書いておくが、ドイツはかなりの FOSS 先進国って感じがする。
LinuxTag も SuSE (現在 Novell の一部だが) もドイツだしさ…。
これにくらべると、米国はしょせん MS の手先だ。
Scribus のソース中にあるコメントが全部ドイツ語で書かれていたのをみて、
ああドイツ語を勉強しないとなあ、と考えたのはオレだけじゃあるまい!
今のとこ全然進んでないけど。ほんとは大学のドイツ語講座を取りたいのだけど、
そんなことしてたらセキネさんに殺されそうだから (まだ今のところは) やんない。
おそらく「補正が失敗した状態」というのが、「誤解」という現象である。 しかし誤解というのはときどき、本来の言葉の意味とはまったく違う意味でとられることがある。 とりわけ対話で起こる誤解はおもしろい。文章だと何度も読みなおすことができるのに、 リアルタイムな会話では、誤解は一瞬のうちに起こり、修復がむずかしい。 このような誤解について研究している人はいるんだろうか? いそうだけど、 新山は心理学に疎いのでぜんぜん知らない。似たようなので思いだしたのが、 将棋 (or チェス) の名人に 「盤面を記憶してくれ」といった研究は聞いたことがあるな。 かれらは (それらしい盤面であるかぎり) ほとんどどんな局面でも 正しく盤面を復元するが、間違えるときはまるっきり違う配置をする、という。 これは誤解になんとなく似ている。つまり彼らには、将棋の駒の配置から まるで自然言語のような意味やらストーリー性をよみとることができる能力があるのだろう…。
と、考えると、人間の“言語的”能力というのは、ちっとも 文字列や音声や手話に限ったことではないと思う。 なんで GB 理論の人々は将棋について研究しないんだろうか? オレは基本的に生成文法を信じてないが、たとえそういうものがあったとしても そこは自然言語の理解にはあんまり関係がないと思っている。 重要なのはもう一方の終端であり、表面的な違いにばかりこだわっていると いつまでたってもそっちへたどり着けなそうな気がするのだ。
「補正」とは、この場合「おそろしいまでの一方的な思い込みによる偏見」のことでしかない。
「ばかなことをしたものだ!」とぼくは翻訳口調で呟きながら、大学へと向かった。
そこは砂場だった。
明日のころきあだけど、これっておもしろいのかなあ…。 (直感いわく「おもしろくない」)Wednesday, March 9, 2005 - 11:15 a.m. Room 1302 Warren Weaver Hall 251 Mercer Street New York, NY 10012-1185 Speaker: Tong Zhang, IBM TJ Watson Research Center Title: A Framework for Learning Predictive Structures from Multiple Tasks and Unlabeled Data
NYキライ
NYキライ
アップタウンの飲み会に行こうかどうしようかなー。もう遅いし。
いくつかの楽しいことがあったが、それはどれもここに書くには適さない (いやはや、「ここ」に書くのに適さないことなど世の中に存在したとは!)。 唯一、特筆すべきことは、はじめて四迷レッドを飲んだということかな。 たしかになかなか変わった味がしたが、まあそういうものだと思えばそういう物 (以下同文)。
今日はキホン的に翻訳口調の一日だった。たまにゃあそういう日もあるさ。
追記。そういえば、はじめて ipod shuffle を見た。
あんなにウスっぺらいなんて予想
外!
てくるで、「~
」をたくさん打ちこまなければいけないのはとても面倒くさい。
毎度のことだが、なんで「文章で入力」させるんだっ。 どうせ解析なんかしてないくせに。キーワード取ってるだけのくせに。 これはなぜかというと、入力された質問文を記録しておき、 あとで言いまわしの研究用に使うためなのである (たぶんそう、セキネさんもそうやってたから)。 おまけに結果も読めたもんじゃない。日経の記述をみると 「人工知能を利用した…」「意味を理解する概念検索…」などと紹介しているし。 いくら宣伝のためとはいえ、こんな誇張では WIRED どころか「ムー」の世界だよ。
この手のシステムでいつも不満なのは、ユーザビリティテストをちゃんとしたのかという疑念である。 まともな使い手がいればオレなら絶対こんなふうには作らないね。 (= つまり、どうせまともに使おうとした奴なんていなかったんだろうという意味。)
しかしね、諸君! そもそも「欲しい情報」などというものはそう簡単に手に入るものじゃねえのですよ! たとえ砂のマサゴが尽きるとも。いっくら計算機が進歩したってね。
そして、ついでに言わせてもらうと、東大なんか検索しても たいしたもん出てこない。
awk
や perl -ane
よりも便利である。
「これ awk でどうやるんだっけ?」とかいって man を調べているよりもぜんぜん早い。
げっぷ
きょうは早く寝て速く起きるんだぞ!!
あなたには勝手な推測をする権利があり、わたしには思わせぶりなことを書く義務があります。
…だが、必ずしもその法則はいつもうまくゆかない。原因はここにある。← (ななめ下) ここに。
ここでは "matches" と "does not (matches)" が並立の関係として対応している。 で、これをそのままこう訳すと:For example, "example.com" matches a blacklist entry of "example.com", but "www.example.com" does not.
こうなる。 これは間違いではないが、通して読んだときになんとなく意味がつたわりにくい。 最後の「…はマッチしません。」を見たあとに、一瞬「え? 何が何にマッチするって?」と考える間がある。 これは間に挿入されているものが長いのと、あとの省略でその挿入句を参照しているためだと思う。たとえば "example.com" は、ブラックリスト中のエントリ "example.com" にマッチしますが、 "www.example.com" はマッチしません。
かといって、これはあきらかにクドすぎる:
たとえば
"example.com" は、ブラックリスト中のエントリ "example.com" にマッチしますが、
"www.example.com" は、ブラックリスト中のエントリ "example.com" にはマッチしません。
じゃあ、いっそのこと主述の関係を逆にしちゃったらどうか:
日本語としては、これが一番自然なような気がする。
助詞として譲歩をほのめかす「には」が使えるのも気に入っている。
実際にはこれはいつもうまくいくわけではなく、この場合は「マッチする」が
ほぼ同値関係で、どっちがどっちでも似たようなもんだからできたわけだ。
たとえば
ブラックリスト中のエントリ "example.com" は、 "example.com" にはマッチしますが、
"www.example.com" にはマッチしません。
で、これを思いついてから、この差は
日本語と英語の語順の違いのためもあるのではないかと思った。
つまり英語では動詞がつねに前にくるので「左にそろえる」ほうが自然に見えるが、
日本語では動詞が後にくるので「右にそろえる」ほうが自然に見えるのだ。
A matches ... but
A does not ...
… にはマッチしますが、
… にはマッチしません。
でもほんとうかな? どうかな? これ以降は意味不明。
intern()
て Unicode には効かないんだね…
背景、○○ょん様あなたのバグを疑ってしまい申しわけありませんでした。
すべて悪いのは私がうっかりリストではなく generator を比較していたからで、新山
す。
結論: 「みんなやってるから」という理由で物を選ぶとろくな結果にならない。
てゆうかさー、オレ、学習しないよな。べつに研究の方向じゃなくても、 今まで「みんなやってるから」という理由で選んでもうこりごり、という経験は、 何度もあったのに。わかってたはずじゃん。 もう金輪際こんな理由ではゼッタイに選ばないぞ! まあ、NY に来て得た悟りというものはいろいろあるが、 これもそのひとつだな。
いつも思うのだが、自分の直感や嗅覚を全面的に信頼する、 というのはなかなかできない。しかし最近ますます 「あのとき自分はやっぱり直感を優先すべきだった」と思うことが増えた。 この 10年で自覚できる成長といえばそれだけかな。 これは、自分の感覚がそれだけ養われてきた、ということなのだろうか? いや、あるいはただガンコになってきただけかもしれない。 だいたい、今後とも自分の直感が鋭くなる一方とはかぎらないのだ…。
あー理屈っぽい。バカ野郎。
いっぽうで、年をとるにつれてガンコになる必要はあると思う。 それはある意味スタイルを確立してきたということだろうが、流動的であることが いいとされている社会ではスタイルなんか確立しないほうがいいのかな。 いや、それはなんとなく違うような気がするが…。
あー理屈っぽい。バカ野郎。
レーニンも「こわい」って言ってたよ。
また現在の自然言語処理業界のアホさ加減を示す おもしろい比喩を考えついてしまったのでここに書いておく。 話をわかりやすくするため、ここでは「言語処理」を「かけ算」として説明している:
この例で滑稽なのは、「答えを出すこと」ばかりに気をとられて、 だれも本当にかけ算の本質をわかろうとはしていないことにある (もしかすると言語学者はそういうことをしたのかもしれないが、これは 計算機科学の観点からみた比喩なんで、今のところ言語学は考えないことにする、 たぶんこの例えでいくと、チョムスキーが発見したのは「かけ算の交換則」ってとこかな)。
新山の根本的な不満は 2. の部分にある。パターンをぜんぶ記憶させて「解決した」というのは、 おそろしく短絡的だと思うのだが、世間的にはそういうことになっているらしい。 2. で出てきた「答えをすべて計算機に記憶させた」システムというのは、 現実世界でいうところの SHRDLU なのだが、あれは場当たり的 (ad hoc) な ルールのよせあつめだった。あれと同程度のシステムをそういう ad hoc な ルールなしで (Brooks かなんかのアーキテクチャを使うなり、 すべてニューロンの発火を使うなりして) つくれるのか? といったら、現時点ではつくれない。 あそこから一般化できる事実はなにか見つかったのか? といったら、何も見つかってない。 ようするに、まだ何もわかっていないのだ。つまり新山の主張は「この手の小さい問題 (toy world) をもっときちんと精査しろ!」ということなのだが、 この話をいろんな先生などにすると、かならず「いや新山クン toy world の 問題はもう解決したよ、それにあれではスケールアップできない」といわれる。 ここで「スケールアップできない」というとき、相手はあきらかに SHRDLU のようなものを念頭においている。いったいどうしてあんなもので 「解決した」と呼べるんだ? SHRDLU はよくできたシステムかもしれないが、 単なるよくできたインチキだ。スケールアップできないのは基本的にインチキだからで、 もっと別のやりかたを研究すべきなのだ (このことについてはいくつかのアイデアがあるが、ここには書かない)。 人間は 3歳ぐらいのときは語彙なんてほとんど知らないが、ちゃんとスケールアップしてるじゃないか。 たぶん純粋なシンボルを扱っているだけではダメだ、というとこまではわかったわけだが、 その先を新山はぜんぜん聞いてないな。
もうひとつの反論は「データは沢山あるんだから、それを使わない手はない」というものだ。 現存するデータからすべての事実が帰納的に学習できるのならば、 たしかにやってみる価値があるかもしれない。そういうふうに信じている人がいてもいいと思うので、 その立場はアリだと思うが、誰もがそう信じているわけではない。 でも、量に目がくらんでフラフラとそっちへいってしまうという感覚もまたよく理解できるんだよ。 たとえば、時間もカネもかかる仕立屋で背広を作ろうとしているときに、 すぐ隣にでっかい「洋服の青山」がドーンとできて、1着 1万円のバーゲン品が 山のようにあったら、「こっちでまじめに作るより、バーゲン探せば一個ぐらいアタリがあるかも」と 考えちゃうってのは、よくわかる。消費社会の不幸というか。しかしオレが不満なのは、 「おいおい、誰もかれも洋服の青山に行っちゃうのかよ!」ということである。 誰も仕立屋に残るやつはいないのか?
(いっぽう、このバーゲン路線がほんとに正しいと信じている人々もいて、 かれらの言い訳リストはこんな感じだ: 「コーパスを使うとデータを客観的に評価できるので、より科学的」 「統計を使うのは低レベルな部分の処理だけ」… 実際には 「コーパスが悪い」「ドメインが違う」って言い訳ばかり聞くし、 そもそも階層的なアプローチが正しいという保証もない (というか、最近その不信はますます高まってきた)。 だいたい「〜のほうが科学的」ってなんなんだ。科学コンプレックスか。 チョムスキーにしろ、心理学で一時流行った行動主義にしろ、ようするに 「科学的」というブランドにあこがれる人々はかなり多いのだ。)
もうひとつの考えられる反論は 「オモチャみたいな研究をしたって実生活の役には立たない」というものだが、 これは外圧にすぎない。数十年単位での研究の話をしているときに すぐに実生活の役に立つわけないだろう。それを言うなら、 どのみちいまの統計的手法だって、実世界のデータを使っていながら、 実世界には何の役にも立ってネーのである。 むしろ、こっちのほうがそろそろ手がつきてヤバくなっているのに、 誰も「こんなんダメだ」と言わない。そもそもの方向が間違ってるにもかかわらず、 すでに大義名分も予算も使ってしまっているので、 ひたすら行きつくとこまで走ってるだけだ…。けっきょく、新山の主張は 「急がば回れ」ということになる思うのだけど、「回る」奴が ぜんぜんいないってのはどういうことなのか?
オレがなにかを見落しているのだろうか? たぶんそうだろう。 そうであってほしい。なぜならここでいっていることは べつに新山の独自アイデアではなくて、むかし GEB を読んだときから すでに書いてあったことなんだから。誰かが「いやいや新山よ、 そんなことはみんなわかっている。… (新山の知らない事実) … という 理由でやっていないんだ」と説得してくれることをほんとうに望んでいる。 「いや、まったく新山のいうとおりだ! だからお前やれ!」 などと言われるのはまっぴらだ。世の中には新山よりはるかに頭のいい連中が 沢山いるはずで、どうしてそういうやつがやらないんだ。 オレはもう逃げるんだから! しかし、考えようによっては、ほとんどの人が実はこれなのかもしれない。 まったく先の見えない方角につっこんで人生フイにすることができる人ってのは、 よほどのキチガイだろうから。
この話題について書くのはもうこれで終わり。
世界はだまされたがっている。-- Thomas Hoving
てくるで防犯登録といえば東京にいたとき、長野からもっていった ママチャリを乗りまわしていたが、よく夜中に環八の田園調布警察署の前で 止められ防犯登録チェックをされた。しかしオレのチャリには「中野警察署」と 書いてあるので、おまわりさんは混乱するのである。東京のチャリなら 警視庁のはずだからね。いつもそれで余計に時間がかかっていた。
fp = BidiFile('/etc/hosts') fp.seek(0, 2) # goto the end of file. for line in reversed(fp): print repr(line) fp.close()
最初はこんなの簡単じゃん、と思ったが、ロジックは意外とめんどうだった。 そして作ってみたら後になって、あんまり使う必要ないということが わかってがっかりda.
しかし、「直訳」っていったいなんなのか。そもそも異なる言語の間で「直訳」などできるはずがない。 すべての翻訳はいちど理解してから自分の言葉で言いなおさなければいけないのだから、 かならず言いかえ (←←注目!) になっている。すると、ほんとうの意味での 「直訳」ができるのは、内容をまったく理解せずに翻訳する機械、 つまり翻訳エンジンだけということになる。
lv
を使うのはイヤなんだよな。慣れの問題かもしれないが、
新山はやはり less のほうが便利だ。
メジャーなスクリプト言語で、文字コードの問題について現在のところ いちばんまともに対応してるのは Python しかなく、ある程度の規模のアプリケーションで 自然に文字列処理を多国語化したいということであれば、ほかに選択肢はありえない。 Perl 5.8 の Unicode は、あんなもの誰も使いたくないだろうし、 Ruby は理想論に固執しているうちに取り残されてしまった。 そういえば、Unicode に反対する人って今あんまり見なくなっているなあ。 新山も Unicode はちっとも好きではないが、そんなら JIS は好きなのか? と言われれば、べつにそんなこともない。 日本人がつくったバカな文字コードを使うか、 西洋人がつくった大バカな文字コードを使うかの違いしかない。 そして文字に関して深い蘊蓄があるわけでもないふつうの人々 (新山含む) は、 そんなことどっちだっていいのだ。どのみち日本人は、Unicode よりも限りなくアホな 米国支配の象徴であるマックをよろこんで食ってるじゃないか。 Unicode だってすぐに慣れるさ… (幸か不幸か、日本人はこの手の適応力がきわめて高いと思う)
;;; 形態素解析システムJUMAN: 活用分類辞書 ;;; ;;; 1990/12/17/Mon Yutaka MYOKI(Nagao Lab., KUEE) ;;; 1992/02/15/Fri Yuji MATSUMOTO(Nagao Lab., KUEE) ;;; 1992/11/18/Fri Yuji MATSUMOTO ;;; 1995/12/14/Thu Osamu YAMAJI ;;;
どうも 15年前からあんまりこの世界は進展してないような気がするのだ。 もちろんその頃は新山はまだ大学にも入ってなかったけど、あれから 計算機の性能は上がったので、絶対的なスゴそう度は増えたが、 なにかあたらしい発見とかあった?
どうでもいいが、GECOS field の苗字を全部キャピタライズさせるというのは 東工大でもむかしはそうだったが、こちらではほとんど見かけない。 これは日本のローカルな風習なんだろうか? 誰が最初にやりはじめたんだろうか? いまでもやってるやついるのかね?
唯一、おもしろいのはサトウ先生の巻頭言だけだった。 個人的にはこの方とお話したことはぜんぜんないのだが、なんかスキなんだよねー。 去年の言語処理学会でわかったことだが、この先生はなんとなくシラケている。 皮肉のわかる人というか。にもかかわらずエライのは、 しょせん自分も『踊るアホウ』であることを熟知していながら、 それでも踊ってみせるという愛敬があるところだ…。いいなあ。 これはある種の境地に達していないとできないよ。 それ以外の論文はとくにどうということもなかったが、 セキネさんは「reference として役立つ」というようなことをいっていた。まあ、そうかもね。 せいぜいコピペに励むことにします。
てくるで今年も言いかえのワークショップをやる計画があるらしいのだが、 新山にとっては IWP2003 でもじゅうぶん悪フザケだったのに、まだやるんですね。 まあ、毒を食らわば皿までだな…。
そもそも「言いかえ」というものをなにか独立した現象のように扱うという 姿勢が気にくわない。 気にくわないというよりは、それがれっきとした間違いである ことは誰の目にも明らかなのに、なんでそんなことするのか? その答えもまた明白だ。こんな明白な質問と回答を書いても何もおもしろくない。 おととしの Hirst の講演を聞いて思ったが「ああ結局こいつらは 何もかも『言いかえ』ってことにしたいんだ」ということである。 報道も言いかえ。翻訳も言いかえ。どうせ風呂敷を広げるなら、いっそのこと 分数の約分も、β変換も、リファクタリングも、HTML を PDF に変換するのも 全部言いかえって呼びゃあいいのに。そうすりゃ世の中の現象をすべて言いかえとして 説明できることになり、世界じゅうの計算機屋が言いかえ研究をしだすだろうよ。 そうだ、これからは CFG の導出を「言いかえ規則」と呼ぶことにしよう! ばーか。 この点でも、わかっていそうなのは巻頭言のサトウ先生だけって気がした。 彼は地位も責任もあるエラい先生であるので、とうぜんこんなふうには物事を言わない。 かわりに「言いかえは言語の本質にかかわる問題である… この号さえ読めばあなたもすぐに言いかえ研究者だ」という。うひょひょひょ。 結局のところ「なぜ人は言いかえるのか」といったら、それは 「言いかえざるをえないから」ということにつきる。 そんなことは小学校で「伝言ゲーム」をやったときからみんな知っていることだ。 「同じ内容」を人から人へ伝えているはずなのに、なぜ最終的にはぜんぜん違う内容になってしまうのか? それは人が言葉というものを理解してしまうからだ。 もし、伝言ゲームの参加者が言葉をまったく理解せずに ただそれをそのまま一字一句伝えていれば、伝言ゲーム特有の笑える現象はほとんど起こらないだろう (しかし人はどんな記号列も理解しようとする性質があるので、 実際にはこれはとてもむずかしい)。「理解は誤解」というように、人がなにかを理解したときは、 かならず歪曲 (つまり言い換え) が起こる。逆に、ある情報が言い換えられていれば、 それは「その情報がヒトの頭の中を通ってきた痕跡」である、といってもいい。 つまり「言いかえ」という名前で呼ばれている現象は、すべて昔から謎につつまれた 「『理解する』って何?」的な問題のひとつにすぎない。 つーか、つーーーか、そんなこたぁ何千年も前から明らかだろうに、なんで オレはこんな当たり前のことを書いてんだ! (次第にムカついてきた) 今でもオレは授業なんかで、あることを理解した確認をするのに、それを言いかえて質問してみることが よくある。試験などでも、記述式の問題で聞かれるのは結局そういうことだ。 それらに「言いかえ」という名前をつけてみたところで、なにも問題は解決しない。 「これは、publishえr-subscribえr パターンですね」といっているのと同じだ。 はっきりいえば、まともに認知と理解の問題を扱わない言語研究はことごとくインチキである。 オレもまたそういうインチキ研究者のひとりだが、やってる側がそのインチキ性を わかっていれば、まだ救いがあると思う (自分で言うなって感じだが)。 まあ、新山は地獄へ落ちる覚悟はできておりますがね。
ちなみにわたくしは謙虚な人間でありますので、「言いかえの研究」などは行なっておらず、 さしあたっては「従来より 2〜3件の抽出結果がよくなる、あるいは会社の売り上げを 2〜3万円上げる程度の抽出プログラム (当社比)」作成を目標としております。 これは決っっして控えめな目標ではありません!
と、いうことを口八丁でいかにうまく説得するかが現代の研究者に要求される主要なスキルである。
TODO: できるだけ早くここから逃げだすこと!
"DID YOU EVER HAVE THE FEELING OF IMPENDING DOOM?"
string=
と入力すべきところで
どうしても string=?
と入力してしまうう!
こっちは Scheme の述語だ。なんで CL のほうには ?
が入っていないんだ
そしてなんで Scheme のほうには ?
が入ってるんだ?
いますぐ CL の述語に ?
を入れろ、そして Scheme からは ?
を取ればいい。
そうすればみんな同じように不幸になる。おまけにおまけに Lisp-mode のキーバインディングは
Python-mode のそれと全然違うじゃないか。C-c <
でインデントが左にずれないじゃないか!
どうしてくれる!
ぜーんぜん関係ないが、さっき某先生をみた。「へーい Yusuke!」と挨拶されたが、 かれはこのサムいのに半ズボンだった… (上半身は防寒している)。
てくるで、帰りに重い荷物をもってウンセウンセと 5番街 + 12st. を通っていたら、そこに「Forbes Magazine」と書かれた ビルがあることに気づいた。これって、あの Forbes の本社なんかね? どうやらそうらっし。
run-shell-command: "amixer set Headphone,0 5%-"
run-shell-command: "amixer set Headphone,0 5%+"
本日 (ほんづち) のふたくち tips。
新山がよくやる「↑」や「↓」の記号はどうやって出しているのか?
いちいち「やじるし」で変換するのはめんどくさいので、
skk-rom-kana-rule-list
に以下のような規則を追加して、
それぞれ "zv"(↓) "z<"(←) "z>"(→) "z^"(↑) で出るようにする。
Emacs に慣れた人なら使いやすいはず。ついでに【】“”・…などの記号も頻出なので
それぞれ "z{" "z}" "z`" "z'" "z." "z:" で出るようにする:
("z{" nil "【")
("z}" nil "】")
("z`" nil "“")
("z'" nil "”")
("z." nil "・")
("z:" nil "…")
("z~" nil "〜")
("z>" nil "→")
("z<" nil "←")
("z^" nil "↑")
("zv" nil "↓")
で、こういうのに慣れてしまうともうウィソドウズはかったるくて使えないわけよね。
ところで、sed
の -i
オプションって知ってた?
オレは知らなかった。
あららっこ
OpenBSD の日本語ページの翻訳があれからまたさっぱり進んでないみたいなので (というかもう 1ヵ月以上誰も commit してないんだよ)、 ほとんどのリンクを英語ページのほうにはり直した。 これで OpenBSD の日本語版サイトは (今までもほとんど役に立っていなかったが) 実質上ほぼ何の役にも立たないページ群と化したことになる。 表紙だけ日本語の本みたいなもんだ。 バグの報告方法とかどうでもいいページだけがいまだに日本語のままだが (なぜならこれらのページはまったく更新されていないから!)、こんなページだけあっても まったく意味をなさないでしょ。FAQ とか、日々の更新記録とか、セキュリティ報告とかのページが 最新を保っていなければ意味がないんだよ。ほかの日本人翻訳陣からは 1月のはじめごろに 「忙しくて 2週間ぐらい更新できないからよろしく」というメールが来たが、その後は 何の音沙汰もなし。いったい何がどうなってんだ? (単純にノケモノにされているという可能性はありうる。 いままでも新山は彼らとはまったく独立して勝手にやってたから。) まあ個人的にはべつに日本語ページが消えようとどうでもいいので、無理に催促するつもりもない。 日本のユーザは少なそうだし、それに日本語訳をありがたがる人間が一体何人いるのか疑問。 つうか、日本の OpenBSD 情報 があれば 本家サイトの日本語版はいらないんではないかとさえ思える (今の状態だと圧倒的にそうだ)。 新山としても、もともとの担当は OpenSSH であって (こっちは明らかに需要があるし、 ちゃんと更新もしている)、OpenBSD は管轄外だし、最初からそこまでやる時間がないことはわかっていた。 たぶん皆さんお忙しいのでしょうよ。オレも忙しいから今後はもう放置することに決定。 そのうち消されるかもしれないが、知らんもんね。 こういうことで気をもむと意味もなく精神的に疲れる。 めずらしくまともな愚痴をかいてしまった。
(追記: べつに誰も無理してボランティアしろといっているわけではないが、 やめるにしても引き方があると思うのだ…まあいいや)
オレの質問はいつも「なぜ」が多すぎるよ。
たぶん原因は、考えなきゃいけない問題が一気にワッと増えたのと、 あと時間的にそろそろ頭が疲れてくるころなんだと思う。 散歩してこよっかな。
もうひとつの要因は、オレの理解してない過程でなんだかしらないが バグが出ていて、途中でエラーが出る (こっちの想定している出力と 違っていて assert でこける) ということである。 なんだよう。なんなんだよう。うるうる。うるさの山。
やはりオレは前置詞の研究をすべきだと思う。 意味の領域に入らないで適当に統計で上っつらをなでるだけ、みたいなことは、 すべきじゃないと思う。もともとこいつには前から興味はあったのだ…。
しかし、いま前に見えるのは、まっくらやみである。
(追記: またひとつうまい比喩を思いついたのだが、現在の統計的な言語処理というのは 社会学に似ていると思う。もっとひどい言い方をすれば、血液型占いである。 ようするに「なにか関連があるらしい」統計的な量をあつめてきて、 誕生日やら服装やらといった表面的な情報だけで個人の性格 (この場合は特定の言語表現) を判断するのだ。だが、そういった研究は あくまで多くのものを概観したいときに有効なのであって、特定の個々人をつかまえて 統計による先入観を適用することはひどい話だと新山は考える。もちろんアメリカ人は全員太っているし ブログロはどこも必ずつまらないし Ruby ユーザは 101% の確率でセンスが悪いけどね! しかし、まじめな話、 世の中には血液型占いを本気で信じている人も多いので、オレがおかしいのかもしれない。いやきっとそうだ。)
(さらに追記: だけども、これが自然言語『処理』という言葉の伝える本来の姿にじつは近いのかもしれない。 かりに社会学のことを「人間処理」と呼んでみよう (こんなことをいったら社会学をやっている人は 怒るかしらん)。「自然言語処理」という言葉のもつイメージは、「人間処理」という言葉のそれと似ている。 なにかディストピアめいた雰囲気を想像するとしたら、それのソフトな版が今ここで起こっていることだ。 ネ暗トピアとは関係ない。いやーーー「ぼのぼの」ファンだったのだけど、アレを最初にみたときはびっくりしたなー。 どうでもいいけど。)
どうでもいいけど寒いことのよ。空はきれいだったけど。コーヒーコーヒー
結論: やっぱし David の照応解決器をまともに使わにゃダメだなこれは。 構造がくずれてしまっている。
なにがなんだかわかんない意味構造。 でも、これはじつはほとんど正しい。ほどんと。
そもそも、いもしない神様にみんななぜ祈るのかといったら、 ほかに祈るものがないからだ。 オレもあとすこしの間は祈るフリをしていなきゃね。
一度にたくさんのことを考えている人というのは、 要するに、混乱している人だ。
世の中に許せないものは数々あれど (たとえば自分の顔とか)、 これほど許せないものは少ない。
かもね。
ちなみに、この授業を受けると、ソースが公開されていない暗号化ユーティリティは 絶対に信用すべきでないということがわかる。というのは、 完全に公開された方式でなお生き残ってるのがまともな暗号のあかしであり、 詳細を隠しているのはそもそもろくな暗号ではないと公言しているようなものだからだ。
だいたい日本の大学でコンピュータのセキュリティを専門にやる授業ってあるのかな。 ないような気がする。あ、あった。情報セキュリティ大学院大学がそうか。 しかしこんなカリキュラムでは全然ダメだろうと思う。ちなみに、このカリキュラムのほぼ半分ぐらいは、 今回のまちあす先生の授業でもカヴァーされている。こんなの2年もかけてやるなよ。 おまけに文系でも入学可なんだと。まあ、今はやりの(らしい) デジタル針woodみたいなもんだろうなあ。 みんなお金持ちなのね。
てくるで、最近考えたのが「液晶プロジェクターの中の映像に手書きできるようなシステム」ってできないかな、 ということである。壁にうつったプロジェクターの映像に指でじかに文字が書きこめたらすばらしいだろう。 スライドに註釈として書きこめるし、ファイルとして保存できればさらによい。 と思ったのは、授業中に先生が板書するのにいちいちプロジェクター用のスクリーンを上げたり下げたりしているのを 見たからである。 もちろんタッチパネルつきの専用のスクリーンかなにかを使えばそんなことは簡単だろうが、 ここで重要なのはそういう専用のデバイスなしでやることだ。理想としては、 USB カメラ (今ではすごく安い) さえあればできるようなシステムである。 いまぐらいの性能の計算機があれば、画像認識をつかってリアルタイムで 人の手の位置を認識するぐらいできると思うんだけど、誰もやってないんかな…。 プロジェクターが走査型ならライトペンの原理を応用すれば位置入力はできるかもしんないが、 いまの液晶プロジェクターじゃ走査してないからムリだろうね。
じつは重度の知能障害があるのだろうか??
(注: 重度の知能障害がある人でも C++ ぐらいは使えます)
もうなにもやるきがない かなかんじへんかんでさえ ごめんなさい