日本語における「ぢ → じ」「づ → ず」への転換はいつ起こるのか? たとえば、「まず」「めずらしい」などは「先づ」「愛づらしい (←愛でる、の活用)」が語源であるため、 ほんらいこれは「まづ」「めづらしい」が正しいはずだが、今ではこの書き方はマイナーになっている。 「生地」とかも本来「きぢ」のはずだが、たぶん今はほとんどの人がこれに「きじ」というふりがなをふるだろう。 いっぽうで「鼻血」「続き」などを「はなじ」「つずき」と書く人はまだ少数派だ。 でもこの傾向が続けば、いずれはこれらの語も「た」行の濁音から「さ」行の濁音へと移行するはずである。 だが、それにはなにかきっかけがあるのかな? かもしれない。
つまり、人生に関するすべてのことは検索で答えが出る、という信仰および態度をもった人間。 かれらの信仰対象はgoogle様だ (つーーか、もうすでにいるじゃん! こんなの)。
そして、それをマニュアル世代の連中が「あんな奴らがいるようでは世の中もうダメだ」となげく世の中。 諸行無常。いや人間の適応力ってのはすばらしいね。
.dylib
でないといけないらしい。
これに気づくのに時間がかかったぜ、ちくしょうめ
(OSX のライブラリの中には拡張子がないものもあるのだ)。
まあ ACL は使わないから、べつにいいんだけど。
Common Lisp (こもりす) でいいなと思った機能は、 「好きな shared object をロードして、インタプリタ上からそれを試せる」ということである。 なんかいじってみたいライブラリがあったら、いちいち C でテスト用コードを書く必要がない。 これは非常に便利といえる。 Python でも dl などを使えば一応できることはできるが、型の扱いがまともでないし、 C からのコールバックも使えない。これが CL の FFI (foreign function interface) では 型や構造体を定義できるし、ポインタや配列も渡せるし、返り値にもポインタが使える。そのうえ Lisp の関数を C からコールバックとして呼べたりもするので、ほぼ完全に C のインタフェイスとして 使うことができる (もちろん、そのぶん segfault の危険がつきまとうわけだけど)。 だから swig とか使わなくてもバインディングが簡単につくれてしまうのだ。 Python は glue 言語というわりには、このへんはいまいち弱いね。
サムいのでそろろそ帰っちゃうおうかな。
…ところで (てくるで)、ニューヨークというのは日本人が思い描くような都会ではない…。 ここはさしずめ、世界各地から田舎をとってきて、それらを 1/100 ぐらいに圧縮し、 マンハッタンの中につめ込んだようなところ (てくる) である。 てくる
さいきん、ここに現実世界っぽいことばかり書いていたので、 これからはしばし反省して現実っぽうことべけれくくくとぅぬすよう。ふ
夕刻から lispnyc-meetingo. きょうはとくに発表もなかったので、 77丁目? だかにある、うぇすとさいど・ぶるわりーで 飲んでいた。といっても新山は今日は飲む気にもなれないので、 なんとなく水しか飲まず安上がり。
しばらくすると、明らかに日本人とおぼしき集団が入ってきたが、 ソソクサと出ていってしまった。彼らは一言もしゃべらなかったが、 明らかにかれらが中国人や韓国人でなく、(海外慣れしていない) 日本人であると確信できる。 それはかれらが場の空気を読もうとして必死になっているのがわかるからだ。 しかし日本ではこれは一種の「気取り」として見られるが、米国ではそもそも 読める空気というもの自体、存在していないので、 そんなの気にするだけ無駄、なのである。でも、ああいうタイプに限って、 日本に帰りゃ安心してデカいツラしてるんだろうな。 そしてどっかの掲示板に「空気嫁」とか書き込んでんのかもしれない。 ああいう人々が、すべての人に「空気を読むこと」を期待しているあの傲慢さがきらいだ (新山が慣れ合いを嫌いだというのもたぶん同じ理由)。 読める“空気”なんてものが存在するのは実は地球上でも日本ぐらいだろうと思う。 だからこのことを知らない人々は、海外に来ても自分たちが 空気を読めているかをつねに気にしてしまう。でもこれはほんらい 存在していない恐怖に怯えているようなものだ。 そして、こういうのは正直いってとっても幼稚。
に、見える。
あなたのことですよ。
オレか? オレのことか!?
それにひきかえ、セキネさんなんかもう完全に「空気読まない人」になってて、 この人が日本での学会に行ったりすると微妙に浮いてるんで、おもしれーーんだ、これが。 (もっともこの学会にはもとから浮いてる人が多いので、あまり目立たないケド)
きょうは例の wordseye (いまの名前失念) の人が来てたので、 「さいきんどうよ?」という話になり、新山は自然言語処理のインチキ性について またひとくさり不満をぶちまけていた (この人とは意見が一致しているのだ)。 しかしこの人の会社はほんとに面白いことをやりつつあると思う。 いいな。これはもしかすると世界でも類のないデータが集められるかもしれないぞ。
ところで (てくるで)、どうでもいいけろ、ほとんどの「○○的」って単語は たいてい「○○による」「○○っぽい」などといった表現に置き換えられると思うのだが、 「全面的」という単語はそれが不可能なことを発見した。 「全面っぽい」って何だろ? まあどうでもよろ (シイ) けど。(シイ) (シイ)
きょうは、一日ずすしくてよござんした。オフィスは激寒。
新山がこのヒトを最初に見たのは米国に来てからで、忘れもしないあの 9.11 テロの日は ずーーっと出づっぱりでやっていた。テロもテロだけど新山はこのキャスターにむしろ 驚いていて「このおっさん、よくもつよなあ」と思ったことを覚えている。 ABC のサイトによると「彼は 25時間ぶっつづけで生放送した唯一のキャスターだった」と書かれている。 Wikipedia によると 9.11 のときは 60時間ぐらい出ていたそうだが、このころから (一度は禁煙した) タバコをまた吸いだしたらしい。 これで今回の肺ガンになったのね。 彼の政治的な姿勢についてはよく知らないが、ひたすら現場主義で体力勝負でおまけに冷静、 というこのおじさんはオレにとっては典型的な「すごいアメリカ人」に見えた。 しかもカッコいい。 ファン多そう。 当時うちにはまだケーブルがなかったため、Owen の TV で、おまけに WTC が壊れたせいで 映るチャンネルは CBS と ABC ぐらいだった。
どうでもいいが、ABC でほかに有名なキャスターっつったら Barbara Walters がいるけど、 さいしょに 20/20 を見たとき、ああ NHK の「クローズアップ現代」はこれのパクリだな、 と思った人はたぶんオレ以外にもいるはずだ。
新山は「死ぬ直前まで仕事をしている」というのにあこがれる傾向がつよい。 これが労働の賛美で悪趣味だと言われようが、何と言われようがオレはそういう生き方が好きなのだからしょうがない。 「すでにアガってしまって悠々自適な生活」というのにちっとも興味をもてないのである。 これがあと 30年たってもまだこう思ってるかどうか知らないけど、できればそうありたいもんだ。
(以下 2〜650行略)
てくるで、darl mcbride が日本語を話すとは知らなかった。
まあ日が暮れるのは 8時ごろなんだけれどね。
某所の地下鉄車内にて。
</centre>
</dev>
。
というか、新山はキーボードをだいぶ前のほうに置くのが好きなのだが (たぶん 50cm ぐらいはあいていると思う)、そこまで机に腕をのせるために いつも一の腕 (?) がほとんど机に接しているのだ。だから机が つめたいとこれはこれはオレにとっては死活問題である。死活問題だる。 いいなおし。→→〉・→〉〉〉→→→→・→→→〉・・・
てくるで、知らなかったのだけど iPod は日本ではホントに売れているらしい。 なんで??
ふと気づいたが、「ラーメンマン」と「リーマン面」は似ている。 「○ー○ん○ん」という語は日本語では以外と特徴的で、頭に残りやすいんではないだろうか。
ということで、いつもこういうときに (だけ) 使う ipadic にご登場いただきました:
日本語の grep はうまく動かなかったので jperl 使用。
はっきりいって、こういうときの perl の使いやすさは Python よりはるかにまさっていると思う。
1行以上のコードを書く気はないけど。
$ cat /src/nlp/ipadic-2.7.0/Noun*.dic | tr -d '()' | jperl -ane 'print "@F[4] @F[9] \n" if (@F[9]=~/^.ー.ン.ン$/);'
有神論 ユーシンロン
溶連菌 ヨーレンキン
光電管 コーデンカン
公民館 コーミンカン
等深線 トーシンセン
後見人 コーケンニン
B4判 ビーヨンバン
通信員 ツーシンイン
同心円 ドーシンエン
総本山 ソーホンザン
一般 ゾーリンゲン
一般 アーリントン
なぜ DH 鍵交換のほうが安全なのか?
なぜ HMAC のほうが安全なのか?
sshd_config
。
authorized_keys
にアホな値を設定する。
…つーことでまた久しぶりに Java のコオドをいじっていたら、 すぐに原因判明。つまりファイルを全部いちど Vector に読み込もうとしているのが原因だ。 各文書は独立してるんだから、いっこずつやれば十分なのに。 しかし直すのがめんどくさい。「くそーーーなんで generators が使えねえんだ!」 などとひとりムカつく午後。ああ、そろそろ腹へっあ。
てくるでぜんぜん話は変わるが、チョコレートの Godiva というのは peeping Tom に覗かれた Lady Godiva のことだったらしい。 あれってイギリスの話かと思ってたが、ベルギーだったの?
20 の回答シリーヅ: (この回答は、どんな質問に対してもご利用いただけます)
それがあまりに楽しかったんで、(夢の中で) もう一度やったら どっかのオジサンに怒られた。
これは一体なにを暗喩してうるのだらうか??
これはあくまでウワサだが、googleの給料はそんなによくはないという話である (もっとも人によって違うだろうけど)。ようするに、やつらは会社へのプライドで働いているんだろ? あとは飯がタダらしい。MS も似たようなことをしていると聞いた。オタクはそういうもので釣れるんだから単純ね。 まあ、オレにはどのみち関係ないが。
今日もこれまた激暑いよ。
どうでもいいけろ、ジョブズはわざわざクソ暑い中東京まで来て何を言ってったんだろう? ヤツは内心では日本なんてたぶん大キライだろうと思うのだが (そういう顔をしている)、 わざわざ我慢して愛想ふりまいてるとしたら笑える。新山はちょうど iPod が発売されたのと同時期に こっちに来たので、そもそもアレが日本でどれくらい売れているのか知らない。 NY ではときどき地下鉄に乗ると周囲の 4人ぐらいが iPod を使っているときがあるが、 日本じゃ携帯電話で音楽が再生できるっつーのに、わざわざあんなデカいの買うかね? 前にナカガワさんがカーステレヨにつないで使ってるのを見たが、ああいう使い道しかないと思う。
やべえ、そろそろ図書館の本返さなきゃ。樋口一様は結局途中で挫折しました。
google://野沢菜 茄子 あざみ 切り干し大根/ (7)
style=
" 属性を編集許可しているが、
これはもしかして脆弱なのではないか。もしかすると
@import
や url()
でおかしな URL をとり込めるのでは?
よくわからんが、とりあえず禁止にしておこう。
「明らかに必要なもの以外は、余計なもんをつけない」という方針に
従ってなかったオレが悪かった。
てくるで、slsdhtot (わざろ) の連中の日本好きはなんか見ていてイライラする。 お前らはどーせ Inuyasha とか見て秋葉原行ってああいうのが日本だと思ってんだろ? 共和党バリバリのアメリカンは嫌いだが、かといってこういう連中にも腹が立つ。 かくいう新山もまだアメリカの奥地 (= 真のド田舎) を見たことがないので アメリカンを理解しているとは正直なところ (= てくる) まったくいえない。 もしかすると田舎に行ったら実はアメリカが好きになるかもしれない。 だけど、もう、オレには十分好きな「田舎」があるのでこれ以上はケッコウだ。 欲張りは身を滅ぼすよ。ほんとに
きょうは某所のオープンハウス (と呼べば呼べるようのもの) に行ってきたのである。 といっても、べつに新しい学校に行くわけじゃないのだけど、ある人々に会いにね…。 自分は研究テーマを変えようと画策しているので、なるべく早いうちから あれこれと知っておいたほうがいいと思って。それほど面白いものでもなかったが、 たしかに問題は存在しているということを知った。そしてオレはそういったことに (いまの研究よりも) やりがいを感じるということも。
とはいえ、学位取るまではいまのままでいい子にしてますよ。たぶん。 それに、逆説的ではあるが、物事それほどスムーズに進むとも思えない。 まあ、気長にやるさ。
日本語ウイソドウズのデフォルト用紙設定はすくなくとも 3箇所ある。 A4 をデフォルトで Letter 変えるには、これらすべてを変更しなければならない。 くそったれ。
てくるで
アレの続きはどうなったのか、とご疑問のみなさまへ:
もっか収録中でござ。
もう寝るます。オヤスミマシタ
おまけに昨夜しかけといた実験はエラーで止まってるし…もう最悪。
そのあとオフィスに帰って食っていたら、汗がでるので、 食ったあとに急激に身体が冷えて激サブい。 緑茶をのんでフーフーする。そのあとまたもや実験スクリプトを走らせて、 アホなバグをいっこつぶし、Fedora の設定をやらされ、帰ってきたら へれんから電話がかかってきてパーザがどうしたこうした…という話。 そのあとトイレに行ったら、ドアがペンキぬりたてで手が真っ白になった。 ちゃんと注意書きしてくれよ!
さて、こないだまで来ていた図情大の学生はぶじ帰っていった (はず)。 いつもいつもセキネさんが呼んでくるビジターの学生には 女の子がやたらと多いのだが、これはなんでなのか、という疑問が ある方より呈される。そういわれるとたしかに女の子が来る率は高い。 なんででしょうね? 今回の 2人をはじめ、 その前の長岡の学生さんも女 2人組だったし、さらにその前は慶應からいっぱい来てたよね…。 オレとしては毎度毎度、人が変わるので疲れるのだが (どうせオレはただの「雑用君」扱いだし)、 また来学期も誰かくるのかなあ。 自然言語処理は、情報系の中では女性率が高いほうだと思うが、 それでもこれはちょっと多すぎだ。新山は セキネさんがわざと女の子ばっかり呼んでるんではないかという疑いを もっている。たぶん毎回日本に行ったときに人買いしてんだろうね。 そういえば今回きた図情大の人々は例のスーパープログラマの方のところにおられるらしい。 まあ「図情大で自然言語処理やってる」って聞いたときからなんとなくイヤな予感はしていたが、 まったくこの業界せますぎて疲れる。新山は「どこそこの誰々がどうした」という このテの噂話がほんっとに嫌なので、できるだけそういう話題は避けているのだが (こういうのを聞くと、人間は RFID よりも猛烈な勢いでトラッキングされているということがわかり、 がっかりするから)、つい聞いてしまって脱力。自分は誰からも気づかれないように トンズラしようと心に誓うのであった。
話は戻るが留学の話。べつにセキネさんがつれてくる人々に限らず、 日本からの留学生には、どういうわけか女性がヒジョーに多い。 NYU には日本人留学生の集まりのようなものがあるが (新山はほとんど参加したことがないが、 ML だけはとっている)、これまた女の人が多いのだ。 これは NYU に限ったことではないと思うが、なんで男は留学しないのだろう。 台湾や中国からは男も女も沢山来ているから、これは日本人だけに見られる傾向だ。 新山はハナっから留学を希望していたクチなので「留学したがらない男」の 気分は理解できないが、このことは日本人男性のもつ保守性や ヘンなプライド等々と関係があるのだろうか。ナゾね。
きょうは何をやったんだっけ? ああそうだ。 webstemmer のスコアリング関数がなんかオレの意図したのと違った動きをしているようなんで、 こいつをデバッグせにゃ。ああこれは「今日やったこと」じゃない。これも明日への todo だ。 しかし今日中に終わらせる予定だったのにくっそーー。
あと。
テスト用のプログラムをいくつか作ってもってくこと。明日までに必要か?
あるものを C(++) で書き直すということは、それをブラックボックス化するということに等しい。 ほわいとぼっくす化
x[2]
とかで指定してるのがさらによくなき。
これじゃー (caddr x)
とかってやってんのとおんなしだよ。
でもこれメンテする価値あるのかなああ。誰かオレの他に使ってる人いるんならやるけど、
今のところ誰もいなそうだ。
サムいので早帰る。まだオモテは地獄のごとき明るさだ (ここで延べられている「地獄」とはサルトルの言及するそれである、以下同文)。 なんかだ微妙にテンションが不断とくらべて高いような気がするが。 それは寒さのための禁断賞状であろう???