…と、思うようなことはこれまでに何度もあった。 そのたびに性格は変わりつづけてきたような気がするが.
じつはぜんぜん変わってないような気もする
今日はすずしいが、日ざしが強いためずっと歩きつづけているとさすがにあつい。 餃子がとろけないうちにすばやく帰ってくる。 とちゅうでノドがかわいたので BW の Starbucks で tazo chai latte を飲んでみたが、 こんなら午後の紅茶 (あるいはその類似品) ミルクチーのほうが安くていいやと思った。
電車の中での光景でひとつ印ゾウに残ったこと。 WTC に行く地下鉄の中で、黒人の少年が 10ドル札を 1ドル×10枚に両替してくれと 客に頼み歩いていたが、みんな 1ドル札を持っていない。 車掌にも尋いていたが (PATHの車掌は客室にいる)、 驚いたのは、そのうち車掌が運転席に行き、そこのドアをガチャっと開けて、 運転手に向かって「お前、1ドル札もってる?」と尋いてたことである。 あの、電車は走行中なんですよ。 さいわいその運転手は 10ドル持っていたらしく、 少年はめでたく 1ドル札10枚を手に入れたのだが、 しかし…心あたたまる、というよりは「両替ごときにそこまでするか」と驚きだった。 この時間帯は WTC 線はガラガラなので、車掌もヒマそうにしているというのは わかるのだが、あれはちょうどトンネルに入るところで、 あの状況で運転席のドアをガンガンと叩いて開けさせ両替を頼むというのは、 ちょっとやりすぎだろ。これではそのうち事故が起きてもしょうがないと思う。 ひやひや。
google://印象 印度象/ (920)
ところで (てくるde) いきなり思ったが、中国人というのはカニが好きだ。 ちゃいなタウンの魚屋へいくとカニを売っているが、人間のコブシ大ぐらいの、ちっちゃいやつ。 どういう品種かわからないけど手の部分が青い。そんで、連中 (=カニ) は活きたまま (こういうときには「活き」を使うのが正しいんだよね?) バケツの中に大量に 放りこまれてガサガサやっている。中国人はそれを 10個とか 20個とか買っていって、 まるごとスープに入れる。日本のようにでかい品種ではないので中身はそんなに 食うところがない。
今日はもうオフィス行かねーーからな!! こんにゃろ
print file("/proc/self/status").read()
もう一杯…
てくるで、ハチミツのとりすぎで太るってことはありうると思う。 あるいはクマ化するとか。
さっきちょっと昼飯ついでに外に出てみたら、 外で作業しても十分なような気がした。 てくるでデリでいつもご飯ものと麺類を両方とり、 一緒にパックに入れると、ご飯と麺類がまざってしまい大変に 食べにくい (まあ、ラーメンの中にご飯をつっこんだ経験のある人だらば おわかりだろう)。なので「ご飯と麺類をまぜないこと!」というのが これまでの教訓として頭にたたきこんでいたのだが、きょう新たな教訓が生まれた。
スウィートコーンと麺類もまぜないこと!
<ぢv align=right><small>
てろてん
</small></div>
夏も冬もサムいのがニューヨークです。
あるページを見ていてふと思ったこと。 新山は日本語が好きだし、文章を読んだり、書いたりするのも好きである。 しかし、高校生のころ国語は大キライであった。 これはだういうわけなのか? 「受験英語」という言葉があるのなら、 あれはさしずめ「受験日本語」といっていいと思う。
この調子でいくと、第11番目の惑星が発見されるのは西暦 2080年ごろということになる。 ちなみに第100番目の惑星が発見されるのは西暦 8750年ごろであり、 そのころ日本では旧天皇誕生日が約100個増えて 1年の半分は休日になっている。
韓国語は目立つということについて。 電車の中で、他にいろいろ雑音があっても だれかが韓国語を話しているとすぐにわかる。 なぜなら独特の抑揚があるからだ。とくに女の人の話し方がめだつ。 どんなのかというと、80年代ぐらいのいわゆる女子大生コトバ 「ナントカでぇ〜〜」「ナントカがぁ〜〜」というのをもっとクドくして間延びさせた感じ。 しかも連中は声がデカい。だから実際の音節はまったく聞こえないのだが、 抑揚だけでじゅうぶん特徴的である。混雑した車内で姿は見えなくても 「ああ、あっちのほうに韓国人がいる」ということがわかってしまう。 中国人も声がデカいのだが、中国語の場合は抑揚があんなに大きくないので、 近くまで行かないと中国語かどうかはわからない。
12件か…・・・まあまあだな。(何が?)
変数名に t
を使おうとして怒られる。
もっとも、同じことは Python の len とかにもいえるんだから文句いえない。
あと、新山は "id
" ってのを使いたくなるときが多いのだが、
これは built-in の id
を隠してしまうのでなんか気分悪い。
この関数ってほんとに builtin に必要?
待て。あれはホントにホタルだったんだろうか?
それにしても。
なんだか自分がキョーレツに「資源の無駄遣い」をしている気がしてならないのだけど。
こういう日に外で働いてる人ってホントにスゲエなあ。 きのうは熱波で今年初の死人が出たっていうし。
google://ザカルウィ/ (54件)
今日もあらためて自分が“この手の”自然言語処理に まったく興味をもてないことを知った。 情報なんか検索できなくていいよ、と思うのである。 「かしこい検索エンジン」の話が出るたびにいつも思うのだが、 どうかこれ以上、賢くなってくれるな、と。 Google 程度で十分だ。ツールは単純にしておこう。 そもそも世の中が今よりも便利になってどうすんだ。 たしかに国によっては、明らかに今よりも便利になったほうが いい所もあるだろう。が、少なくとも米国や日本の場合は、これ以上いくら 世の中が便利になっても、絶対、今以上には幸せにならないということが はっきりしている。あとは「どうやって死ぬまで暇つぶしをするか」 ということだけが問題だ。だから、世の中はわざとある程度不便にしておくべきである。
もちろん、これは新山の本心ではないです。30% ぐらい。
(追記) きょう聞いた話だが、 さいきん日本では web を勝手にクロールして得られたデータを学術研究に 利用することも禁止される流れになってきているという。 たとえデータそのものを公開しなくてもダメなんだそうな。 なんかおかしな議論だが、米国では日本とは事情が違うってことでとりあえず無視しておく。
さいきん、おかしね夢が多ひなあ。
学問的な興味としては「人が文章 (あるいは発話) をどう“理解する”のか」 というのがここ 10年間ぐらいずっと持っている疑問。そしてこれがそのまま現在の 自然言語処理に対する不満につながっている。構文解析の研究がいくら盛んになっても、 そのあとなにをするかという研究はほとんどだぁ〜れもやってないし、そもそもそれらが言語理解にとって 本当に必要なのかすらもわからない (そもそも「構文解析が必要」という発想じたいが、 失敗したかつての記号論 AI の呪縛をいつまでも引きずっているように見える)。 そして、誰もシンボルを分解しない。このことはとくに問題だと思う。 みんながやっているのは、結局のところ「シンボルを分解して、より小さなシンボルにする」か、 あるいは「シンボル間のつながりを見る」ことによって意味を処理しようとしているだけだ。 しかし、だとしたら自然言語は一体どこで現実世界とつながっているのか? 「リンゴ」という単語のどこにリンゴのあの形との関連が含まれているのだろう。 現実世界がすべて記号で表現できるとすれば (そう思いたい人はいるようだけど) それは筋が通っているが、新山はそう思わない。それは近似ですらないと思う。 現在の自然言語処理においては自然言語は完全に数式のような記号処理として扱われており、 現実的な基盤がまったくない。さしずめそれは「プカプカ浮いている」のである。 しかし、この分野にはあまりこのことをシリアスな問題として考える人がいないようで、 みんなどうでもいい枝葉な (と新山には思える) ことばかりやっている。 だいたいなあ、自然言語処理ってのはそのうち「情報検索 + 機械翻訳 + α」だけの世界に 吸収合併されるんじゃないかと思うんだよ、この場合「合併」っていうのかどうかはべつとして…。 これというのも DARPA や Google のおかげだね! あと、米国には マーケティングや軍事関係のためのデータマイニング屋が沢山あるらしいので、 そういったところも最近 NLP づいて繁盛しているらしい。 こうした傾向は、Ralph やセキネさんにとっては嬉しいのかもしれないが、 新山はさっぱり興味ないので、オレの「学問的な興味」は永久に解決されないまま 終わるのではないかという気がしている。まあ自分で研究するのなら話はべつだけど、 そんなことしてたらいつまでたっても平和な生活はできないし。
てくるで、午前中家にいるとだいたいセールス電話 (ロボット版) がかかってくるのは 10時〜11時のあいだなのだが、なにかこの時間帯がイイという統計でもあるんだろうか??
いまなにげなく思いついた等式:
実際には google は slashdot.jp ほどひどくはないと思うけど…。 と、いうか、外資系の IT 関連企業ってほどんどこんな感じじゃないのかな。
新山が勝手に想像する外資系企業の特徴 (偏見入り):
いやーーー、当たっていそうでコワイよ!
と、ここまで書いておいて思うのですが、ラジむかはいつ更新するのでそふか。
「ユウスケ、じつは○○○のことが嫌いなんだって?」
なぜ それを!!
「お前、いつも○○○○読んでるんだって?」
なぜそれを!!
「お前、自分の夢を web 日記に書いてるんだって?」
なぜ それを!!!!!!!
こんなぐあいだった。
てくるで、 Penn. station で「this is a bomb」男が逮捕されたんだって。 シャレになんねーな。てっとり早く有名になりたい人向けだね。 (おっと)
ぬんにも。
訳注: PHP を「ぴひぴ」って読むことはご存じでした?
事実上、これはアスキーアートに対して特許を取ろうとしているといってもいいと思う。 どこまでがエモティコンでどこからが違うのか? i-doesn't-knows-me-are-whom.
「ぎゃあああああ〜割らないで〜〜〜〜!!」
とゆう声が聞こえた。おネエ言葉ってことはメス卵か? と思ったが、 しかしそのときはすでに手の動きは止まらなかったので、 タマゴはパッカリと割れて黄身が味噌汁の上に落ちた。 そいつはなおもまだ絞りだすような声でなにやら叫び続けていたが、 「うるせーな」と思ったのでおタマでもって上からぶしぶしと つぶしにかかった。そのあとぶしゅぶしゅと何かがせき込むような 音がしばらく聞こえていたが、やがて聞こえなくなった。
そしてしばらくするとぼくは完全に白濁した卵の白身を見たのです。
この後の展開:
てころで (←新しい組み合わせ)、最近 slashdot の google 関連の重複記事 (dupe と呼ばれる) がメチャクチャ多い。 そのたびに cowboyNeal などがさんざコケにされていて笑える。 かれらは tf/idf 程度のツールを使えば重複記事の判定 (少くとも、その示唆) ぐらいできるんじゃないか?
じつは above の場合は by には減少させる差分の絶対値、 つまり正の値を与えなくてはいけないのである。 さもなくば、i はどんどん増え続けて無限ループになってしまう。 いやーー、この仕様に気づくのにどれほど時間がかかったことか! 例の loop page を更新しなくては。> (loop for i from 0.0 below 1.0 by 0.1 do (print i)) ;; i=0.0 から 1.0 まで 0.1 きざみで増加させる ... > (loop for i from 1.0 above 0.0 by -0.1 do (print i)) ;; i=1.0 から 0.0 まで -0.1 きざみで減少させる − 間違い ...
それにしても罠だらけの言語だ。まるで C++ のようである。 (いや、C++ よりはるかにましだけど)
todo: フォント管理。いちど読み込んだフォントは重複ロードしないこと。
(追記) きょうも長ネギと米をしょって帰ってきたが (米をリュックに入れていたが、爆弾を背負っている、とはたぶん思われなかったろうと思う)、 日本食料品店で買い物していたらアメリカンのおばさんが近づいてきて、 何かと思ったら「Organic な納豆を買ってこいと言われたのだが、 自分は日本語が読めないので、どれが organic な納豆か教えてくれまいか」という。 この店には納豆の種類が異様に多い。十数種類はあると思う。 それで、「これは organic って書いてある、 これは有機栽培とは書いてないけれども、無農薬って書いてある、 これは遺伝子組み替え大豆不使用と書いてある…」 と説明していったら、そのおばさんは片っぱしからカゴにホイホイと 放りこんでいくのである。あれ、ぜんぶ食うんだろうか? ところで「遺伝子組み替え大豆」の英語がわからんかったので、 テキトーに "genetically altered soybeans" などと言っておいたのだが、 これは正しい英語だったんだろうか? たしか遺伝子なぞの改竄のときは alter を使う雰囲気があるような気がしたが、いま考えてみると genetically engineered のほうがよかったのかな。 ときどき慣れない言葉を使うとふと考えこむことがある。
あと、棺桶に入れるときに三角のアレをつけるのはどこの出自?
午後はずっとプログラミんぐ。きょうはかなりくたびれた。 中心となっている部分は、まあ、100行ぐらいの量しかないのだが、 もろにベクトル操作 + 場合分けのために頭を使う。だいぶ紙に下書きをしたが、 コードを最適化すると大したことをやっていないように見える (実際、そうかも)。 しかも、ここはなるべく速く処理しなきゃいけないところなのだ。だから、 あまりアホな式にするとよくない。超越関数 (atan とか) なんか 使っちゃあマズいだろう…でも平方根を使っても同じかな? いやいや、しかしこんなことしたって他の部分がどうせ遅いんだ… などと、うだうだ悩んでいた。帰ってきてからは久しぶりにギョウザを焼く。 いや、やっぱ、ギャウザはいいやね! そのあと図書館で借りてきた本を むさぼり読み、桃を剥く。今日はすずしいらしいのでよく眠れるのこと予定。
きょうの目標 (もくひゅう) (さ):
タオルかうこと。
塩かうこと。
コーヒー
かうこと。
そしてあとは?
ねっし ねっし
ぽっり
ねっし
あー
…とここまで書いて死にたくなり、やめた。
ほんとうに自分がそういう人生を送りたいのかと自問すると、 考えこんでしまう。
なんとなくわかったが、どうやら人の情報欲求には 2通りのパターンがあって、
「検索指向」の人と「ブラウズ指向」の人がいるらしい。
これによれば新山は圧倒的に「ブラウズ指向」だ。
そもそも「探したい情報? そんなんねーよ。それより、腹へった」という
タイプなので、明確な目的をもって検索している人の問題というのが
あまり理解できないのである。そもそも人生の態度として、
ゴールに向かって一直線、というのがいただけない。余裕がないというかね、
そんなんじゃダメですよ (断 定)。
新山の場合、ゴールはわりと明確に定まっているのだが、寄り道上等、
というか、迷ってるうちにゴールに着いちゃうような生活がいいんだな。
しかしむしろ脱線こそが人生の真の目的なのであるから、脱線しまくっていけば、
いつかそのうち目的地 (と自分が信ずるところのもの) にたどりつく
であろう????
nemy
てくるで (ところで)、今夜はなにげに満月じゃない??
(↑この「なにげに」の使い方は語用論的にみて偽であろうか、わからじず)