目覚ましを足で止めるのは至難の技.
このようにいきなり気候が春らしくなるといつも新山はちょっとだけ嬉しくなる (そして同時に不安になる) のだが、この国ではぜんぜん「ニオイ」がしない。 これが非常に不満というか不満だ。東京では、すくなくとも大田区では、 春になると毎年いつもかならずある「ニオイ」がしていた。 たぶん草木や花なんかの総合的なニオイだと思うのだけど、 3月から 5月にかけて、日本ではいたるところでこの手の「ニオイ」が流れる。 これは心理的なものではないと思う。ま、同時にそのとき花粉症にも悩まされるんだけど、 家から出て「あっ、春だ」と思うことがこちらではない。 マンハッタンでないのならまだしも、NJ のほうにいてもない。 基本的に草木がパサパサした種類が多く、日本で庭の植え込みに使われるような木は あんまりないのである。ツツジもないしね。 そういえばうちのアパートの近くにモクレンっぽい木があるが、 あれが咲くのはもっと遅かった。
とにかく、新山は「ニオイ」に非常に敏感である。 敏感っつうか、「脆弱」といったほうがいいかもしれない。 「これはあのとき、あの場所でかいだ匂いだ」というのがたくさんあって、 それらに近い匂いを嗅いだときに、それがトリガーとなって、ある瞬間の 記憶や感情がばぁーーーっとよみがえってしまうことがときどきある。
セキネさん (とムラカミさん) は某国で開かれるゴンゴ処理学会に向けて旅立っていったアルね。 というか、あの人は今年何本論文出したんだろ。10本? 20本? 論文数だけみればCollinsにも勝ってるよ? コトシャーどこでヤルのか知らぬいが、さぞかし日本はいい気候だろうことよ (花粉症的にも!)。憂鬱。。。。キタチョー線はテポドンでも発車しゃがれこの野郎。 (やけ食い) (やけ食い) (やけ食い) (肥満)
Courtesy costs nothing.Lackey numbers 15, 47, 22, 3, 5, 17
うらっかわ:
LEARN CHINESE: SchoolXue-xiao 学校
んーー。しかし今日は辛いモノを食いすぎた。 また胃腸にクルんではないかと今から心配だる。 MDDI (まあどうでもよろ)。
暗号システムは、大きな秘密を小さな秘密 (鍵) で守る。 残念ながら、最近のコンピュータはごく小さな秘密さえもろくに守れない。-- Bruce Schneier
mv
を使わず、
上書き防止処理を施した mvi
(ただの mv -i
へのエイリアス) を使うようにしているが、
"mvi
" という文字列をみるたびに 8080 のアセンブラを思い出す。
うちのオヤジがもっていた入門書は Z80 用ではなく 8080 向けに書かれていたのである。
さいしょは「ゼロフラグとキャリーフラグしかないのに、どうやって大小比較するんだろ?」
とか悩んだりしましたもんね。なんしろ当時まだ新山は 1ケタの年齢だったからな
(いや 10歳になっていたかもしれない)。
そういえばオレはモトローラの 6800シリーズをいじる機会はついぞなかった。
その後、高校に入って Mac を使うようになってから 68000 のアセンブラは使ったけど、
そのころは C のほうが普及していたからそんなに活用しなかった。
しかし、いまの小学生がこういう「あやしいガラクタ」で遊ぶとしたら一体なにがあるんだろう。
携帯電話を改造でもするのかな? いや、むしろいまの時代なら計算機だけよりも
物理的なロボットの制御だろうな。そっちのほうが楽しそう。
しかし改造できるような機械がどこにあるのか知らないけど
xlock
のようなプログラムをめったに使わないが、
唯一、これが重宝するときがある。それはキーボードとマウスの掃除をするとき。
つないだままやるな。
というか実際、世界より東洋のほうが大きいんだ。それで 150% 間違いない。
google://注意深く避けられている/ (70Ken)
それにしても…なんで google は検索結果をスキップするんだ…ぶつぶつ。 これらのサイトがどれもこれも禁止されているのだとしたら (やや下品ではあるが、 とくに問題があるサイトとは思えない)、 google はトンでもない数のサイトをブロックしていることになると思うんだが、 オレの運が悪いだけなのか? それともオレが中国人みたいな髪型をしているから連中はオレの検索結果を検閲しているのか?? 前は google ってインデックスがでかいことも売りのひとつだったと思うのに、 いつのまにポリシーが変わったんだろうか。できるかぎり好意的に解釈するとして、 今日の lwn で、G社が Mozilla と協力して詐欺ページ回避ツールを作成みたいなことが書いてあったが、 彼らが「詐欺ページ」の検出に自動化されたアルゴリズムを使っているのはたぶん確実だろうから、 それがアホっているんだろうか。わからん。Yafoo や AskGeeves にスイッチすんのはやだぞ。
いまパーソナライズド検索とかゆーのが話題になってるが、 これが普及したらこの手のページを検索インデックスから (こっそり) 削除すんのはもっとバレにくくなるだろう。 なぜなら「いえいえ、だってこれはあなたのために最適化された結果なんですから!」と 言いわけすることができるからね。そりゃ、さぞかしおもしろい世の中だろう。 とりあえずオレの研究とは関係ないからドーでもいいです。
と、いうか、オレの唯一の希望はただ「堅気な仕事をしたい」ってことだけなんですが…。 自分に近代的な自然言語処理研究者としての才能がないってことは もうわかりきってるので、見苦しくならないうちに逃げ出すのはごくまっとうな選択だと思うんだけど。 セキネさんとこういう話をすると、このヒトはアメリカンにありがちな 「合理的に話せばわかる」的コミュニケーションの可能性を無邪気に信じてしまっているもんだから、 「そんなに自然言語処理がダメだと思ってるんなら、 なぜこの分野にとどまって、変えようとしないんだ」といわれ、 余計に疲れる。ああいう人々とわかり合うのはムリですって、絶対に。
やっぱ疲れてると口が悪くなるな。さっさ寝よう。さっっっっっっっっっっっっさ
そういえば (さふいへう゛ぁ)、ことし暖冬だったんでコオトを買うつもりだったんに 結局買わずにしまった。うんとこさ。
「それは、俺だ」 (… 以下原稿数枚ナシ …)
そのあと heow からメールがきて、 どこから調べたんだか 日本Lispユーザ会 などというものを 見つけて来、このヒトたちにコンタクトをとりたいんだけど、このページに連絡先は書いてあるか? みたいなことを尋いてきたので見てみたら、げっっ、ここに出てる人々はみんなスゲーーー有名人じゃないっすか! なんかウチラとはノリが違いそうだよ? どう考えても。まあいいや。
あったかくて雲ひとつなくて非常にラブリーな天気である。 ラブリーだと? 笑わせるなよケッケ。
ふと思ったのだが、おそらく善人というのは 他人がだれでも善人に見える人のことをいうのだろう。 きょう、ふとそう思った。 オレは他人がだれでもみな悪人に見えるので、おそらく悪人である。 救いがたい矛盾。 ま、悪人にもいろいろあるがね。
「いや、システムが停止したんだ」
いまあらためて思い出したが、GEB (げぶ) はやはりすごい本である。 新山にとって「人生を変えた一冊」といえば やっぱこれしかない。ある意味これのために、オレはこんな地の果て (「知の果て」というとカッコいいけど、それはぜんぜん現実を反映してない) まで来ても まだ「研究テーマが気に入らない」とかブツブツ言ってるわけだ。 書籍というものは恐しい!
うそ重ね「勝訴」
”っていう新聞の見出しをみて、
弁護士のオッサンがカウンターに
「じゃあ、おれ“ウソジュウ”ね」と注文している光景がうかんでしまった。
そしてみごと勝訴!! すン-ごい!!!!!
!!! !
オレって日本語おかしいだろ?
(おかしいのは日本語だけ、あとは全てまとも)
「なんやら」という 日本語が好きだ。これを使っている人をみると好感をおぼえる。やる気なさソーーというか。 「ん」「や」「ら」と続くフヌケた語感がいいのかもしれない。
サロメちゃんやスクルッタおじさんはなんて名前なんだろうねえ。 やっぱりペーパーバック買うか。
てくるで (ところで)、 ラジオからモーツァルトが流れてくるとイライラしだす。 これはオレだけだろうか? テンポが速すぎるのだ! テンポが速い曲自体はよくあるのだが、モーツァルトはどうも タイミングが合わないというか、「どこで息つぎすればいいんだかわからない」状態になる。 非常に落ちつかない。
ほとんどのプログラミング言語における文字列の内部表現は、 「長さ情報 + 可変長のバイト列」か、 「可変長のバイト列で \0 を終端文字として使用する」というものである。 しかし長さ情報を使うと有限な長さの文字列 (255文字であれ 2^32-1文字であれ) しか使えないし、 終端文字を使うとその文字自身を文字列の中に埋めこめないという欠点がある。
もうひとつの可能性として、「終端文字 + エスケープ文字」を使うというのがある。
これはほとんどのプログラミング言語 (や HTML) で、文字列定数のなかに
「"
」自身を埋めこもうとするとき、バックスラッシュを使って
「\"
」とエスケープするのに似ている。
しかしエスケープ文字を使うと普段より 1文字余計にかかってしまうため、
もし特殊文字が定数にあまりに多く現れすぎるとメモリ効率が悪くなってしまう。
このようなことは、そもそも 256種類のものしか表現できないところで 257種類のもの (256+終端) を表現しようとするために起こる。 もし 257種類のものを表現する完全なエンコーディング方法があれば、 そのメモリ効率は最低限にできるはずだ (なんていうんだっけコレ? シャノン限界?)。 その場合のエントロピーは 1文字あたり 約8.0056ビット (= log2257) になるだろう。
だから何??? いや、なんとなくそう思っただけ。
import
で相対パスを指定できるところにしろ、
ほんとにそんな機能が (こんなアドホックなやりかたで) 必要なのか? と思わせる。
物事は永遠に良くなりつづけるわけではない、あることがある段階まで良くなると、
それ以降はつねに「なにをやっても改悪」の段階になるのかもしれない。
そういう例は沢山あるし、そうなっていなかったら世の中、
世代交代というもんが成りたたなくて面白くなくなるので、それはそれでいいと思う。
いまでは新山は自分が Python の次に好んで使うようになる言語は何なのか、ひそかに楽しみにしている
(それは Lisp にはならないよ、念のため)。
どうでもいいけど、やっぱり飲み物食いもんが出たらしい。 新山はタダ飯には弱いのだが、それ以外の目的があるときはかえって邪魔になる。 ワガマミー。
「これが新しいチャレンジだ」と世間一般から思われているようなものというのは、 すでにその時点でチャレンジではない。
ほらほらほらきた!!
今日も早く帰れず。にもかかわらず大して働いていない。 今日は実験を 2度やった。現在の実験は 1度走らせると 3時間くらいかかるので (それでもたった 3ヵ月分のデータしか使っていないんだよ…なんとかしなきゃね)、 まずプログラムを書き換えてから pychecker したあと 小規模のデータで一度走らせてみて、それで結果がだいたい ok だったら 3時間のやつをやってみる。デバッグ出力が多いので結果は 50MBytes 以上にふくれあがる。 こいつを解析するためにまた awk か perl で簡単なスクリプトを書いて、 統計をとって、あれこれどうでもいい推測をして、改造して、また実行。 あとはひたすら待つ…
今日はほかの人々は論文締め切りでアワアワしていた。 まず 2本の short papers があり、今週すでに論文を一本出した へれんはさらに来週締め切りのワークショップに論文を書いていた。 オレは「もうドーーでもいい人」であるので、ただ黙ってプリンタ設定してただけだけど (フロアに新しい高速なレーザープリンタが入ったのよ)。 Ralph はあまりに多くの論文を添削するため、最後のほうは廊下のソファに ふんぞりかえり、すわった目をして論文を読んでいた。 そうこうしているうちに、Anabela が論文 (今日締め切り) をオレのところにもってきて、 読んでくれという。オイオイ、いまからかよ? 間に合うのかよ?? と思ったが、カフェインを入れつつなんとか読んで、理解しようとしたあげく、 やっぱりよくわからんので質問に行く。彼女は言語学をやっているので、はっきりいって、 こういう情報系の学会に出す論文の作法をわかってない。 でも新山は機械学習をとっかえひっかえしつつ鼻息荒くしてるような人々の研究より、 彼女がやってるような言語学の地道な研究のほうが重要だと思う。だからなるべく協力したい。 でもむずかしいよな、これは。まず彼らに重要性をわかってもらえるかどうかが勝負だ。 彼女は「計算機屋の世界で生きてくのはタイヘンね…」とため息をついてたが、同情するよ。 新山は学会のピアレビューというものをあんまり信じてない。 まえにも書いたが、論文の査読というのは spam フィルタみたいなもんだと思う。 彼らは「ひどい論文」を落とすことはできるが、「いい論文」を選ぶことは できないのである。だから論文が一定の段階に達してしまえば、 あとは純粋に運の問題となる (ま、確率変動はするけれどね)。 にもかかわらず、これは「いい論文を書きたい」という 努力を止めるものではない。この手のことは昔からいくつも書かれてきたけれど、 世の中には「いい論文とは何か」を議論する論文というものがある。 NLP の分野ではまだそういうものがあるとは知らないが、 計算機科学でもシステム屋のほうではだいぶそういう伝統ができている:
ちなみに数学ではもっとある。 djb のページ にいくつもリンクがあるよ。
どうでもいいけど寒いです。
てくるで、最近、日本語の新聞記事を (趣味で) 集め出したので、
いま話題の単語を抽出してみようと簡単な実験をやったら、
実際の文脈をぜんぜん考慮せずに文字と文字の繊維確率だけでやったので、
「イランド」とか「東京都駅」とか、日本語にない単語がつぎつぎ生成されて大爆笑。
長音記号「ー」のあとには必ず「ープ」がきてしまうし、「なんとか市」は
「なんとか市場」にしないと気がすまないらしい。こりゃダメだわ。Python 50行。
あそんでないで研究しよっと。
笑点, 永田氏, イランド, 再販売店, 特殊指定, 懲罰委員会議, 西松氏,
卒業生用, 縫合, ヘラ, 香田氏, 民主義, 黄教授, 李晨浩, 医業生用, 民生用,
速水, 忠雄, 小久保障, 野茂, 若槻千夏, professional , 流出,
さんだけでするとに, インド, ネパープ, イバープ, ブック, 歯科医,
者三塁, ゲープ, 新町氏, 興産信金, 男鹿市場, 大統領, 販売店, nhk ,
前原氏, 点三塁, 合以上, 本会議, 合意, 宅配制度, 東京都駅, リープ,
ファンド, 杯以上, 毛主義, 昇任人事長, 臼田氏, 札幌市場, 数削減,
志津容疑者, 内務省, メープ, 量的緩和, 自殺率, 国際線
ビジネスの成功をにぎる「文書力」とは? (ジャストシステム)
――文章に説得力を付けるには、どのような訓練をしたらいいですか?坪田: 昔から、若い社員たちに文章を磨くにはラブレターを書けと言っているんですよ。 自分の思いを伝える勉強になるからと。ビジネスであっても、同じこと。 忙しい経営層、社長に、自分の文書に目をとめてもらうには、 相手のハートをつかめるかどうかが勝負です。
…・・・・・・・この一文を読んで「どーーーしようもねえな」と思った人は多い (ビデオリサーチ調べ)。 あなたがオヤジでない限りは思うだろう。
それから「語彙力をつけろ」とか言っているが、こいつはようするに田中康夫の演説のような 誰も使ってないような単語をつかった文章が好きなのか。新山は日常生活でも言語でも (プログラミング言語でも) 派手なものや大がかりなものは必要ない、と思っているので、質素な単語を使って複雑なことを 説明するのが好きだ。でも、これは正反対だね。
しかもこのページは 「P2」と書いてあるのに URL は p1.html
になっているという
一貫性のなさ。ジャストシステムは広告で自分たちの「文書力」が評価されていることを知ってるのか?
雨になった。カサもってきてねえ。ぢぐぢょお
What the heck is a spring break??
I do not know such a thing!
とゆうことです。さよおなら。
ヒマじゃありません (ビデオリサーチ調べ)。
NNM KMG BCC WS.
(訳注: nnm
kmg
bcc
ws)