読者です 読者をやめる 読者になる 読者になる

Random Walker Log's Log

二度と見ない系ログファイル

2017-05-06 機械学習わからない

今日も10時間くらい寝た。放っておくとそれくらいになってしまう。

毎週土曜日の午前中に部屋中の掃除をすることに決めているが、今日は起きる時間が遅かったのもあって正午までずれこんでしまった。朝食も十分に摂れていなかったのでつらかった。
総じて家事というものは、生きる価値のない人間の生きる世話を延々やることに等しく、苦痛でしかない。

午後、ダラダラとインターネットをする以外だと、機械学習の勉強を少しやった。中川裕志『機械学習』の第1章を読んだ。

東京大学工学教程 情報工学 機械学習

東京大学工学教程 情報工学 機械学習

良書だと聞いたが果たして……

第2章なので、まだ導入と数学のnotationの説明だけ。tf-idfの解釈の部分がわからなかった。df(i)/NはランダムにN個の単語の列を発生させたときに単語iが少なくとも1つ含まれる割合であって、単語iがある列に出現する確率ではないはず。しかもそれを単語iの出現回数乗するというのは率直に言って意味不明だと思う。
単純に、少ないテキストにしか現れず、かつその単語が現れるテキストだけに注目すれば出現頻度が高いときに大きくなるので、tf-idfが大きければその単語がテキストの分類を特徴づけると言いやすい、というだけではいけないんだろうか。
こういうところも、きちんと考えて全部納得しながら進むべきかどうか迷う。機械学習に関してどれくらいの距離感で勉強すればいいのかも迷っている。自分の専門分野にするつもりで思い切り首を突っ込むのか、単なるツールだと割り切って仕事で使えなくもない範囲までやるか。正直言って仕事で使うからやるという時点でつまらないので、専門分野だと思って突き詰めて勉強することで興味を持てるようになれないかという戦略を予定していたが、そう簡単にうまくいくものではない。使うことそれ自体には相変わらず興味を持てないでいる。結局、自分は技術というものに興味が無いのではないか? それで仕事に正常な精神で付いていけるだろうか。
すでに正常な精神でないと言われたらそれはそうという気もする。明日は第2章を読む。

数学の本でも読むかと思って昔図書館のリユース棚から拝借した"Topology from the Differentiable Viewpoint"を取り出したらボロボロで自壊寸前だった。これ優先して読もう。薄いし。
明日読む。

明後日以降のことを考えると気分があまりよくない。せめて明日は、なるべく本だけに向き合って何もかも忘れていたい。