読者です 読者をやめる 読者になる 読者になる

統計・ITメモ

勉強の備忘録とか読書録とか

どうしようもなく眠い日々

岩波データサイエンス刊行委員会『岩波データサイエンス vol.3』 岩波書店

岩波データサイエンス vol.3

以前、本書の代表著者である星野崇宏先生の『調査観察データの統計科学』

www.amazon.co.jp

を読んだのだけど、だいぶ期間が空いてしまったのと消化不良で終わっていたのとで、再入門として読んでみた。

統計的因果推論はデータ分析において、分析対象のデータ特性(e.g. 離散/連続、正規性、…)を評価して適切なモデルを選択する、という技術的な部分よりもひとつ上の次元にある議論のように思う。

結局のところ、いくらデータ特性がよく考慮されていて、説明力の高いモデルであっても、例えば回帰モデルならばその回帰係数が意味するところを語れなければ、課題を抱えている張本人には歯がゆさだけが残るはずだ。

前書きにある「領域固有の知識なく汎用的な方法論だけで勝負するデータサイエンティストがデータロボットに置き換わる時代は目前に(すでに)来ています。」という言葉は重く受け止める必要がある。 確かに、「データの形や包含関係を検出し、離散化を含む最適な前処理を施し、バイアスの少ないモデルを自動で選択して解析結果を吐き出す」あたりは程なくできるようになってしまうかもしれない。

少し話はずれるが、こんな取り組みもあるようだし(ちょっと古いけど)、今のままでいつまでも仕事があると思わないほうがよさそうだ。

www.sas.com