Python3.4+pandas+pylabによる重回帰分析と結果の描画

Pythonが、統計処理等のライブラリが充実しているとのことで、

少し触ってみました。

①Python環境構築

Anacondaをインストール

https://www.continuum.io/downloads

スタートメニュー→すべてのプログラム→Anaconda→Spyderを起動

②必要なモジュールのインストール

Spyderのメニューバー→Tools→Open Command Promptを開き、

コマンドプロンプトから

conda install モジュール名

と入力する。

(pandas等の主要モジュールはあらかじめインストールされています。)

③

# -*- coding: utf-8 -*-

import pandas

import pylab

#ファイル名

filename = 'sample.csv'

#ファイルの読み込み

#header=-1はヘッダを付けない、skiprows=1で1行読み飛ばし

#sample = pandas.read_csv(filename, skiprows=1, names=['time','serial','temperature','humidity'])

sample = pandas.read_csv(filename, skiprows=1,header=-1)

print(sample)

#関係ない列の削除

del(sample[0])

#基本統計量を算出する

desc = sample.describe()

print(desc)

#相関行列を計算する

cor = sample.corr()

print(cor)

#重回帰分析する

y = sample[1]

x = sample2,3

model = pandas.ols(x=x, y=y, intercept=True)

print(model)

pylab.plot(model.y)

pylab.plot(model.y_fitted)

pylab.show()

#結果を書き出し

sample.to_csv(filename+'_model.csv',index=False)

正直なところ、MATLABとjavaに慣れてしまったこの体では、

全然直感的と感じられないPythonのライブラリの扱い方に

四苦八苦させられました。

仕組みがいまいちわかってない言語のさらにわからんライブラリは、

なかなか触るのが疲れます。

逆にプログラム初めて触る人で、ちゃんとデータ構造から勉強すれば、

自然にできるようになるのかも。

この辺参考にしました。

http://www.s12600.net/psy/python/22-3.html

http://openbook4.me/projects/183/sections/1367

http://hennohito.cocolog-nifty.com/blog/2014/03/pythonspyder-bf.html