ノート/本/学校統計を読む

メモ  Scikit-learn Dataset loading utilities

メモ  scikit-learn に付属しているデータセット

メモ  R Sample Datasets in Pandas rp2は動いた。事前にpip install rpy2が必要

R言語 サンプルデータ一覧
統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ
Rのサンプルデータで遊ぶ

メモ  Python Sample Datasets for Datascience and Machine Learning Seaborn libraryやscikit-learnに取り込まれている。事前にpip install seabornが必要。

メモ  Pandas: Data manipulation, visualization, and analysis with for Python yahooから株価データを取る     Python で 株価データ取得する pandas.io モジュール が pandas_datareader に変わっていた件 〜 pip install 時のパッケージ名は、pandas-datareader だが、import時は、pandas_datareader で わかりにくいので注意

    上記のyahooのインタフェースが変わったらしい。Yahoo Historical Data - Did they change the URL recently? ざっと見るに、timestampのフォーマットが変わったのと、Cookeeが必要になった?  pandas_datareader fails to read S&P 500 data. What to do?
      temporary fixと称するものがあった Issues with the data reader fetching yahoo finance

$ git clone https://github.com/rgkimball/pandas-datareader
$ cd pandas-datareader
$ git checkout fix-yahoo
$ pip install -e .

Yahoo! Finance Fix for Pandas Datareader の方が新しいかも。これに従って試した結果

pip install fix_yahoo_finance --upgrade --no-cache-dir

をしておいて

>>> import pandas as pd
>>> from pandas_datareader import data as pdr
>>> import fix_yahoo_finance  # <== that's all it takes :-)
>>> pd.set_option('line_width', 100)
>>> data = pdr.get_data_yahoo("SPY", start="2017-05-01", end="2017-05-31")
>>> data
                  Open        High         Low       Close   Adj Close     Volume
Date                                                                            
2017-05-01  238.679993  239.169998  238.199997  238.679993  238.679993   66882500
2017-05-02  238.839996  238.979996  238.300003  238.770004  238.770004   57375700
2017-05-03  238.770004  238.880005  237.699997  238.479996  238.479996   73137700
2017-05-04  238.830002  238.919998  237.779999  238.759995  238.759995   61462700
2017-05-05  239.190002  239.720001  238.679993  239.699997  239.699997   62001300
2017-05-08  239.750000  239.919998  239.169998  239.660004  239.660004   48385700
2017-05-09  239.960007  240.190002  239.039993  239.440002  239.440002   51363200
2017-05-10  239.389999  239.869995  239.149994  239.869995  239.869995   54293800
2017-05-11  239.350006  239.570007  238.130005  239.380005  239.380005   62358300
2017-05-12  239.089996  239.429993  238.669998  238.979996  238.979996   53912700
2017-05-15  239.470001  240.440002  239.449997  240.300003  240.300003   61918900
2017-05-16  240.639999  240.669998  239.630005  240.080002  240.080002   51241800
2017-05-17  240.080002  240.080002  235.750000  235.820007  235.820007  172174100
2017-05-18  235.729996  237.750000  235.429993  236.770004  236.770004  107047700
2017-05-19  237.330002  239.080002  237.270004  238.309998  238.309998  115011400
2017-05-22  238.899994  239.710007  238.820007  239.520004  239.520004   61010600
2017-05-23  239.949997  240.240005  239.509995  240.050003  240.050003   48341700
2017-05-24  240.320007  240.729996  239.929993  240.610001  240.610001   46927700
2017-05-25  241.199997  242.080002  240.960007  241.759995  241.759995   64071700
2017-05-26  241.539993  241.899994  241.449997  241.710007  241.710007   46629900
2017-05-30  241.339996  241.789993  241.160004  241.500000  241.500000   35201900
>>>
>>>
>>> data = pdr.get_data_yahoo('^N225', start="2017-05-01", end="2017-05-31")
[*********************100%***********************]  1 of 1 downloaded
>>> data
                    Open          High           Low         Close     Adj Close  Volume
Date                                                                            
2017-05-01  19154.029297  19311.210938  19144.619141  19310.519531  19310.519531  106500
2017-05-02  19335.720703  19464.300781  19335.019531  19445.699219  19445.699219  112700
2017-05-08  19709.009766  19929.480469  19705.130859  19895.699219  19895.699219  148700
2017-05-09  19915.640625  19917.449219  19838.710938  19843.000000  19843.000000  123500
2017-05-10  19890.560547  19938.529297  19866.300781  19900.089844  19900.089844  129000
2017-05-11  19943.949219  19989.939453  19906.349609  19961.550781  19961.550781  136400
2017-05-12  19941.640625  19941.640625  19809.910156  19883.900391  19883.900391  136800
2017-05-15  19753.460938  19869.849609  19740.630859  19869.849609  19869.849609  128300
2017-05-16  19953.060547  19998.490234  19862.410156  19919.820313  19919.820313  131100
2017-05-17  19806.779297  19842.779297  19764.630859  19814.880859  19814.880859  118100
2017-05-18  19556.990234  19601.529297  19449.730469  19553.859375  19553.859375  135700
2017-05-19  19591.410156  19628.640625  19497.289063  19590.759766  19590.759766  115600
2017-05-22  19670.480469  19722.929688  19618.730469  19678.279297  19678.279297   78500
2017-05-23  19647.740234  19693.019531  19585.539063  19613.279297  19613.279297   83400
2017-05-24  19777.560547  19782.810547  19690.099609  19742.980469  19742.980469  101300
2017-05-25  19737.210938  19850.929688  19720.119141  19813.130859  19813.130859   95100
2017-05-26  19798.490234  19801.589844  19686.490234  19686.839844  19686.839844   84500
2017-05-29  19697.179688  19736.619141  19627.189453  19682.570313  19682.570313   67300
2017-05-30  19681.109375  19691.439453  19570.130859  19677.849609  19677.849609   72600
2017-05-31  19630.330078  19673.509766  19589.250000  19650.570313  19650.570313  125100

手でダウンロードするなら、 https://finance.yahoo.com/quote/%5EN225/history?period1=1451574000&period2=1483110000&interval=1d&filter=history&frequency=1d から、「Download Data」をクリックして、csvデータを取る。

メモ Pythonで株価データの取得と関数フィッティング フィッティング

メモ pandas-datareaderで株価や人口のデータを取得 他のデータ

メモ 株価をgetするjsmモジュール Python で日本企業の株価データを取得 と  【Python/jsm】日本企業の株価データを銘柄ごとに取得 と  pydoc:jsm

テキストデータ

nltkのデータがある  NLTK data


トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2017-06-20 (火) 09:55:56 (6d)