statsmodels.datasets.get_rdataset

statsmodels.datasets.get_rdataset(dataname, package='datasets', cache=False)[ソース]

Rデータセットのダウンロードと返却

パラメータ:
datanamestr

ダウンロードするデータセットの名前

packagestr

データセットが存在するパッケージ。デフォルトはコアの 'datasets' パッケージです。

cachebool または str

Trueの場合、このデータをSTATSMODELS_DATAフォルダにダウンロードします。デフォルトの場所は、ユーザーホームフォルダ内のstatsmodels_dataというフォルダです。それ以外の場合は、データのキャッシュに使用するフォルダへのパスを指定できます。Falseの場合、データはキャッシュされません。

戻り値:
datasetDataset

statsmodels.data.utils.Datasetインスタンス。このオブジェクトには以下の属性があります。

  • data - データを含むpandas DataFrame

  • title - データセットのタイトル

  • package - データの取得元のパッケージ

  • from_cache - キャッシュされたデータが取得されたかどうか

  • __doc__ - Rのドキュメントをそのまま表示。

備考

Rのデータセットに整数インデックスがある場合、0ベースのインデックスにリセットされます。それ以外の場合は、インデックスは保持されます。キャッシュ機能は単純です。つまり、データの再ダウンロードの必要性などを確認するためのダウンロード日、eタグ、その他の識別情報はチェックされません。データセットがキャッシュにある場合、それは使用されます。


最終更新日: 2024年10月3日