サンドボックス¶
このサンドボックスには、様々な理由からstatsmodels本体に含める準備ができていないコードが含まれています。古いstats.modelsコードからのモジュール(Cox比例ハザードモデル、反復測定を含む混合効果モデル、一般化加法モデル、そして数式フレームワークなど)が含まれており、これらはテスト、検証、そして新しいstatsmodels構造への更新がまだ行われていません。サンドボックスには、statsmodelsのパターンに適合するか、十分にテストされるまで現在開発中のコードも含まれています。
すべてのサンドボックスモジュールは、まだstatsmodelsのコアの一部ではないことを示すために、明示的にインポートする必要があります。サンドボックスコードの品質とテストの程度は大きく異なります。
例¶
sandbox.examplesフォルダにいくつかの例があります。追加の例は、モジュールとサンドボックスのサブフォルダに直接含まれています。
モジュールリファレンス¶
時系列分析 tsa
¶
このパートでは、時系列分析に役立つモデルと関数を開発します。ほとんどのモデルと関数は、statsmodels.tsa
に移動されました。
移動窓統計¶
移動平均、モーメント(4次まで)、最小値、最大値、平均、分散などのほとんどの移動窓統計は、Pandasの移動(ローリング)統計/モーメントの関数でカバーされています。
|
移動順序統計量 |
|
移動窓平均 |
|
移動窓分散 |
|
非中心モーメント |
回帰とANOVA¶
以下の2つのANOVA関数は、バランスのとれた一元配置ANOVAのNISTテストデータに対して完全にテストされています。anova_oneway
は、scipy.statsの一元配置ANOVA関数と同じパターンに従いますが、スケールが大きく異なる問題に対してより高い精度を持っています。anova_ols
は、OLSモデルクラスを使用して一元配置ANOVAと同じ結果を生成します。また、最悪のスケールの場合にいくつかの問題がありますが、NISTテストに対しても検証されています。これは、statsmodelsを使用して3行で単純なANOVAを行う方法を示しており、レシピとしても最適です。
|
|
|
以下は、ダミー変数の操作とOLSによるANOVA結果の生成に役立つ関数です。特定の用途を考慮して記述されたため、レシピとして考えるのが最適です。これらの関数は、最終的に書き直されるか、再構成されます。
|
カテゴリの配列をダミー変数に変換します。デフォルトでは最後のカテゴリのダミー変数を削除します。ravelを使用し、1次元のみです。 |
|
ダミー連続変数を作成します |
2列の2次元配列から積ダミー変数を作成します |
|
|
文字列のリストから名前を削除します。削除する名前はスペース区切りのリストにあります。元のリストは変更されません。 |
|
文字列の式をデータ辞書に変換します |
以下は、ラベル配列によってグループが定義されているグループ統計に役立つ関数です。前のグループの条件は、この関数のグループにも適用されます。
|
|
|
複数の変数または文字列ラベルに基づいてラベルを変換し、一意のインデックスラベル0、1、2、…、nk-1(nkは異なるラベルの数)にします。 |
|
ndimageを使用して、平均と分散を高速に取得します。 |
|
|
|
np.bincountを使用します。因子/ラベルは整数であると仮定します。 |
これらの関数に加えて、sandbox回帰には、statsmodelsの回帰モデルの使用を示すいくつかの例が含まれています。
回帰方程式系と連立方程式¶
以下は、方程式系のモデルを適合させるためのものです。返されたパラメータは正確であることが確認されていますが、このコードはまだ実験段階であり、モデルの使用方法は、メインのコードベースに追加される前に大きく変更される可能性が高いです。
|
一見無関係な回帰 |
|
連立方程式のための二段階最小二乗法 |
その他¶
記述統計の出力¶
|
符号検定 |
|
1つまたは複数の変数の記述統計を出力します。 |
元のstats.models¶
これらの関数はどれも完全に動作しているわけではありません。数式フレームワークはcoxとmixedで使用されています。
EMアルゴリズムを使用した反復測定を伴う混合効果モデル
statsmodels.sandbox.mixed
Cox比例ハザードモデル
statsmodels.sandbox.cox
一般化加法モデル
statsmodels.sandbox.gam
数式
statsmodels.sandbox.formula