サンドボックス

このサンドボックスには、様々な理由からstatsmodels本体に含める準備ができていないコードが含まれています。古いstats.modelsコードからのモジュール(Cox比例ハザードモデル、反復測定を含む混合効果モデル、一般化加法モデル、そして数式フレームワークなど)が含まれており、これらはテスト、検証、そして新しいstatsmodels構造への更新がまだ行われていません。サンドボックスには、statsmodelsのパターンに適合するか、十分にテストされるまで現在開発中のコードも含まれています。

すべてのサンドボックスモジュールは、まだstatsmodelsのコアの一部ではないことを示すために、明示的にインポートする必要があります。サンドボックスコードの品質とテストの程度は大きく異なります。

sandbox.examplesフォルダにいくつかの例があります。追加の例は、モジュールとサンドボックスのサブフォルダに直接含まれています。

モジュールリファレンス

時系列分析 tsa

このパートでは、時系列分析に役立つモデルと関数を開発します。ほとんどのモデルと関数は、statsmodels.tsaに移動されました。

移動窓統計

移動平均、モーメント(4次まで)、最小値、最大値、平均、分散などのほとんどの移動窓統計は、Pandasの移動(ローリング)統計/モーメントの関数でカバーされています。

movstat.movorder(x[, order, windsize, lag])

移動順序統計量

movstat.movmean(x[, windowsize, lag])

移動窓平均

movstat.movvar(x[, windowsize, lag])

移動窓分散

movstat.movmoment(x, k[, windowsize, lag])

非中心モーメント

回帰とANOVA

以下の2つのANOVA関数は、バランスのとれた一元配置ANOVAのNISTテストデータに対して完全にテストされています。anova_onewayは、scipy.statsの一元配置ANOVA関数と同じパターンに従いますが、スケールが大きく異なる問題に対してより高い精度を持っています。anova_olsは、OLSモデルクラスを使用して一元配置ANOVAと同じ結果を生成します。また、最悪のスケールの場合にいくつかの問題がありますが、NISTテストに対しても検証されています。これは、statsmodelsを使用して3行で単純なANOVAを行う方法を示しており、レシピとしても最適です。

anova_oneway(y, x[, seq])

anova_ols(y, x)

以下は、ダミー変数の操作とOLSによるANOVA結果の生成に役立つ関数です。特定の用途を考慮して記述されたため、レシピとして考えるのが最適です。これらの関数は、最終的に書き直されるか、再構成されます。

try_ols_anova.data2dummy(x[, returnall])

カテゴリの配列をダミー変数に変換します。デフォルトでは最後のカテゴリのダミー変数を削除します。ravelを使用し、1次元のみです。

try_ols_anova.data2groupcont(x1, x2)

ダミー連続変数を作成します

try_ols_anova.data2proddummy(x)

2列の2次元配列から積ダミー変数を作成します

try_ols_anova.dropname(ss, li)

文字列のリストから名前を削除します。削除する名前はスペース区切りのリストにあります。元のリストは変更されません。

try_ols_anova.form2design(ss, data)

文字列の式をデータ辞書に変換します

以下は、ラベル配列によってグループが定義されているグループ統計に役立つ関数です。前のグループの条件は、この関数のグループにも適用されます。

try_catdata.cat2dummy(y[, nonseq])

try_catdata.convertlabels(ys[, indices])

複数の変数または文字列ラベルに基づいてラベルを変換し、一意のインデックスラベル0、1、2、…、nk-1(nkは異なるラベルの数)にします。

try_catdata.groupsstats_1d(y, x, labelsunique)

ndimageを使用して、平均と分散を高速に取得します。

try_catdata.groupsstats_dummy(y, x[, nonseq])

try_catdata.groupstatsbin(factors, values)

np.bincountを使用します。因子/ラベルは整数であると仮定します。

try_catdata.labelmeanfilter(y, x)

try_catdata.labelmeanfilter_nd(y, x)

try_catdata.labelmeanfilter_str(ys, x)

これらの関数に加えて、sandbox回帰には、statsmodelsの回帰モデルの使用を示すいくつかの例が含まれています。

回帰方程式系と連立方程式

以下は、方程式系のモデルを適合させるためのものです。返されたパラメータは正確であることが確認されていますが、このコードはまだ実験段階であり、モデルの使用方法は、メインのコードベースに追加される前に大きく変更される可能性が高いです。

SUR(sys[, sigma, dfk])

一見無関係な回帰

Sem2SLS(sys[, indep_endog, instruments])

連立方程式のための二段階最小二乗法

その他

記述統計の出力

descstats.sign_test(samp[, mu0])

符号検定

descstats.descstats(data[, cols, axis])

1つまたは複数の変数の記述統計を出力します。

元のstats.models

これらの関数はどれも完全に動作しているわけではありません。数式フレームワークはcoxとmixedで使用されています。

EMアルゴリズムを使用した反復測定を伴う混合効果モデル

statsmodels.sandbox.mixed

Cox比例ハザードモデル

statsmodels.sandbox.cox

一般化加法モデル

statsmodels.sandbox.gam

数式

statsmodels.sandbox.formula


最終更新日: 2024年10月3日