サンドボックス¶

このサンドボックスには、様々な理由からstatsmodels本体に含める準備ができていないコードが含まれています。古いstats.modelsコードからのモジュール（Cox比例ハザードモデル、反復測定を含む混合効果モデル、一般化加法モデル、そして数式フレームワークなど）が含まれており、これらはテスト、検証、そして新しいstatsmodels構造への更新がまだ行われていません。サンドボックスには、statsmodelsのパターンに適合するか、十分にテストされるまで現在開発中のコードも含まれています。

すべてのサンドボックスモジュールは、まだstatsmodelsのコアの一部ではないことを示すために、明示的にインポートする必要があります。サンドボックスコードの品質とテストの程度は大きく異なります。

例¶

sandbox.examplesフォルダにいくつかの例があります。追加の例は、モジュールとサンドボックスのサブフォルダに直接含まれています。

モジュールリファレンス¶

時系列分析 `tsa`¶

このパートでは、時系列分析に役立つモデルと関数を開発します。ほとんどのモデルと関数は、statsmodels.tsaに移動されました。

移動窓統計¶

移動平均、モーメント（4次まで）、最小値、最大値、平均、分散などのほとんどの移動窓統計は、Pandasの移動（ローリング）統計/モーメントの関数でカバーされています。

`movstat.movorder`(x[, order, windsize, lag])	移動順序統計量
`movstat.movmean`(x[, windowsize, lag])	移動窓平均
`movstat.movvar`(x[, windowsize, lag])	移動窓分散
`movstat.movmoment`(x, k[, windowsize, lag])	非中心モーメント

回帰とANOVA¶

以下の2つのANOVA関数は、バランスのとれた一元配置ANOVAのNISTテストデータに対して完全にテストされています。anova_onewayは、scipy.statsの一元配置ANOVA関数と同じパターンに従いますが、スケールが大きく異なる問題に対してより高い精度を持っています。anova_olsは、OLSモデルクラスを使用して一元配置ANOVAと同じ結果を生成します。また、最悪のスケールの場合にいくつかの問題がありますが、NISTテストに対しても検証されています。これは、statsmodelsを使用して3行で単純なANOVAを行う方法を示しており、レシピとしても最適です。

`anova_oneway`(y, x[, seq])
`anova_ols`(y, x)

以下は、ダミー変数の操作とOLSによるANOVA結果の生成に役立つ関数です。特定の用途を考慮して記述されたため、レシピとして考えるのが最適です。これらの関数は、最終的に書き直されるか、再構成されます。

`try_ols_anova.data2dummy`(x[, returnall])	カテゴリの配列をダミー変数に変換します。デフォルトでは最後のカテゴリのダミー変数を削除します。ravelを使用し、1次元のみです。
`try_ols_anova.data2groupcont`(x1, x2)	ダミー連続変数を作成します
`try_ols_anova.data2proddummy`(x)	2列の2次元配列から積ダミー変数を作成します
`try_ols_anova.dropname`(ss, li)	文字列のリストから名前を削除します。削除する名前はスペース区切りのリストにあります。元のリストは変更されません。
`try_ols_anova.form2design`(ss, data)	文字列の式をデータ辞書に変換します

以下は、ラベル配列によってグループが定義されているグループ統計に役立つ関数です。前のグループの条件は、この関数のグループにも適用されます。

`try_catdata.cat2dummy`(y[, nonseq])
`try_catdata.convertlabels`(ys[, indices])	複数の変数または文字列ラベルに基づいてラベルを変換し、一意のインデックスラベル0、1、2、…、nk-1（nkは異なるラベルの数）にします。
`try_catdata.groupsstats_1d`(y, x, labelsunique)	ndimageを使用して、平均と分散を高速に取得します。
`try_catdata.groupsstats_dummy`(y, x[, nonseq])
`try_catdata.groupstatsbin`(factors, values)	np.bincountを使用します。因子/ラベルは整数であると仮定します。
`try_catdata.labelmeanfilter`(y, x)
`try_catdata.labelmeanfilter_nd`(y, x)
`try_catdata.labelmeanfilter_str`(ys, x)

これらの関数に加えて、sandbox回帰には、statsmodelsの回帰モデルの使用を示すいくつかの例が含まれています。

回帰方程式系と連立方程式¶

以下は、方程式系のモデルを適合させるためのものです。返されたパラメータは正確であることが確認されていますが、このコードはまだ実験段階であり、モデルの使用方法は、メインのコードベースに追加される前に大きく変更される可能性が高いです。

`SUR`(sys[, sigma, dfk])	一見無関係な回帰
`Sem2SLS`(sys[, indep_endog, instruments])	連立方程式のための二段階最小二乗法

その他¶

記述統計の出力¶

`descstats.sign_test`(samp[, mu0])	符号検定
`descstats.descstats`(data[, cols, axis])	1つまたは複数の変数の記述統計を出力します。

元のstats.models¶

これらの関数はどれも完全に動作しているわけではありません。数式フレームワークはcoxとmixedで使用されています。

EMアルゴリズムを使用した反復測定を伴う混合効果モデル

statsmodels.sandbox.mixed

Cox比例ハザードモデル

statsmodels.sandbox.cox

一般化加法モデル

statsmodels.sandbox.gam

数式

statsmodels.sandbox.formula

最終更新日: 2024年10月3日