統計 stats
¶
このセクションでは、さまざまな統計検定とツールをまとめています。モデルとは独立して使用できるものもあれば、モデルおよびモデル結果の拡張として使用することを意図しているものもあります。
APIに関する注意:このカテゴリの関数とオブジェクトは、さまざまなモジュールに分散しており、まだ移動される可能性があります。将来的には、統計検定は生の数値だけではなく、より有益なレポートを備えたクラスインスタンスを返すようになると予想されます。
残差診断と仕様テスト¶
|
ダービン・ワトソン統計量を計算します。 |
|
ジャック-ベラ検定による正規性の検定。 |
|
正規性のためのオムニバス検定 |
|
歪度のロバスト尺度であるメドカップルを計算します。 |
|
キムとホワイトの4つの歪度尺度を計算します。 |
|
キムとホワイトの4つの尖度尺度を計算します。 |
|
データが正規分布に従うと仮定して、キムとホワイトのロバストな尖度尺度の期待値を計算します。 |
|
残差の自己相関に対するブロイシュ・ゴッドフレイのラグランジュ乗数検定。 |
|
残差の自己相関に対するリュング・ボックス検定。 |
|
自己相関に対するラグランジュ乗数検定。 |
|
OLS残差に基づくパラメータ安定性のためのCusum検定。 |
|
モデル安定性、OLSのパラメータにおけるブレイクに対する検定、Hansen 1992 |
|
残差とCusum検定統計量を使用した再帰的OLSを計算します。 |
|
ネストされていないモデルのコックス検定を計算します。 |
|
ネストされていないモデルを比較するためのデビッドソン-マッキノン包含検定 |
|
ネストされていないモデルのJ検定を計算します。 |
|
自己回帰条件付き分散不均一性 (ARCH) のエンゲル検定。 |
|
分散不均一性に対するブルッシュ・パガン ラグランジュ乗数検定 |
|
ゴールドフェルド・クワント等分散性検定。 |
|
分散不均一性に対するホワイトのラグランジュ乗数検定。 |
|
ホワイトの 2 次モーメント仕様検定 |
|
線形性に対するハーベイ・コリアー検定 |
|
関数的な代替に対する線形性のラグランジュ乗数検定 |
|
線形性に対するレインボー検定 |
|
見過ごされた非線形性に対するラムゼイの RESET 検定 |
外れ値と影響度測定¶
|
OLS 結果の外れ値と影響度を計算するクラス |
|
影響度と外れ値の測定 (実験的) |
|
グローバルな影響度と外れ値の測定 (実験的) |
|
1つの外生変数に対する分散拡大係数 (VIF) |
回帰診断に関する注釈も参照してください
サンドイッチロバスト共分散¶
以下の関数は、誤差における分散不均一性と自己相関に対してロバストな、パラメータ推定値の共分散行列と標準誤差を計算します。 LinearModelResults で利用可能なメソッドと同様に、これらのメソッドは OLS での使用を想定しています。
|
分散不均一性と自己相関に対してロバストな共分散行列 (ニューイー・ウェスト) |
|
パネル HAC ロバスト共分散行列 |
|
ドリスコルとクレイのパネルロバスト共分散行列 |
|
クラスターロバスト共分散行列 |
2 つのグループ/クラスターに対するクラスターロバスト共分散行列 |
|
|
分散不均一性に対してロバストな共分散行列 (ホワイト) |
以下は、LinearModelResults に添付されている分散不均一性に対してロバストな標準誤差のスタンドアロン版です
|
statsmodels.RegressionResults を参照してください |
|
statsmodels.RegressionResults を参照してください |
|
statsmodels.RegressionResults を参照してください |
|
statsmodels.RegressionResults を参照してください |
共分散行列から標準偏差を取得する |
適合度検定と尺度¶
単変量分布の適合度に関するいくつかの検定
|
観測データと期待データ間の不一致の尺度として、適合度検定のクラスであるべき乗不一致を計算します。 |
|
離散分布のランダム サンプルのカイ二乗検定を実行します。 |
|
離散分布に対するカイ二乗型 gof 検定のビンを取得します。 |
|
カイ二乗適合度検定の効果サイズ |
|
アンダーソン-ダーリング a2 統計量を計算します。 |
|
未知の平均と分散に対する正規分布の Anderson-Darling 検定。 |
|
Lilliefors 検定を用いて、正規分布または指数分布を仮定した検定を行います。 |
|
Lilliefors 検定を用いて、正規分布または指数分布を仮定した検定を行います。 |
|
Lilliefors 検定を用いて、正規分布または指数分布を仮定した検定を行います。 |
|
Lilliefors 検定を用いて、正規分布または指数分布を仮定した検定を行います。 |
ノンパラメトリック検定¶
|
McNemar 検定 |
|
(k, k) 正方分割表の対称性検定 |
|
中央値/位置の等価性のためのカイ二乗検定 |
|
カットオフ値より上/下の二値離散データに対して連検定を使用します。 |
|
2 つのサンプルに対する Wald-Wolfowitz 連検定 |
|
k 個の処置の同一効果に対する Cochran の Q 検定 |
|
二値シーケンスの連のためのクラス |
|
符号検定 |
|
x1 が x2 よりも大きい値を持つ確率の統計量と検定。 |
|
2 つの独立した順序サンプルに対して、確率的に大きい確率。 |
|
ランク比較の結果 |
Cohen の d 効果量を確率的に大きい確率に変換します。 |
|
|
distr1 が distr2 よりも確率的に大きいことを示す確率。 |
|
2 つのサンプルの中間順位を計算します。 |
記述統計¶
|
データに関する拡張された記述統計 |
|
データに関する拡張された記述統計 |
評価者間の信頼性と一致度¶
statsmodels が現在利用できる評価者間の一致度測定と検定のための主な機能は、Cohen の Kappa です。 Fleiss の Kappa は現在、測定としてのみ実装されており、関連する結果統計はありません。
|
分散とゼロに等しい検定を用いた Cohen の kappa を計算します。 |
|
Fleiss の kappa および Randolph の kappa による複数評価者間の一致度測定 |
|
(subject, rater) の形状の生データを (rater1, rater2) に変換します。 |
|
(subject, rater) の形状の生データを (subject, cat_counts) に変換します。 |
多重検定と多重比較手順¶
multipletests は p 値の補正のための関数であり、fdrcorrection の FDR に基づいた p 値補正も含まれています。 tukeyhsd は、(独立した)平均の比較のための同時検定を実行します。これらの 3 つの関数は検証済みです。 GroupsStats と MultiComparison は、一元配置分散分析に類似した多重比較のための便利なクラスですが、まだ開発中です。
|
複数の検定の検定結果と p 値の補正 |
|
偽発見率に対する p 値補正。 |
|
グループ別の統計量 (別のバージョン) |
|
多重比較の検定 |
|
追加のプロットメソッドを備えた Tukey HSD 検定の結果 |
|
TukeyHSD信頼区間を用いたすべてのペアワイズ比較を計算します。 |
|
Zスコアのリストに対する局所FDR値を計算します。 |
|
真の仮説数を推定する(反復)2段階線形ステップアップ手順 |
|
帰無仮説のZスコアに対するガウス分布を推定します。 |
|
回帰手順でFDRを制御します。 |
FDR制御のための周辺相関効果サイズ。 |
|
ノックオフ分析のためのOLS回帰。 |
|
|
FDR制御のためのフォワード選択効果サイズ。 |
ノックオフ分析のためのOLS回帰。 |
|
|
回帰FDR分析に任意の回帰モデルを使用します。 |
以下の関数は、(まだ)公開されていません
|
すべてのペアに対するサンプルサイズが異なる場合の分散の補正係数 |
|
すべてのペアについて、分散とサンプルサイズが異なるサンプルから結合分散を返します。 |
|
サンプルサイズが異なる場合の分散の補正係数 |
|
分散とサンプルサイズが異なるサンプルから結合分散を返します。 |
|
ステップダウン法のためのクラス |
|
|
配列オブジェクトは、固定サイズのアイテムの多次元同種配列を表します。 |
|
|
平均値の単純な順序付き逐次比較 |
|
ペアワイズ距離行列(tukeyhsdから外部委託) |
|
fdrcorrectionで使用されるシンプルな経験累積分布関数 |
|
テューキーのHSD(Q)の臨界値を返します。 |
|
最小距離についてvalsのすべてのペアを再帰的にチェックします。 |
|
すべてのゼロクロスを検索し、最も高いインデックスを返します。 |
|
すべてのゼロクロスを検索し、最も高いインデックスを返します。 |
|
fdrcorrectionをテストするモンテカルロ法 |
str(object='') -> str str(bytes_or_buffer[, encoding[, errors]]) -> str |
|
|
等相関多変量正規分布からランダムなサンプルを作成します。 |
|
rankdata(scipy.stats.rankdataと同等) |
|
多重検定における棄却の基準線 |
|
タプルのリストからパーティションを抽出します。 |
|
タプルのリストから別のセットのサブセットであるセットを削除します。 |
|
scipy.stats.tiecorrectと同等である必要があります。 |
頻度重みを使用した基本的な統計とt検定¶
ケース重み付きデータの平均、分散、共分散、相関などの基本的な統計に加えて、ここにあるクラスは平均に対する1サンプルおよび2サンプル検定を提供します。t検定はscipy.statsよりも多くのオプションがありますが、配列の形状にはより制限があります。平均の信頼区間は、t検定と同じ仮定に基づいて提供されます。
さらに、1サンプルおよび2サンプル(ペアまたは独立)に対する平均の同等性の検定も利用できます。これらの検定はTOST(2つの片側検定)に基づいており、その帰無仮説は平均値が互いに「近い」のではないということです。
|
ケース重みのための重み付き記述統計と検定 |
|
2サンプル比較のためのクラス |
|
t検定 独立サンプル |
|
2つの独立サンプルに対する(非)同等性検定 |
|
2つの依存ペアサンプルに対する(非)同等性検定 |
|
正規分布に基づく平均の検定、1つまたは2つのサンプル |
|
正規分布に基づく同等性検定 |
|
正規分布z検定に基づく信頼区間 |
weightstatsには、要約データに基づく検定と信頼区間も含まれています
|
要約統計量に基づく汎用t信頼区間 |
|
要約統計量に基づく汎用t検定 |
|
要約統計量に基づく汎用正規信頼区間 |
|
要約統計量に基づく汎用(正規)z検定 |
|
要約統計量に基づく汎用(正規)z検定 |
検出力とサンプルサイズ計算¶
power
モジュールは現在、t検定、正規分布に基づく検定、F検定、およびカイ二乗適合度検定の検出力とサンプルサイズの計算を実装しています。この実装はクラスベースですが、モジュールには、検出力方程式のいずれかのパラメーターを解くための3つのショートカット関数tt_solve_power
、tt_ind_solve_power
、およびzt_ind_solve_power
も用意されています。
|
2つの独立サンプルのt検定の統計的検出力計算 |
|
1サンプルまたはペアサンプルのt検定の統計的検出力計算 |
|
1サンプルカイ二乗検定の統計的検出力計算 |
|
2つの独立サンプルのz検定の統計的検出力計算。 |
|
1因子バランス分散分析のF検定の統計的検出力計算 |
|
制約の汎用F検定の統計的検出力計算 |
|
正規分布した検定統計量の検出力を計算する |
|
片側のみが関連する場合の明示的なサンプルサイズ計算 |
|
1サンプルt検定の検出力のいずれかのパラメーターを解く |
|
2サンプルt検定の検出力のいずれかのパラメーターを解く |
|
2サンプルz検定の検出力のいずれかのパラメーターを解く |
割合¶
また、NormalIndPowerで使用できる割合の仮説検定、信頼区間、および効果サイズも利用できます。
|
二項割合の信頼区間 |
|
2つの割合を比較する検定の効果サイズ |
|
成功の確率がpであるという検定を実行する。 |
|
1サンプルの割合に対する二項検定の棄却域 |
|
二項分布を使用した1つの割合の正確なTOST検定 |
|
二項TOSTの棄却域 |
|
多項割合の信頼区間。 |
|
正規分布(z)検定に基づく比率の検定 |
|
正規分布に基づく同等性検定 |
|
カイ二乗検定に基づく比率の検定 |
|
k個のサンプルすべてのペアに対する比率のカイ二乗検定 |
|
コントロールと比較したk個のサンプルのペアに対する比率のカイ二乗検定 |
|
2つの割合を比較する検定の効果サイズ |
|
|
|
正規分布に基づく比率の同等性検定の検出力 |
|
必要な信頼区間長を得るためのサンプルサイズを求める |
2つの独立したサンプルに関する統計。ステータス:実験的、APIが変更される可能性があります。0.12で追加。
|
2つの独立した比率を比較するための仮説検定 |
|
2つの独立した比率を比較するための信頼区間。 |
|
2つの独立した比率が等しいというz検定の検出力 |
|
2つの片側検定test_proportions_2indepに基づく同等性検定 |
|
片側に基づく正規分布を仮定した必要なサンプルサイズ |
|
2つの独立した比率に対するスコア検定 |
|
スコア検定を反転してスコア信頼区間を計算する |
レート¶
レートの統計関数。現在、これには2つの独立したサンプルに対する仮説検定が含まれています。概要については、例のノートブックポアソンレートも参照してください。
ステータス:実験的、APIが変更される可能性があります。0.12で追加され、0.14でリファクタリングと機能強化がされました。
1つのサンプルに対する統計関数
|
1つのサンプルポアソン平均またはレートの検定 |
|
ポアソン平均またはレートの信頼区間 |
|
ポアソン確率変数の分位数の信頼区間 |
|
ポアソン観測の許容区間 |
2つの独立したサンプルに対する統計関数
|
2つのサンプルポアソン強度レートを比較するための検定。 |
|
2つのサンプルポアソンレートの比率に対するE検定。 |
|
2つの独立したポアソンレートの比率または差の信頼区間。 |
|
2つの片側検定test_proportions_2indepに基づく同等性検定 |
|
非同等性、ポアソンの最小効果の検定。 |
統計的な検出力のための関数
|
2つの独立したポアソンレートの比率の検定の検出力。 |
|
2つの独立したポアソンレートの比率の同等性検定の検出力。 |
|
2つの独立したポアソンレートの差に対するz検定の検出力。 |
|
2つの独立した負の二項レートの比率の検定の検出力。 |
|
2つの独立した負の二項レートの比率の同等性検定の検出力。 |
多変量¶
多変量サンプルの統計関数。
これには、多変量観測のサンプルの平均に対する仮説検定と信頼区間、および共分散行列の構造に対する仮説検定が含まれます。
ステータス:実験的、APIが変更される可能性があります。0.12で追加。
|
1標本における多変量平均に対するHotelling検定 |
|
多変量平均の線形変換の信頼区間 |
|
多変量平均の線形変換の信頼区間 |
|
2つの独立した標本における多変量平均に対するHotelling検定 |
|
共分散が帰無共分散に等しいという1標本仮説検定 |
|
共分散がブロック対角であるという1標本仮説検定 |
|
共分散行列が対角行列であるという1標本仮説検定 |
|
共分散行列が等しいという多標本仮説検定 |
|
共分散行列が球形であるという1標本仮説検定 |
一元配置分散分析¶
k個の標本の一元配置分散分析に対する仮説検定、信頼区間、効果量
ステータス:実験的、APIが変更される可能性があります。0.12で追加。
|
一元配置分散分析 |
|
要約統計量に基づく一元配置分散分析 |
|
一元配置分散分析の同等性検定(Wellekの分散分析) |
|
一元配置分散分析の同等性検定(Wellekとその拡張) |
|
一元配置同等性検定の検出力 |
|
一元配置同等性検定の経験的検出力 |
|
等しい尺度、分散、またはばらつきに対する一元配置分散分析検定 |
|
尺度、分散、またはばらつきの同等性に対する一元配置分散分析検定 |
|
F分布に対する一元配置分散分析における効果量の信頼区間 |
|
F検定における非心度パラメータの信頼区間 |
|
fファミリにおける二乗効果量の変換 |
|
一元配置分散分析におけるCohenのf = nc / nobsに対応する効果量 |
|
Cohenのf二乗をWellekの効果量(平方根)に変換 |
|
F統計量をWellekの効果量eps二乗に変換 |
|
Wellekの効果量(平方根)をCohenのf二乗に変換 |
|
F統計量から分散分析の効果量を計算 |
|
Levene型検定のための分散比較用のデータ変換 |
|
一元配置同等性検定(Wellekの分散分析)の検出力をシミュレート |
ロバスト、トリム統計量¶
固定された割合でトリミングされた標本に対する統計量。これには、1標本統計量に対するクラスTrimmedMeanが含まれます。これは、トリミングされた「Yuen」分散分析のためにstats.onewayで使用されます。
ステータス:実験的、APIが変更される可能性があります。0.12で追加。
|
トリムおよびウィンザー化された1標本統計量のためのクラス |
|
Levene型検定のための分散比較用のデータ変換 |
|
両端から観測値をトリミングした後の配列の平均を返します。 |
|
配列の両端から指定した割合の要素を切り落とします。 |
モーメントヘルパー¶
欠損値がある場合、相関行列または共分散行列が正定値にならない可能性があります。以下の関数は、正定値であり、元の行列に近い相関行列または共分散行列を見つけるために使用できます。追加の関数は、空間共分散行列と正則化された逆共分散または精度行列を推定します。
|
正定値に近い相関行列を見つけます |
|
正定値に最も近い相関行列を見つけます。 |
|
与えられた正方行列に因子構造を持つ最も近い相関行列を見つけます。 |
|
データ配列から、閾値処理された行ごとの相関行列を含む疎行列を構築します。 |
|
正(半)定値に最も近い共分散行列を見つけます |
|
任意の正方行列を k*I + XX' の形式の因子構造を持つ行列で近似します。 |
|
因子分解形式での正半定値行列の表現。 |
|
カーネル平均を使用して多変量共分散関数を推定します。 |
|
ノードワイズ回帰で正則化された逆共分散を推定するためのクラス |
これらは、中心モーメントと非中心モーメント、歪度、尖度、キュムラントを変換するためのユーティリティ関数です。
|
非中心モーメントをキュムラントに変換します。再帰式は、モーメントと同じ数のキュムラントを生成します。 |
|
中心モーメントを非中心モーメントに変換します。再帰式を使用し、オプションで最初のモーメントを調整して平均を返します。 |
|
中心モーメントを平均、分散、歪度、尖度に変換します。 |
|
非中心モーメントをキュムラントに変換します。再帰式は、モーメントと同じ数のキュムラントを生成します。 |
|
非中心モーメントを中心モーメントに変換します。再帰式を使用し、オプションで最初のモーメントを調整して平均を返します。 |
|
中心モーメントを平均、分散、歪度、尖度に変換します。 |
|
平均、分散、歪度、尖度を中心モーメントに変換します。 |
|
平均、分散、歪度、尖度を非中心モーメントに変換します。 |
|
共分散行列を相関行列に変換します。 |
|
標準偏差が与えられた相関行列を共分散行列に変換します。 |
|
共分散行列から標準偏差を取得する |
媒介分析¶
媒介分析は、3つの主要な変数間の関係に焦点を当てています。それは、「結果」、「処置」、「媒介変数」です。媒介分析は因果推論の一種であるため、検証が困難または不可能な仮定がいくつか含まれています。理想的には、媒介分析は、処置がランダムに割り当てられるような実験の文脈で実施されます。また、処置が「曝露」と見なされる可能性のある観察データを使用して媒介分析を実施することも一般的です。媒介分析の背後にある仮定は、観察設定ではさらに検証が困難です。
|
媒介分析を実行します。 |
|
媒介分析の結果を保持するためのクラス。 |
オアハカ・ブリンダー分解¶
オアハカ・ブリンダー分解、または一部の人が呼ぶブリンダー・オアハカ分解は、グループの平均値のギャップを説明しようとします。これは、2つの与えられた回帰方程式の線形モデルを使用して、回帰係数と既知のデータによって説明されるものと、同じデータを使用して説明されないものを明らかにします。オアハカ・ブリンダー分解には、2重分解と3重分解の2種類があり、どちらも経済文献でグループの差異を議論するために使用できます。この方法は、差別や観測されない影響を分類するのに役立ちます。この関数は、STATAのoaxacaコマンドの機能をPythonに移植しようとしています。
|
オアハカ・ブリンダー分解を実行するためのクラス。 |
|
このクラスは、OaxacaBlinder モデルの適合を要約します。 |
距離依存性指標¶
距離依存性指標と距離共分散 (dCov) 検定。
|
距離共分散 (dCov) 検定 |
|
様々な距離依存性統計量を計算します。 |
|
距離相関。 |
|
距離共分散。 |
距離分散。 |
メタ分析¶
サンプル統計のコレクションの基本的なメタ分析のための関数。
例は、ノートブックにあります。
ステータス:実験的、APIが変更される可能性があります。0.12で追加。
|
メタ分析を使用して、効果サイズの効果サイズを結合します。 |
|
2標本二項比率の効果サイズ |
|
メタ分析で使用するための平均差の効果サイズ |
|
平均または効果サイズの結合推定の結果 |
このモジュールには、ランダム効果分散を計算するための内部関数も含まれています。
|
ランダム効果分散の間のモーメント推定の反復法 |
|
ランダム効果分散の間のパウレ-マンデル反復推定 |
|
ランダム効果分散の間の1ステップモーメント推定 |