Next: Functions and Variables for continuous distributions, Previous: distrib, Up: distrib [Contents][Index]
パッケージ distribには
離散と連続両方の単変量モデル上の確率計算を行う関数一式が入っています。
以下は基本的な確率関連の定義の短い復習です。
f(x)を 絶対連続確率変数 Xの density function, 密度函数とします。 distribution function, 分布函数は以下のように定義されます。
                       x
                      /
                      [
               F(x) = I     f(u) du
                      ]
                      /
                       minf
これは確率 Pr(X <= x)に等しいです。
mean, 平均値は局所化パラメータで、以下のように定義されます。
                     inf
                    /
                    [
           E[X]  =  I   x f(x) dx
                    ]
                    /
                     minf
variance, 分散は変動の測度です。
                 inf
                /
                [                    2
         V[X] = I     f(x) (x - E[X])  dx
                ]
                /
                 minf
これは正の実数です。 分散の平方根は standard deviation, 標準偏差, D[X]=sqrt(V[X])で、 変動の別の測度です。
skewness coefficient, 歪度係数は非対称性の測度です。
                 inf
                /
            1   [                    3
  SK[X] = ----- I     f(x) (x - E[X])  dx
              3 ]
          D[X]  /
                 minf
kurtosis coefficient, 尖度係数は分布のとんがり具合を評価します。
                 inf
                /
            1   [                    4
  KU[X] = ----- I     f(x) (x - E[X])  dx - 3
              4 ]
          D[X]  /
                 minf
もし Xがガウシアンなら、 KU[X]=0です。 実際、歪度と尖度は分布の非ガウシアン性を評価するのに使われる形状パラメータです。
もし確率変数 Xが離散的なら、密度すなわち probability, 確率函数 f(x)は 数 x_iのある可算集合内で正値を取り、それ以外で0を取ります。 この場合、分布函数は以下の通りです。
                       ====
                       \
                F(x) =  >    f(x )
                       /        i
                       ====
                      x <= x
                       i
平均、分散、標準偏差、歪度係数、尖度係数はそれぞれ以下の形を取ります。
                       ====
                       \
                E[X] =  >  x  f(x ) ,
                       /    i    i
                       ====
                        x 
                         i
                ====
                \                     2
        V[X] =   >    f(x ) (x - E[X])  ,
                /        i    i
                ====
                 x
                  i
D[X] = sqrt(V[X]),
                     ====
              1      \                     3
  SK[X] =  -------    >    f(x ) (x - E[X])  
           D[X]^3    /        i    i
                     ====
                      x
                       i
and
                     ====
              1      \                     4
  KU[X] =  -------    >    f(x ) (x - E[X])   - 3 ,
           D[X]^4    /        i    i
                     ====
                      x
                       i
以下はパッケージ distribでの命名規則です。
すべての関数名は2つの部分を持ちます。
一番目の部分は計算したい函数やパラメータへの参照となります。
Functions: Density function (pdf_*) Distribution function (cdf_*) Quantile (quantile_*) Mean (mean_*) Variance (var_*) Standard deviation (std_*) Skewness coefficient (skewness_*) Kurtosis coefficient (kurtosis_*) Random variate (random_*)
二番目の部分は確率モデルの明示的な参照になります。
Continuous distributions: Normal (*normal) Student (*student_t) Chi^2 (*chi2) Noncentral Chi^2 (*noncentral_chi2) F (*f) Exponential (*exp) Lognormal (*lognormal) Gamma (*gamma) Beta (*beta) Continuous uniform (*continuous_uniform) Logistic (*logistic) Pareto (*pareto) Weibull (*weibull) Rayleigh (*rayleigh) Laplace (*laplace) Cauchy (*cauchy) Gumbel (*gumbel) Discrete distributions: Binomial (*binomial) Poisson (*poisson) Bernoulli (*bernoulli) Geometric (*geometric) Discrete uniform (*discrete_uniform) hypergeometric (*hypergeometric) Negative binomial (*negative_binomial) Finite discrete (*general_finite_discrete)
例えば、 pdf_student_t(x,n)はn個の自由度を持つStudent分布の密度函数で、
std_pareto(a,b)は
パラメータ aと bを持つPareto分布の標準偏差であり、
kurtosis_poisson(m)は平均値 mを持つPoisson分布の尖度係数です。
パッケージ distribを利用するには、初めに
(%i1) load("distrib")$
とタイプしてそれをロードする必要があります。
ご意見、バグ、提案は著者 ’mario AT edu DOT xunta DOT es’に連絡ください。
Next: Functions and Variables for continuous distributions, Previous: distrib, Up: distrib [Contents][Index]