データ<math>\{ x_n \}_{n=1}^N</math> データの従う分布 <math>p(x|\theta)</math> があるとき ←最尤推定とはそもそも母数の推定だから,この時点でモデルがパラメトリックであることは本質的。 尤度関数 <math>L(\theta) := \prod_{n=1}^N p(x_n|\theta)</math> 対数尤度関数 <math>l(\theta) := \ln L(\theta) = \sum_{n=1}^N \ln p(x_n|\theta)</math>