はじめに

ベイズ推論におけるモデル選択はどのように行えばいいのか実験しました。一例にすぎませんが...

モデル

２次元の混合ガウス分布を変分推論によって学習します。観測データx_nがクラスターkの２次元ガウス分布から生成されているとします。 x_nがどのクラスターに属するかを表す潜在変数s_nを用いると生成モデルは次のように表すことができます。

f:id:kdog08:20190726180326p:plain

ガウス分布の平均および精度パラメータに対しては、ガウス・ウィシャート分布を事前分布として与えます。

f:id:kdog08:20190726181108p:plain

潜在変数は、カテゴリ分布で表します。

f:id:kdog08:20190726181124p:plain

カテゴリ分布のパラメータに対しては、ディリクレ分布を事前分布として与えます。

f:id:kdog08:20190726181139p:plain

ELBO

変分推論による学習は、周辺尤度の下限を最大化することと同じです。具体的には、周辺尤度の対数に対してイェンセンの不等式を用いることで得られる下限、ELBO; evidence lower boundを最大化します。したがって、モデルが観測データをどれくらい説明できているかはこのELBOが一つの評価基準になると言えるでしょう。

f:id:kdog08:20190726171326p:plain