数値データの欠損値を合成する
この例では,データから学習した分布が欠損値の合成にどのように使われるかを示す.
二次元の数値データ集合をロードし可視化する.
データの根底にある分布を学習する.
訓練データとともに分布の確率密度をプロットする.
SynthesizeMissingValuesを使って,学習された分布に基づいて欠損値を補完する.
デフォルトでは,この補完は条件付けられた分布からのサンプリングによって行われる.他の可能な補完値を得る.
サンプルの位置を可視化する.
補完された値の分布を可視化する.
条件付けられた分布の最頻値を使って欠損値を補完する.
最頻値の位置を可視化する.