Next: 2 最適化手法の分類 Up: 計算天文学 II 第8回最適化(1) Previous: 計算天文学 II 第8回最適化(1)

1 最適化

今日と来週で最適化の話をする。

これは天文学の観測・理論のあらゆる場面で必要になるとても重要な技術である。

現代の天文学の観測においては、例えばなにかを観測してデータをとったとして、それから実際に天文学的に意味があることをいうまでにはいろいろなステップがはいるのが普通である。多くの場合に、これはいろいろな自由パラメータがあるモデルを持ってきて、そのモデルのパラメータを観測データを「もっともうまく説明する」ように決めるということである。例えば銀河内のガスの速度から質量分布を推測するとか、銀河団ガスからのX線放射から質量を推定するといった場合には、結局そういうことをやっているわけである。もっともうまく説明するとは、具体的にはなんらかの形で誤差を表現して、それを最小化するということである。

これは、形式的には例えばこういうふうな話になる：

「ある領域上で定義された実数値関数 $f(x)$ がある。その最小値とそれを与える $x \in D$ を求めよ」

つまり、最適化というのは要するにこういう話である。

とはいえ、実際にどうやって上の問題の答を求めるかというのは、もちろん領域がどんなものかと関数がどんなものかによる。例えば、観測データを線形回帰して直線近似するなら、は直線 $y=ax+b$ の係数 $(a,b)$ の集合ということになろう。は2乗残差である。これは2次形式の最小化になり、微分すれば連立一次方程式が出てきて解ける。パラメータの数が多くても、2次形式なら話は同じである。

これに対して、同じような多次元空間内の最適化でも、もとの関数がどんなものか良くわからないとか、計算が面倒であるとかいうと、急に話がややこしくなる。

例えば、次の図は連星重力レンズと推定されたものの観測結果と、それのモデルである。

10 cm $\epsffile{APJ2000Machofig4.eps}$

横軸は時間、縦軸は明るさである。連星レンズの特徴は、単一星の場合と違ってピークが2つできることと、そのピークが単一星のばあいよりもずっと明るいことである。

連星レンズの場合、パラメータの数は非常に多い。連星自体の軌道要素が 6 個、その他に質量比、周期、光源の速度、それぞれの我々からの距離ということで10個以上ある。なお、このうちいくつかは縮退しているので、本当のパラメータは9個である。で、どのパラメータを変えるとなにがどう変わるかというのは簡単にはわからない。こういう時に、どうやってレンズのライトカーブの観測から、物理的な意味を引き出せるのだろうか？

というわけで、世の中には多様な最適化手法がある。これらを簡単にまとめるのが今日の話ということになる。

Jun Makino
平成17年12月5日