うーん、FMA の効果と思っていたけど、その後のプログラミングからは、SIMD の効果{FMA 効果ならMP分(Max.≒10)x2倍なんで実際の66倍より少なすぎる!}とした方が用語的にはタダシイようだ、もっと具体的にAVX128かな?。題名訂正。Ryzen7が発売になったので、マルチコアの威力。あとPCを買ったのか2018年だったのでまだGeforceが馬鹿高でなかった。まあその前が970だったけど退職して貧乏なんで1ランク下の1060でした。
かなりはやくなった。
でも、OpenMP、OpenACC でよく言われるディレクティブを追加式ではダメ。完全に書き換え必要。でも退職後で以前のコードで知財権とか言われたくないのでどうせコードは書き換えるつもりだった。まあFORTRAN77・Fortran90 もいい言語だけど、modern fortran 移行も必要だし。(なおSIMDはやはりCの方がコンパイラだのみでソースコード直してしてはお願いの fortran より直接細かい制御できるので向いているよ~だ。でも大変みたい。)
予備検討。やはりRyzenは凄い
かなり重たいファンビームの実験。無論単純な画像のレイトレーシングではない。ファントムの元素の減弱係数はNISTに、エネルギーは10keV~120keVまで、0.1mm画素サイズ、0.05mmステップ、1600×1600画素720投影。2400チャンネルに1チャンネル3本の光子。セプターの考慮でパッキングレシオ75%、出力は870Mバイトもある。
投影はデーター重さからGefoceが振るわない(レイトレーシングコアもない機種だし)一方再構成はGeforceおそるべし。
まあ精度は、単精度倍精度が支配的なのは当たり前のこと。