点行列の行列積の高速な包含方法として,丸めモードが変更可能な高速BLASを利用する方法が良く知られている.しかし,高速なBLASが丸めモードの変更を許容していない場合も多くある.例えば,Open BLASでは,デフォルトでは丸めモードの変更は許容されておらず,make時のオプションを指定する必要がある.またMKLでも,スレッドに対するソフトウェアを設定するオプションによって丸めモードの変更が左右される.そこで,本講演では,AVX512の丸めモードを含んだFMA命令を使用することで,高速に点行列の行列積を精度保証する方法を紹介する.結果として得られた速度はMKLとほぼ同程度の速度になることがわかった.