Нашел две заинтересовавшие меня статьи: 1, 2.
Есть три вопроса:
как корректно передать в _mm_rsqrt_ps тип float и получить float на выходе?
как переписать sqrt14 из второй статьи для gcc?
double inline __declspec ( naked ) __fastcall sqrt( double n ) {
_asm fld qword ptr [esp+4]
_asm fsqrt
_asm ret 8
}
какие флаги выставить компилятору для корректной работы (реального ускорения) этих примеров, а какие могут только все испортить?
Сборка персонального компьютера от Artline: умный выбор для современных пользователей