Быстрые квадратные корни

1136
06 февраля 2017, 16:51

Нашел две заинтересовавшие меня статьи: 1, 2.

Есть три вопроса:

  • как корректно передать в _mm_rsqrt_ps тип float и получить float на выходе?

  • как переписать sqrt14 из второй статьи для gcc?

    double inline __declspec ( naked ) __fastcall sqrt( double n ) {
        _asm fld qword ptr [esp+4]
        _asm fsqrt
        _asm ret 8
    }
    
  • какие флаги выставить компилятору для корректной работы (реального ускорения) этих примеров, а какие могут только все испортить?

READ ALSO
Вывод форматированного текста в окно (C++, WinAPI)

Вывод форматированного текста в окно (C++, WinAPI)

В установщике пакета ПО нужно вывести длинный текстТекст надо растянуть по ширине, разместить по центру заголовок "ПОЛЬЗОВАТЕЛЬСКОЕ СОГЛАШЕНИЕ",...

1159
Как правильно записать функцию чтения в буффер на с, c++

Как правильно записать функцию чтения в буффер на с, c++

Считать конкретное количество данных проблем нетРазмер данных, которые могут прийти не может быть больше чем buf_len

799
Шаблонные класcы C++. C3203

Шаблонные класcы C++. C3203

Добрый день, возникла следующая проблема касающаяся шаблонных классов в C++

839
Ошибка Stack overflow, как избежать и что это?

Ошибка Stack overflow, как избежать и что это?

Можете объяснить, когда возникает эта ошибка и как от нее избавиться?

836