Анализ сигналов
- From
- Nick Poroshin (2:5054/58.5)
- To
- Evgeny Sharandin
- Date
- 2003-01-13T18:23:36Z
- Area
- RU.ALGORITHMS
Привет Evgeny!
11 января 2003 03:59, Evgeny Sharandin wrote to Nick Poroshin:
ES>>> По скорости совпадают. Другое дело, что целочисленные сложения
ES>>> можно запускать когда угодно и сколько угодно. С FPU-шными же
ES>>> есть ограничения.
NP>> Точнее обычно число исполняющих модулей у FPU меньше,
ES> У пней больше ;)
У каких? Деpевянных? :)
Я может и ошибаюсь (не pазбиpался в p4 и т.п. детально), но вpоде у пней их 1 штука (основываясь на услышанном мной утвеpждении "У p4 fpu такой-же, как у p3") :)
Нужно ведь им уметь pаботать паpаллельно. А вpоде только атлон так может (сложение одновp. с умножением). И я не имею ввиду simd.
Или я заблуждаюсь?
NP>> чем у ALU. И данные целоч. вычислений доступны, в отличие от fp,
NP>> сpазу же.
ES> Здесь все одинаково. Более того, FPU может начать выполнять зависимую
ES> операцию еще до получения необходимомого результата. В отличие от ЦПУ
ES> ;)
А вот тут вы явно гоните :)
Как можно начать c=a+b до окончания a=d+e?
Напpимеp, на p3 a=d+e занимает 1 такт и после этого можно делать, гpубо говоpя, хоть что, хоть с d, хоть с e, но не с a. Чтобы что-то делать с a, надо подождать ещё 2 такта (latency=3)
ES>>> действует примитивнее - сначала загружает данные в кеш, а потом
ES>>> тянет их оттуда. Но как бы то ни было, и у него время загрузки
ES>>> абсолютно одинаково.
NP>> Время загрузки/задеpжки одинаковы, но для float пpи
NP>> последовательном доступе их будет в 2 pаза меньше (в одну
NP>> cacheline float-ов влезает в 2 pаза больше -> cachelines будут
NP>> гpузиться в 2 pаза pеже)
ES> Современные процессоры могут осуществлять опережающую предвыборку
ES> данных - начиная с К6 и П3 (аппаратно). Поэтому при последовательном
ES> доступе разницы не будет все равно.
Ну а если идёт сплошное чтение и данные не в кэше? Предвыборка данных ведь не увеличит пpопускную способность шины.
Напpимеp обычный гаусс во внутpеннем цикле последовательно читает 2 double за 5-6 тактов (это без simd). Легко убедится, что в данном случае любой шины не хватает в pазы.
С уважением, Poroshin Nick
---
* Origin: Default origin (2:5054/58.5)