Linux and FreeBSD
- From
- Slawa Olhovchenkov (2:5030/500)
- To
- Constantin Stefanov
- Date
- 2005-06-01T14:47:38Z
- Area
- RU.UNIX.BSD
Hello Constantin!
01 Jun 05, Constantin Stefanov writes to Slawa Olhovchenkov:
>> У тебя не было приведено ни одного теста где бы двухпроцессорный тазик
>> уделал два однопроцессорных. и я догадываюсь почему -- на нынешних процах
>> все _очень_ существенно тормозит о память. И чем проц быстрее -- тем это
>> больше чувствуется, потому на P3 у тебя и была меньше эта проблема
>> заметна -- проц был медленнее, а не чипсет лучше. Поэтому им лучше
>> удавалось разделить память. А на частотах под 4ГГц и одному процу
>> современной памяти мало, быстродействие-то у нее на случайной выборке
>> особенно не выросло.
CS> Сходи вот сюда: http://parallel.ru/cluster/leo_performance.html
CS> Там есть данные по производительности на один процессор при
CS> использовании одного и двух процессоров из узла. И это, еще раз
CS> повторяю, на LinPack. Он не очень требователен к латентности среды, хотя
CS> на нем это тоже сказывается. К сожалению, не существует настолько же
CS> распространенного теста производительности, который был бы критичен
CS> именно к этому параметру.
Вот именно туда я и ходил, после чего и сделал это утверждение.
Вот покажи пальцем тут http://parallel.ru/cluster/images/perf/cpu4a.gif где два проца уделывают два узла?
Сам же пишешь: "Таким образом, на некоторых тестах ускорение, достигаемое за счет использования второго процессора на узле еще меньше, чем на тесте LINPACK, а ускорение за счет использования второго процессора на другом узле всегда больше."
>> >> Я думаю на AMD наблюдаются те же соотношения.
>> CS> Забыл винчестеры.
>> Нахуа они нужны вообще на счетном кластере?!
CS> Для временных файлов. Есть у нас один пользователь-химик. Так вот, у
CS> него есть задача, которая так много всего хранит во временных файлах,
CS> что при добавлении в узлы кластера второго винчестера она ускорилась
CS> примерно в 2,5 раза.
Стрелять.
CS> А по NFS это все гонять - можно застрелиться.
Почему? У гигабита трансыер почти 100МБ/с, у винта меньше.
CS> Да и своп бывает. Хоть этого надо повозможности избегать, но бывают не
CS> очень хорошо написанные задачи, которые лезут в своп.
Стрелять. Если кто-то лезет в своп, то своп может кончится. Поэтому будем его ликвидировать как класс. Это примерно та же аналогия, что и у кнута была первом томе еще: не имеет смысла заниматься перераспределением мелких кусочков свободной памяти для получения крупных, поскольку если мы дощли до такого состояния то скорее всего очень скоро у нас память вообще кончится.
>> CS> Правда, это особой роли не играет. Сравнение двух
>> CS> машин на П4 с двумя зеонами некорректно. Все-таки если сравнивать,
>> CS> то две на зеоне.
>>
>> Аргументируй. Чем таким на счете ксенон лучше п4, при одинаковом объеме
>> кэша и частоте проца/FSB.
CS> Внутренний дискомфорт. Или у тебя есть данные, что это одно и то же?
CS> Тогда пожалуйста.
К сожалению у меня нету возможности это потестировать. Я надеялся что у тебя есть. Насколько я был в курсе (могу ошибаться) основное отличие ксенонов от П4 -- умение вставать парой и более раннее появление всяких модных технологий (гипертрединга и прочих).
>> CS> Но это ладно. Если на эзернете, то можно как-то об этом говорить.
>> CS> Но
>> CS> как только мы начинаем бороться за малолатентную передачу, то на
>> CS> каждый узел мы добавляем $1000 или больше за карту, плюс порт на
>> CS> свитче (не у всех технологий). А если мы остаемся на эзернете, то мы
>> CS> запросто можем наткнуться на задачу, где добавление узла не даст
>> CS> прироста производительности.
>>
>> А про это тебе уже Глеб говрил -- за цену спецкарты можно собрать машину
>> на АМД64 и просто удвоить число узлов, чем более чем скомпенсировать
>> коэффицент эффективности. Т.е. использование езернета и однопроцессорных
>> тазиков позволяет учетверить число узлов, что при том же бюджете может
>> позволить удвоить производительность кластера.
CS> Еще раз говорю - не на всех задачах.
Расскажи на каких. То, что две коробки лучше двухголовой -- ты уже сам доказал. Почему кластер с коэф. 0.6 и двойным числом узлов будет хуже кластера с коэф. 0.8? Даже если у нас будет совсем дерьмо (0.4) мы будем иметь в результате аналог 0.8 на половинном числе узлов. А это худший случай, при этом он оказывается не хуже альтернативного варианта. А скорее всего будет лучше.
... Стоп, себе думаю, а не дурак ли он?
--- GoldED+/BSD 1.1.5
* Origin: (2:5030/500)
SEEN-BY: 46/50 50/203 400/814 450/186 247 1024 451/30 550/196 4635/4 4652/15
SEEN-BY: 5000/5000 5011/13 5015/10 5019/31 5020/52 154 175 400 545 549 715 758
SEEN-BY: 5020/830 937 1523 1604 1630 2020 2142 2238 2450 2590 4441 5021/29
SEEN-BY: 5022/128 5025/3 750 5027/16 5029/32 5030/49 115 473 500 556 966 1063
SEEN-BY: 5030/1900 5031/70 72 5035/38 5036/34 5042/13 5049/50 97 5054/1 4 8 9
SEEN-BY: 5054/28 35 36 37 63 66 67 70 75 81 84 85 5055/95 5061/120 5062/1 10
SEEN-BY: 5063/3 5067/2 5069/7 5070/1222 5079/23 5080/80 1003 5082/6 5083/21
SEEN-BY: 5085/13 5090/108 5095/20 5096/18 6000/12 254 6001/10
PATH: 5030/500 5020/4441 545 5054/1 37