Linux and FreeBSD

From
Slawa Olhovchenkov (2:5030/500)
To
Constantin Stefanov
Date
2005-06-01T14:47:38Z
Area
RU.UNIX.BSD
Hello Constantin!

01 Jun 05, Constantin Stefanov writes to Slawa Olhovchenkov:

 >> У тебя не было приведено ни одного теста где бы двухпроцессорный тазик
 >> уделал два однопроцессорных. и я догадываюсь почему -- на нынешних процах
 >> все _очень_ существенно тормозит о память. И чем проц быстрее -- тем это
 >> больше чувствуется, потому на P3 у тебя и была меньше эта проблема
 >> заметна -- проц был медленнее, а не чипсет лучше. Поэтому им лучше
 >> удавалось разделить память. А на частотах под 4ГГц и одному процу
 >> современной памяти мало, быстродействие-то у нее на случайной выборке
 >> особенно не выросло.
 CS> Сходи вот сюда: http://parallel.ru/cluster/leo_performance.html
 CS> Там есть данные по производительности на один процессор при
 CS> использовании одного и двух процессоров из узла. И это, еще раз
 CS> повторяю, на LinPack. Он не очень требователен к латентности среды, хотя
 CS> на нем это тоже сказывается. К сожалению, не существует настолько же
 CS> распространенного теста производительности, который был бы критичен
 CS> именно к этому параметру.

Вот именно туда я и ходил, после чего и сделал это утверждение.
Вот покажи пальцем тут http://parallel.ru/cluster/images/perf/cpu4a.gif где два проца уделывают два узла?

Сам же пишешь: "Таким образом, на некоторых тестах ускорение, достигаемое за счет использования второго процессора на узле еще меньше, чем на тесте LINPACK, а ускорение за счет использования второго процессора на другом узле всегда больше."

 >>  >> Я думаю на AMD наблюдаются те же соотношения.
 >>  CS> Забыл винчестеры.
 >> Нахуа они нужны вообще на счетном кластере?!
 CS> Для временных файлов. Есть у нас один пользователь-химик. Так вот, у
 CS> него есть задача, которая так много всего хранит во временных файлах,
 CS> что при добавлении в узлы кластера второго винчестера она ускорилась
 CS> примерно в 2,5 раза.

Стрелять.

 CS> А по NFS это все гонять - можно застрелиться.

Почему? У гигабита трансыер почти 100МБ/с, у винта меньше.

 CS> Да и своп бывает. Хоть этого надо повозможности избегать, но бывают не
 CS> очень хорошо написанные задачи, которые лезут в своп.

Стрелять. Если кто-то лезет в своп, то своп может кончится. Поэтому будем его ликвидировать как класс. Это примерно та же аналогия, что и у кнута была первом томе еще: не имеет смысла заниматься перераспределением мелких кусочков свободной памяти для получения крупных, поскольку если мы дощли до такого состояния то скорее всего очень скоро у нас память вообще кончится.

 >>  CS> Правда, это особой роли не играет. Сравнение двух
 >>  CS> машин на П4 с двумя зеонами некорректно. Все-таки если сравнивать,
 >>  CS> то две на зеоне.
 >>
 >> Аргументируй. Чем таким на счете ксенон лучше п4, при одинаковом объеме
 >> кэша и частоте проца/FSB.
 CS> Внутренний дискомфорт. Или у тебя есть данные, что это одно и то же?
 CS> Тогда пожалуйста.

К сожалению у меня нету возможности это потестировать. Я надеялся что у тебя есть. Насколько я был в курсе (могу ошибаться) основное отличие ксенонов от П4 -- умение вставать парой и более раннее появление всяких модных технологий (гипертрединга и прочих).

 >>  CS> Но это ладно. Если на эзернете, то можно как-то об этом говорить.
 >>  CS> Но
 >>  CS> как только мы начинаем бороться за малолатентную передачу, то на
 >>  CS> каждый узел мы добавляем $1000 или больше за карту, плюс порт на
 >>  CS> свитче (не у всех технологий). А если мы остаемся на эзернете, то мы
 >>  CS> запросто можем наткнуться на задачу, где добавление узла не даст
 >>  CS> прироста производительности.
 >>
 >> А про это тебе уже Глеб говрил -- за цену спецкарты можно собрать машину
 >> на АМД64 и просто удвоить число узлов, чем более чем скомпенсировать
 >> коэффицент эффективности. Т.е. использование езернета и однопроцессорных
 >> тазиков позволяет учетверить число узлов, что при том же бюджете может
 >> позволить удвоить производительность кластера.
 CS> Еще раз говорю - не на всех задачах.

Расскажи на каких. То, что две коробки лучше двухголовой -- ты уже сам доказал. Почему кластер с коэф. 0.6 и двойным числом узлов будет хуже кластера с коэф. 0.8? Даже если у нас будет совсем дерьмо (0.4) мы будем иметь в результате аналог 0.8 на половинном числе узлов. А это худший случай, при этом он оказывается не хуже альтернативного варианта. А скорее всего будет лучше.

... Стоп, себе думаю, а не дурак ли он?
--- GoldED+/BSD 1.1.5
 * Origin:  (2:5030/500)
SEEN-BY: 46/50 50/203 400/814 450/186 247 1024 451/30 550/196 4635/4 4652/15
SEEN-BY: 5000/5000 5011/13 5015/10 5019/31 5020/52 154 175 400 545 549 715 758
SEEN-BY: 5020/830 937 1523 1604 1630 2020 2142 2238 2450 2590 4441 5021/29
SEEN-BY: 5022/128 5025/3 750 5027/16 5029/32 5030/49 115 473 500 556 966 1063
SEEN-BY: 5030/1900 5031/70 72 5035/38 5036/34 5042/13 5049/50 97 5054/1 4 8 9
SEEN-BY: 5054/28 35 36 37 63 66 67 70 75 81 84 85 5055/95 5061/120 5062/1 10
SEEN-BY: 5063/3 5067/2 5069/7 5070/1222 5079/23 5080/80 1003 5082/6 5083/21
SEEN-BY: 5085/13 5090/108 5095/20 5096/18 6000/12 254 6001/10
PATH: 5030/500 5020/4441 545 5054/1 37