и еще вопрос - по прошивкам 12.3++

From
Alex Solovyov (2:5020/1575)
To
All
Date
2006-02-23T11:03:30Z
Area
RU.CISCO
QCD np: w/o music (closed)
                       Пpиветствyю тебя, All!

в общем наблюдается проблема. При заливке в киску (7507/vip2-50) ИОСов от 12.3 и выше - киска стабильно либо перегружатся, либо падает с различными ошибками (почитал на сайте по подобные обишки - пишут, что пишите в тех.суппорт - скоре всего в ИОСе проблемы) - приводить их тут не буду (не - если надо - приведу, конечно же). Заметил одну закономерность. При отключенной новой функции multi-session киска не падает. Но при этом у меня нет возможности управлять циской удаленно параллельно с другим оператором и в мониторинговой машиной (зайти в режим conf). Текущий ИОС 12.2-31 (RSP-JK9O3SV-MZ). Стабильно все работает, ничего не падает и одновременно возможно зайти в conf-режим с двух консолей, но.. dCEF очень плохо себя ведет. Хочется перейти на 12.4, но на 12.4-5 (rsp-jsv-mz) наблюдается постоянное падение циски если включаю режим multi-session, чтобы была возможность одновременного конфигурения с разных консолей и - ЧЕРЕЗМЕРНОЕ отжирание процессом IPC LC Message Handler ресурсов процессорного времени - в результате загрузка циски в том же конфиге возрастает в 1.5 раза!
В общем чего делать? :( Перепробовал уже несколько версий из 12.3 (Т и не Т) и пару 12.4 - падение стабильное, или перезагрузка только одного VIP'а каждые 5-6 часов. На 12.4-5 стабильно отжирание процессом IPC LC Message H дикого кол-ва CPU. на 12.2-31 сейчас ни этот процесс не ожирает ничего (0%-0%-0%), ни произвольных падений или перезагрузок VIP'a.

ЗЫ: к сожалению нет ни одного сертификата - поэтому доступа нормального на сайт нету.
ЗЫЫ: Приведу краткий лог последнего crashlog'a - от 12.4-5
------------------------------
... команда execute делалась со второй консоли.... после вывода результата
... ее - циска "потерялась" и поднялась через несколько минут после полной
... перезагрузки - в логе при этом ничего не было сказано о причине - пусто
CMD: 'arp yyy.yyy.yyy.yyy xxxx.xxxx.xxxx arpa' 13:05:51 MSK Fri Feb 10 2006
CMD: 'exe' 13:06:41 MSK Fri Feb 10 2006
CMD: 'execute-on 0 show ip cef' 13:06:46 MSK Fri Feb 10 2006
CMD: 'execute-on ' 13:06:51 MSK Fri Feb 10 2006
CMD: 'execute-on slot 0' 13:06:55 MSK Fri Feb 10 2006
CMD: 'execute-on slot 0 ' 13:06:58 MSK Fri Feb 10 2006
CMD: 'execute-on slot 0 show ' 13:07:00 MSK Fri Feb 10 2006
CMD: 'execute-on slot 0 show ip cef' 13:07:08 MSK Fri Feb 10 2006
CMD: 'execute-on slot 0 show ip cef yyy.0.0.0' 13:07:22 MSK Fri Feb 10 2006
CMD: 'arp yyy.yyy.yyy.yyy xxxx.xxxx.xxxx arpa' 13:07:52 MSK Fri Feb 10 2006
CMD: 'arp yyy.yyy.yyy.yyy xxxx.xxxx.xxxx arpa' 13:07:54 MSK Fri Feb 10 2006
CMD: 'arp yyy.yyy.yyy.yyy xxxx.xxxx.xxxx arpa' 13:08:19 MSK Fri Feb 10 2006
CMD: 'arp yyy.yyy.yyy.yyy xxxx.xxxx.xxxx arpa' 13:09:22 MSK Fri Feb 10 2006

13:09:37 MSK Fri Feb 10 2006: TLB (load or instruction fetch) exception, CPU signal 10, PC = 0x421F8F0C
-Traceback= 0x421F8F0C 0x410AC210 0x410ADD08 0x4032B790 0x41312B14 0x4130DF7C 0x405A9538 0x405A6518 0x4059F1B4 0x404CB4C8
$0 : 00000000, AT : 00000050, v0 : 00000000, v1 : 00000001
a0 : 0000005E, a1 : 0000005F, a2 : 00000014, a3 : 44FED55C
t0 : 48602514, t1 : FFFFFFFF, t2 : 00000006, t3 : 44FED630
t4 : 448DAD40, t5 : 44FED680, t6 : 44FED67C, t7 : 44FED678
s0 : 00006560, s1 : 44FED550, s2 : 00000140, s3 : E00AA3E8
s4 : 448DAD40, s5 : 44FED744, s6 : 44FED748, s7 : 448DAD40
t8 : 44FED578, t9 : 00000000, k0 : 00000000, k1 : 00000000
gp : 43E6EA40, sp : 44FED520, s8 : 448D0000, ra : 421F8F44
EPC  : 421F8F0C, ErrorEPC : 5809074D, SREG     : 3400C703
MDLO : 000002A3, MDHI     : 0000004A, BadVaddr : 00006574
Cause 00000008 (Code 0x2): TLB (load or instruction fetch) exception

=== Start of Crashinfo Collection (13:09:37 MSK Fri Feb 10 2006) ===
For image:
Cisco IOS Software, RSP Software (RSP-JSV-M), Version 12.4(5), RELEASE SOFTWARE (fc3)
Technical Support: http://www.cisco.com/techsupport
Copyright (c) 1986-2005 by Cisco Systems, Inc.
Compiled Mon 31-Oct-05 22:05 by alnguyen

========= Show Alignment =============================

No alignment data has been recorded.
No spurious memory references have been recorded.

...........

---- Partial decode of process block ----

Pid 119: Process "IPC LC Message Handler" stack 0x459A6174 savedsp 0x44B2BA50
Flags: analyze prefers_new
Status     0x00000000 Orig_ra   0x00000000 Routine    0x00000000 Signal 0
Caller_pc  0x00000000 Callee_pc 0x00000000 Dbg_events 0x00000000 State  0
Totmalloc  16014848   Totfree   33661572   Totgetbuf  0
Totretbuf  C7B3A8     Edisms    0x0        Eparm 0x0
Elapsed    0x7ED1C4   Ncalls    0x10480D   Ngiveups 0x33FD
Priority_q 3          Ticks_5s  142        Cpu_5sec   0        Cpu_1min 382
Cpu_5min   5515       Stacksize 0x1770     Lowstack 0x1770
Ttyptr     0x44A8C770 Mem_holding 0x2664     Thrash_count 0
Wakeup_reasons      0x0FFFFFFF  Default_wakeup_reasons 0x0FFFFFFF
Direct_wakeup_major 0x00000000  Direct_wakeup_minor 0x00000000

Regs s0-s8,ra at last suspend; a0,a1,sp from proc creation, PC unused:
     a0: 4058EF64  a1: 00000000  s0: 44880000  s1: 459A7918  s2: 00000000
     s3: 00000000  s4: 00000000  s5: 00000000  s6: 00000000  s7: 00000000
     s8: 00000000  sp: 459A78C0  PC: 00000000  ra: 4049BD9C

---- Current Process Stack (0x584 bytes used, out of 0x1770 available) ----
------------------------------
Дальше ничего интересного. В общем чего делать - не знаю :( Памяти - по полной забито и вроде всего хватает (12.4 кстати даже меньше отжирала на VIP'e):
-------------
xxx.xxx.ru#sh mem
              Head    Total(b)     Used(b)     Free(b)   Lowest(b) Largest(b)
Processor 42799F40   226910400    19209096   207701304   205370508  206098420
   Fast   42779F40      131080       65400       65680       65680      65628

xxx.xxx.xxx#if-cons 0
Console or Debug [C]:
Entering CONSOLE for VIP2 R5K 0
Type "^C^C^C" or "if-quit" to end this session

VIP-Slot0>ena
VIP-Slot0#sh mem
              Head    Total(b)     Used(b)     Free(b)   Lowest(b) Largest(b)
Processor 60AA1340   123071680    18320824   104750856   104609548  104671196
    PCI   30000000     8388616     8388440         176         176        124
-----------------

 Хочется и нормальной работы dCEF'a (на 12.2 он через попу работает.. :
---------------
FastEthernet0/0/0
          Switching path    Pkts In   Chars In   Pkts Out  Chars Out
               Processor   80871646 1821211505   73608562 1524936017
             Route cache  811332100 1827544132  711044257 1029112682
       Distributed cache    1380688   88246500          0          0
                   Total  893584434 3737002137  784652819 2554048699
--------------
при 12.4 весь трафик распределялся между Route-cache и Distibuted и на OUT была совершенно другая картина.. сейчас все через попу - на out вообще не работает dCEF.
NAT гораздо лучше работает на 12.4 (на 12.3 еще и NAT глючил страшно - таймауты не срабатывали и нитки плодились тысячами).
Так же хочется и сохранить возможность одновременной работы с нескольких консолей в и вразных режимах - хоть все в режиме конфига. Но и непонятны проблемы с отжиранием CPU процессом IPC LC Message Handler.. :( Сейчас-то он в норме - ничего не кушает.. вообще не кушает проц.

.. Чего делать? :(


Sincerely yours - Alex-First                   [Team Realm 7:359@Realm]
                  "Роза пpи имени пpежнем - с нагими мы впpедь именами"
                                             (с) Умбеpто Эко "Имя pозы"
... "..Пyть тяжел, но цель пpекpасна, как огонь костpа.." (с) Аpия
--- Коцать тут..
 * Origin: Hacker's Stone BBS (095) 344-1488 [00:00-12:00] (2:5020/1575)
SEEN-BY: 46/50 140/1 400/814 450/1024 5000/5000 5011/13 5015/28 221 5019/31
SEEN-BY: 5020/166 380 429 545 561 630 715 828 834 921 1031 1306 1575 1668 1822
SEEN-BY: 5020/1826 1845 1941 1960 2044 2114 2188 2208 4343 4441 5052 8086
SEEN-BY: 5020/12000 5021/29 5022/5 5025/3 5027/12 5030/115 5037/28 5043/0 19
SEEN-BY: 5045/7 5052/4 5053/16 5054/1 4 8 9 28 30 35 36 37 67 72 75 81 5056/16
SEEN-BY: 5060/900 5062/10 5063/3 5077/70 5080/1003 5085/13 5095/20 5096/18
SEEN-BY: 6000/1 6001/10 6056/1
PATH: 5020/1575 12000 715 545 5054/1 37