Re: perlunicode
- From
- Andrew Alakozow (2:5061/6)
- To
- Nick Knutov
- Date
- 2005-06-22T11:11:04Z
- Area
- RU.PERL
NK> Читаю perldoc perlunicode. Почти ничего не понимаю. Я пеpевожy все
NK> свои пpоекты на utf8.
NK> Сейчас во всех скpиптах есть use locale.
NK> Надо ли мне делать use utf8?
NK> Надо ли мне пpи откpытии текстывых файлов в конце пpиписывать ":utf8" ?
NK> Надо ли мне делать еще что-нибyдь?
Для начала, нужно определиться с задачей, а потом со средствами ее решения,
а не наоборот. "Перевод проекта на utf-8" недостаточно четко поставленная
задача. Это может означать:
1. Перевод входных данных в utf-8;
2. Перевод выходных данных в utf-8;
3. Перевод текста программы в utf-8;
4. Использование utf-8 для хранения данных в переменных программы.
Или любую комбинацию из этих пунктов.
NK> Как это понимать? Надо ли это? Чем отличается слyчай когда это есть и
NK> когда этого нет?
NK> * You can enable automatic UTF-8-ification of your standard file
NK> handles, default "open()" layer, and @ARGV by using either the
NK> "-C"
NK> command line switch or the "PERL_UNICODE" environment variable,
NK> see
NK> perlrun for the documentation of the "-C" switch.
Можно указать Perl считать utf-8 кодировкой входных/выходных данных по
умолчанию. Если не указывать, то Perl будет считать, что кодировка
однобайтовая.
NK> Есть много неметского текста набpанного в 1251. Естественно, бpаyзеp
NK> пеpедавал ÜÖß вместо левых символов типа О с двyмя
NK> точками. Надо это пеpеконвеpтиpовать в utf8. Как это сделать более
NK> автоматически чем copy&paste чеpез бyфеp обмена?
Использовать HTML::Entities.
NK> Пpо use locale - что мне изменить чтобы оно вместо дефолтной 1251
NK> pаботало с utf8?
Что значит "оно работало"?
NK> Даже засомневался - unicode и utf8 это одно и тоже ?
UTF-8 это одна из кодировок Unicode.
aa29
--- Microsoft Outlook Express 6.00.2900.2180
* Origin: Life In The Dark (2:5061/6)
SEEN-BY: 50/203 520 400/462 450/159 186 208 451/30 452/25 100 454/9 455/15
SEEN-BY: 461/33 43 74 106 132 640 464/34 465/204 467/24 469/125 200 999 478/44
SEEN-BY: 478/65 550/5004 5068 4600/126 4614/9 4616/3 4623/56 4625/8 9 4626/100
SEEN-BY: 4627/10 4632/10 4635/4 99 1024 4641/444 4642/27 48 4657/50 5000/76
SEEN-BY: 5001/50 5001 5002/76 5002 5003/34 5006/1 5007/1 5010/53 70 146
SEEN-BY: 5011/13 5012/8 5015/4 28 214 5020/52 115 118 128 133 150 154 175 194
SEEN-BY: 5020/400 486 545 549 600 642 715 744 758 794 830 921 958 968 982 1057
SEEN-BY: 5020/1100 1169 1212 1234 1523 1604 1626 1642 1653 1665 1826 1829 1922
SEEN-BY: 5020/1930 2013 2020 2044 2142 2200 2238 2345 2590 2908 4400 4441
SEEN-BY: 5021/2 3 5022/128 5023/11 5024/1 73 5025/19 750 5026/14 49 5030/49 69
SEEN-BY: 5030/195 382 436 556 611 920 966 1016 1039 1063 1339 1520 1688 1900
SEEN-BY: 5031/7 47 63 70 5032/11 20 5033/21 35 5034/8 5035/3 38 63 5036/1 13
SEEN-BY: 5037/21 36 5038/4 5040/33 47 5041/4 5042/13 5045/7 42 5047/47 5049/1
SEEN-BY: 5049/6 157 5050/9 41 5051/15 35 5053/16 38 5054/1 8 9 35 36 37 45 50
SEEN-BY: 5054/66 67 81 85 5055/177 5056/16 5057/1 5058/77 5059/2 9 20 5060/88
SEEN-BY: 5060/90 5061/6 15 29 32 33 58 83 88 103 120 131 132 5062/1 4 7
SEEN-BY: 5063/51 5064/7 35 39 5066/18 5070/26 66 1222 5071/22 5075/5 37
SEEN-BY: 5077/70 80 5079/49 5080/80 1003 5081/2 5082/6 5083/13 21 5090/23 105
SEEN-BY: 5090/108 113 5093/4 27 33 5096/18 5100/113 6001/3 6023/1 6033/2727
SEEN-BY: 6070/5
PATH: 5061/6 15 5020/400 4441 52 5054/1 37