Быстрый лёгкий надёжный форумный движок
Вы не вошли.
Добрый день
Есть ли проблемы с UTF у данного движка?
Если нет - не дадите небольшое how-to по смене кодировки на UTF-8 (интерфейс iconv'ом уже переконвертировал)?
Редактировался lystor (2006-08-11 10:34:53)
Вроде как работает. Например, на mozilla.ru форум в UTF. Правда, он у них "глобоко замодированный".
с ЛЕМЪ МЕ ПЮАНРЮЕР ОНХЯЙ РЕЙЯРЮ МЕ ascii Б UTF-8 - БННАЫЕ МЕ БШДЮЕР ПЕГСКЭРЮРНБ.
йРН-МХАСДЭ ГМЮЕР ЙЮЙ КЕВХРЭ?
вот сейчас попробовал установить utf-8 кодировку.
на локальной системе денвер+мускуль4+пхп4
взял редактор и все файлы русские переохранил в utf8
затем создал базу и сделале ей коллате utf8
потом установил форум, потом в файлах где встретилось iso-
заменил на utf-8
поставил русский язык в профиле- все окей.
Да не тут то было:
тоесть русская заглавная "И" и строчная "ш" превращаются в какую то гадость.
но на хостинге - все работает нормально..
и еще - когда я делаю эту же строку например в имени темы - она говорит что длина не может превышать 70 символов...
оттакота..
Кто мне сможет доходчиво объяснить, зачем на ру форуме UTF-8? Точнее нафига, делать лишнюю работу, ведь и так всё работает отлично.
maximum
в этой теме есть сообщение - http://punbb.ru/viewtopic.php?pid=3274#p3274
Если бы в то время на форуме был утф, мы бы прекрасно понимали, что там было написано.
Всё равно - win-1251 для ру аудитории лучше, если и делать выбор.
Всё равно - win-1251 для ру аудитории лучше, если и делать выбор.
Аудитории монопенисуально, что там в тегах написано, win-1251, утф или ещё что, ей больше по душе когда они видят то, что ожидают увидеть, а не кракозябры.
Кто мне сможет доходчиво объяснить, зачем на ру форуме UTF-8?
Спецзнаки?
Что есть "спецзнаки", общаюсь с компьютером уже 11 лет, и досихпор незнаю.
Что есть "спецзнаки", общаюсь с компьютером уже 11 лет, и досихпор незнаю. big_smile
Не вот это - ©?
Редактировался Px (2006-12-05 21:28:00)
Кто мне сможет доходчиво объяснить, зачем на ру форуме UTF-8? Точнее нафига, делать лишнюю работу, ведь и так всё работает отлично.
пожалуйста:
у меня форум по боевым искусствам. как вы думаете - товарищи из китая могут должны иметь возможность писать на ПУТУНХУА? иероглифами?
а теперь представьте что я хочу читать и ероглифы и русские - на одной страничке
Добавлено Wed Dec 6 02:56:17 2006 :
ну что - поможете мне? - правда - надо ОЧЕНЬ!!!
помогите!
надо чтото изменить теперь в конфиге - чтобы длины всех полей пришли в норму!!!
и тчобы потом такого же глюка не вылазило, как щас на денвере (у зхочтера итак не вылазит, но тут то вылазит - и мне неспокойно!!!
А вы не считаете, что китайцам на вашем форуме не место?
Да читайте, кто вам мешает, правильное отображение возможно, если даже на странице жёстко не прописана кодировка.
Кому еще на нашем форуме не место?
maximumб utf-8 полезен для русскоязычного форума:
- не надо лишать себя возможности использовать любой язык, кроме русского. понадобится вставить какой-нибудь литовский умляут или иероглиф - пожалуйста.
- медленно, но верно в УРЛах появляются символы сверх 8bit ascii. если не хочешь проблемм со ссылками с форума - используй UTF, тогда ссылка вида "somesite.ru/пейзажи/" будет правильно читаться и правильно работать.
- аргументы типа "Opera - фуфло, Windows - must die, Китайцы - пофигу" - это детский максимализм. форумы создаются не для себя, а для людей. надо учитывать их потребности, а не свои.
по моему опыту сложности с punbb+utf сводятся к поиску НЕмультибайтных строковых функций в движке и плагинах и замене их на mb_* аналоги.
кстати, в моем денвере mbstring отсутствовал - пришлось апгрейдить PHP
А для меня главный (-) utf8 - это то что трафик на таких сайтах чуть ли не в 2 раза больше, чем мог бы быть (трафик дорогой).
А для меня главный (-) utf8 - это то что трафик на таких сайтах чуть ли не в 2 раза больше, чем мог бы быть (трафик дорогой).
при условии gzip компрессии (а она практически на всех форумах) - трафик почти не увеличивается
при условии gzip компрессии (а она практически на всех форумах) - трафик почти не увеличивается
Здесь слово "почти" - не аргумент.
70 тысяч символов win1251 страницы ужимается в 12 килобайт
70 тысяч символов utf8 страницы ужимается в 18 килобайт.
Кому-то покажется несущественной мелочью, а для меня не совсем. И я предпочту форуму на utf8 форум на win1251
Мне иероглифы не нужны. И недостатков в win1251 кодировки лично я не вижу. Если бы в ходу был дореволюционный русский (с ятями и фитами), тогда можно было бы еще и подумать.
Увеличение трафика пожалуй самый серъёзный аргумент "против"
если кто плохо прочел - форум посвящен боевым искусствам. в том числе например было бы очень удобно писать не "беый журавль машет крыльями" и не "бай хе лян чи" а прямо иероглифами выводить.
кроме того как вы понимаете (тоесь видимо не понимаете) люди кои занимаются китайскими единоборствами - они с китайцами общаются, японскими - с японцами, корейскими.. нц вы поняли, да?
а еще есть бразильско-африканская капоэйра.. хихи)
вобщем пока я понял что моих нулевых знаний не хватит чтобы сделать форум в UTF.
буду ждать пока какой нибудь добрый человек напишет руководство (по шагам - как хаки) - как взять и настроить намано русскоязычный utf - punbb форум и чтобы там всякие страхи потом не преследовали по поводу пропажзи заглавных И и строчных ш, и чтобы наманая длина полей была (названия и т.п.) и чтобы поиск был без различий строчных/заглавных...
Ну ты вроде все правильно для утф сделал. Punbb.ru тоже в утф. Дриугое дело что денвер сам по себе инструмент непригодный для подобных экспериментов. К примеру у меня на винде дома стоит бигапач (сборная солянка из всех необходимых компонентов) немного старый. мускул + пых я сам ставлю. И все нормально работает. Заметь, что и на хостинге у тебя все нормально работает, так что ищи причину в денвере (выкинь его и поставь всё сам).
70 тысяч символов win1251 страницы ужимается в 12 килобайт
70 тысяч символов utf8 страницы ужимается в 18 килобайт.
другими словами добавка порядка 50% ???
Извини, но приведенные цифры вызывают сомнения. Давай внесем ясность для потомков.
Русский непожатый текст в UTF больше аналогичного win1251 почти в два раза. Почти - потому что символы пунктуации, пробелы проч. спецсимволы укладываются в один байт.
Теперь взгляни на html код вот этой страницы форума - это локализованный форум с русским текстом внутри, но русские буквы занимают примерно половину всего объема - то есть прирост на UTF составит порядка 25%.
Теперь жмем его gzip - спорю на шелбан (c) - разница получится еще меньше. С учетом графики, css, js и служебного трафика прирост объема становится совсем мизерным - не более 3-5%.
Все эти выкладки я привожу именно для форума. Мы ведь обсуждаем утфикацию punbb?
да какая разница?????????
человек ходит на форум по ПАНбб а не на форум с русской кодировкой!!!
и ко мне человек пойдет, даже если я щас все переведу на ipb1.3 или фообще на какой нибуть левый движок.. - потому что в Омске других форумов по боевым искусствам НЭТУ.
просто будет НЕ удобнее пользоваться. И мне очевидно что понадобится поддержка иероглифов - а значит када бы ее сделать - будеть УДОБНЕЕ пользоваться. потому и надо ее сделать.
Ну ты вроде все правильно для утф сделал. Punbb.ru тоже в утф. Дриугое дело что денвер сам по себе инструмент непригодный для подобных экспериментов. К примеру у меня на винде дома стоит бигапач (сборная солянка из всех необходимых компонентов) немного старый. мускул + пых я сам ставлю. И все нормально работает. Заметь, что и на хостинге у тебя все нормально работает, так что ищи причину в денвере (выкинь его и поставь всё сам).
насчет денвера - я уже понял. Я про другое - меня напугали что в утф неправильно работает поиск и это связано в регистром какимто.. кроме того не подсвечиваются какие то результаты поиска (модом хайлайтсеарчрезультс) и главное - в чем я сразу же столкнулся - -
он не дает делать имя темы (например) нормальной длины. 35 символов мало.
я давно-давно видел тему - там говорилось где чо зменить чтобы стало например не 70 а 140, да тока ведь он будет на 70-ти уже орать - что максимум 140
меня это смущает.
и еще смущает что - ПОЛЕЙ ТО ЦЕЛАЯ КУЧА. я даже не знаю всех полей в которых надо максимум символов увеличивать
может кто что по этому поводу напишет умного???
maximum пишет:Что есть "спецзнаки", общаюсь с компьютером уже 11 лет, и досихпор незнаю. big_smile
Не вот это - ©?
Не только, и даже не столько.
Интересуют, в первую очередь, тире, неразрывный пробел, правильные кавычки-елочки, разрывный моноширинный пробел, лигатуры (Æ, Œ,æ œ), ударные буквы (á, ó). Ну и прочая шушера: §, µ, ζ, λ, ξ, π, φ, ‰.
Редактировался gilli (2006-12-08 15:12:38)
еще в копилку "how-to по utf-8":
если провайдер использует "Русский Апач" и у вас возникают необъяснимые глюки с кодировками, попробуйте поместить в .htaccess такие строчки:
CharsetDisable On
AddDefaultCharset utf-8
CharsetRecodeMultipartForms Off
последняя строка помогает, есои не аплодятся картинки на сервер на Русском Апаче. прямого отношения к PunBB это не имеет, но пока есть проблемы с хостингом вообще - будут и с форумом в частности