После того, как на прошлой неделе Федеральная антимонопольная служба (ФАС) заинтересовалась длиной sms-сообщений, Сергей Скрипников, руководитель отдела по связям с общественностью региона Северная Европа и Центральная Азия компании Ericsson объяснил, что попытка изменить правила стандарта сотовой связи GSM в отношении кодировки символов sms на стороне оператора может привести к неработоспособности сервиса в сети данного оператора. Компания Ericsson была одним из первых производителей телефонов для стандарта GSM.
ФАС сообщила в пятницу о своем запросе в адрес сотовых операторов, в котором просит объяснить, почему длина коротких текстовых сообщений на кириллице более чем в два раза меньше, чем на латинице. Начальник управления контроля транспорта и связи Дмитрий Рутенберг объяснил заинтересованность ФАС жалобами абонентов.
Общепринятый подход к использованию кодировок текста в sms — часть глобального стандарта GSM, о деталях которого разработчики договаривались еще во время длительного обсуждения в конце
В соответствии с этим стандартом производится не только операторское оборудование для GSM-сетей, но и все GSM-телефоны. Отход от стандарта может привести к тому, что телефоны просто не будут обеспечивать прием и передачу sms в новом формате. Поэтому дело даже не в операторском оборудовании, которое в теории можно «перепрошить», но еще и в миллиардах «трубок» по всему миру».
Согласно стандарту, sms должно быть объемом не более 163 байт, из которых 23 байта — это техническая информация (отметка sms -центра, источник сообщения, схема кодировки и пр), и собственно пользовательский текст — 140 байт.
Для поддержки других национальных алфавитов, включая русский, используется
Ранее представитель ФАС заявил агентству, что объяснениями операторов ведомство осталось удовлетворено, а потому направит запросы производителям телефонов просьбой объяснить причины выбора определенной кодировки.
Размер sms в символах определяется технологией передачи: сообщения передаются по специальному служебному радиоканалу сотовой сети. Размер пакета передаваемой информации в этом канале ограничен 1120 битами (140 байт).
А почему так получилось? Почему нельзя было изначально по-человечески использовать 8-бит, а придумали схему с двумя байтами?
Двубайтная кодировка позволяет кодировать 65т. символов и используется во всех современных системах MS Windows. Но и этого не достаточно для возможности закодировать все символы всех языков, поэтому существует еще и четырехбайтная кодировка, позволяющая вместить все, но значительно избыточная. А так же UTF-8, кодировка переменной длинны, один символ может занимать от одного до четырех байт.
[[color=#008040]Есть два вида 8-битных кодировок для русского языка: KOI8-R (локальная российская кодировка) и Windows-1251. Но они не являются международными стандартами, то есть при их использовании возникли бы проблемы совместимости. На практике это выражалось бы в получении сообщений-иероглифов. Именно поэтому используется международный стандар[/ color]]
Абонент Мегафона, получивший такую "сверхдлинную" SMS может отредактировать её и отправить как одно сообщение! Причем первые 150 символов этого текста удаётся отправить с общедоступного сайта оператора + оператор добавляет к такому сообщению рекламу, опять же из русских символов, намного превосходя заявленные 140 байт.
Другой пример, аналогичный вышеприведенному: к SMS из 140 русских букв, отправленной с сайта TELE2 оператор цепляет длинющее предупреждение "SMS отправлено через Интернет. Возможно мошенничество***" и все эти 196 символов (392 байта в 16-битной кодировке) поступают на простенький мобильник LG KP105 частями как 3 отдельных невнятных SMS-сообщения, а на не менее простенький Sony-Ericsson K300i - как единое сообщение именно русскими буквами.
Напрашивается вывод - могут же, когда захотят! Поэтому претензии ФАС к сотовым операторам всё-таки небезосновательны и могут возникнуть вопросы и к производителям телефонов. Это поспособствует выработке улучшенных стандартов, и когда-нибудь потребители, купившие официально ввезённый и сертифицированный для России телефон, будут уверены, что у них не будет неожиданностей с кодировками и двойных расходов на кириллические SMS.