Как узнать кодировку сайта

Как узнать кодировку сайта

Кодировка — это набор связанных между собой символов кода и их воспроизведение на экране. По сути, это способ передачи знаков алфавита, цифр, спецсимволов в виде байтов.

Сейчас используются две самые популярные кодировки:

Ряд специалистов считает более предпочтительным вариант UTF-8. Его поддерживают все серверы, площадки, самые популярные поисковики и браузеры.

Вторая кодировка была создана для обслуживания русификаторов операционной системы Windows. Поэтому популярность у нее ниже.

Кодировку сайта можно узнать через исходный код. Для этого необходимо:

В данном случае — UTF-8.

Если после всех манипуляций ничего не нашлось, возможно, кодировка пока не задана.

В модуле Аудит сайта можно создать проект для вашего домена и проверить, есть ли ошибка в кодировке. Создайте проект для сайта и укажите страницы, которые нужно проверить. Затем начните сканирование.

Сервис покажет все страницы, на которых была обнаружена ошибка, информацию по ней и рекомендацию по устранению.

Стандартные кодировки сайтов могут отличаться, все зависит от сайта. Поисковые машины распознают и проиндексируют текст все равно. Однако важно проверить, чтобы при его отображении не появлялись нечитаемые символы, иероглифы.

Ошибки встречаются, если кодировка сервера не совпадает с кодировкой сайта. И даже несмотря на то, что робот в этом случае сможет распознать контент и выдавать его в поисковой выдаче правильно, пользователи будут уходить.

Непонятный набор символов не несет никакой смысловой нагрузки и не вызывает доверия. Посетители не будут тратить время и усилия на самостоятельную настройку кодировки через браузер. Потому что не каждый знает, как это выполнить, или просто не посчитает необходимым терять свое время. Из-за этого будет падать посещаемость и, соответственно, доход.

Поэтому влияние кодировки на SEO — косвенное. Оно сосредоточено на поведенческих факторах, глубине просмотра и на показателе отказов.

Выделяют несколько этапов решения проблемы:

Источник

Как настроить кодировку сайта самостоятельно

Как узнать кодировку сайта. Смотреть фото Как узнать кодировку сайта. Смотреть картинку Как узнать кодировку сайта. Картинка про Как узнать кодировку сайта. Фото Как узнать кодировку сайта

В статье:

Разбираем, на что влияет кодировка, нужно ли указывать ее самостоятельно, и почему могут появиться так называемые «кракозябры» на сайте.

Зачем нужна кодировка

Кодировка (Charset) — способ отображения кода на экране, соответствие набора символов набору числовых значений. О ней сообщает строка Content-Type и сервер в header запросе.

Несовпадение кодировок сервера и страницы будет причиной появления ошибок. Если они не совпадают, информация декодируется некорректно, так что контент на сайте будет отображаться в виде набора бессвязных букв, иероглифов и символов, в народе называемых «кракозябрами». Такой текст прочитать невозможно, так что пользователь просто уйдет с сайта и найдет другой ресурс. Или останется, если ему не очень важно содержание:

Как узнать кодировку сайта. Смотреть фото Как узнать кодировку сайта. Смотреть картинку Как узнать кодировку сайта. Картинка про Как узнать кодировку сайта. Фото Как узнать кодировку сайтаСтудентка списывала реферат с формулами, а на сайте слетела кодировка. Реальная история

Google рекомендует всегда указывать сведения о кодировке, чтобы текст точно корректно отображался в браузере пользователя.

Кодировка влияет на SEO?

Разберемся, как кодировка на сайте влияет на индексацию в Яндекс и Google.

«Тип используемой на сайте кодировки не влияет на индексирование сайта. Если ваш сервер не передает в заголовке кодировку, робот Яндекса также определит ее самостоятельно».

Позиция Google такая же. Поисковики не рассматривают Charset как фактор ранжирования или сигнал для индексирования, тем не менее, она косвенно влияет на трафик и позиции.

Если кодировка сервера не совпадает с той, что указана на сайте, пользователи увидят нечитабельные символы вместо контента. На таком сайте сложно что-либо понять, так что скорее всего пользователи сбегут, а на сайте будут расти отказы.

Как узнать кодировку сайта. Смотреть фото Как узнать кодировку сайта. Смотреть картинку Как узнать кодировку сайта. Картинка про Как узнать кодировку сайта. Фото Как узнать кодировку сайтаПример страницы со слетевшей кодировкой

Поэтому она важна для SEO, хоть и влияет на него косвенно через поведенческие. Пользователи должны видеть читабельный текст на человеческом языке, чтобы работать с сайтом.

Виды кодировок

Существует довольно много видов, но сейчас распространены два:

Unicode Transformation Format — универсальный стандарт кодирования, который работает с символами почти всех языков мира. Символы могут занимать от 1 до 4 байт, такое кодирование позволяет создавать мультиязычные сайты.

Есть несколько вариантов — UTF-8, 16, 32, но чаще используют восьмибитное.

Windows-1251

Этот вид занимает второе место по популярности после UTF-8. Windows-1251 — кодирование для кириллицы, созданное на базе кодировок, использовавшихся в русификаторах операционной системы Windows. В ней есть все символы, которые используются в русской типографике, кроме значка ударения. Символы занимают 1 байт.

Выбор кодировки остается на усмотрение веб-мастера, но UTF-8 используют намного чаще — ее поддерживают все популярные браузеры и распознают поисковики, а еще ее удобнее использовать для сайтов на разных языках.

Как определить кодировку на сайте

Определить кодировку страницы своего или чужого сайта можно через исходный код страницы. Откройте страницу сайта, выберите «Просмотр кода страницы» (сочетание горячих клавиш Ctrl+U» в Google Chrome) и найдите упоминание «charset» внутри тега head.

На странице сайта используется кодировка UTF-8:

Как узнать кодировку сайта. Смотреть фото Как узнать кодировку сайта. Смотреть картинку Как узнать кодировку сайта. Картинка про Как узнать кодировку сайта. Фото Как узнать кодировку сайтаУказание кодировки в коде страницы

Узнать вид кодирования можно с помощью «Анализа сайта». Сервис проверяет в том числе и техническую сторону ресурса: анализирует серверную информацию, определяет кодировку, проверяет редиректы и другие пункты.

Как узнать кодировку сайта. Смотреть фото Как узнать кодировку сайта. Смотреть картинку Как узнать кодировку сайта. Картинка про Как узнать кодировку сайта. Фото Как узнать кодировку сайтаФрагмент анализа серверной информации сайта

С помощью этого же сервиса можно проверить корректность указанного кодирования. Аудит внутренних страниц «Анализа сайта» проверяет кодировку сервера и сравнивает ее с той, которая указана на внутренней странице. Найденные ошибки Анализ покажет в результатах проверки, и вы сразу узнаете, где нужно исправить.

Как узнать кодировку сайта. Смотреть фото Как узнать кодировку сайта. Смотреть картинку Как узнать кодировку сайта. Картинка про Как узнать кодировку сайта. Фото Как узнать кодировку сайтаОтчет о технических данных

Как узнать кодировку сайта. Смотреть фото Как узнать кодировку сайта. Смотреть картинку Как узнать кодировку сайта. Картинка про Как узнать кодировку сайта. Фото Как узнать кодировку сайтаКодировка сервера и страницы

Проверить кодировку еще можно через сервис Validator.w3, о котором писали в статье о проверке валидации кода. Нужная надпись находится внизу страницы.

Как узнать кодировку сайта. Смотреть фото Как узнать кодировку сайта. Смотреть картинку Как узнать кодировку сайта. Картинка про Как узнать кодировку сайта. Фото Как узнать кодировку сайтаКодировка сайта в валидаторе

Если валидатор не обнаружит Charset, он покажет ошибку:

Как узнать кодировку сайта. Смотреть фото Как узнать кодировку сайта. Смотреть картинку Как узнать кодировку сайта. Картинка про Как узнать кодировку сайта. Фото Как узнать кодировку сайтаОшибка указания кодировки

Но валидатор работает не точно: он проверяет только синтаксис разметки, поэтому может не показать ошибку, даже если кодирование указано неправильно.

Если кодировка не отображается

Если вы зашли на чужой сайт с абракадаброй, а вам все равно очень интересно почитать контент, то в Справке Google объясняют, как исправить кодирование текста через браузер.

О проблеме возникновения абракадабры на вашем сайте будут сигнализировать метрики поведения: вырастут отказы, уменьшится глубина просмотров. Но скорее всего вы и раньше заметите, что что-то пошло не так.

Главное правило — для всех файлов, скриптов, баз данных сайта и сервера должна быть указана одна кодировка. Ошибка может возникнуть, если вы случайно указали на сайте разные виды кодировки.

Яндекс советует использовать одинаковую кодировку для страниц и кириллических адресов структуры. К примеру, если робот встретит ссылку href=»/корзина» на странице с кодировкой UTF-8, он сохранит ее в этом же UTF-8, так что страница должна быть доступна по адресу «/%D0%BA%D0%BE%D1%80%D0%B7%D0%B8%D0%BD%D0%B0».

Где указать кодировку сайта

Если проблема возникла на вашем сайте, способ исправления зависит от вида сайта. Для одностраничника достаточно указать кодировку в мета-теге страницы, а для большого сайта есть разные варианты:

Кодировка в мета-теге

Добавьте указание кодировки в head файла шаблона сайта.

При создании документа HTML укажите тег meta в начале в блоке head. Некоторые браузеры могут не распознать указание кодировки, если оно будет ниже.

Мета-тег может выглядеть так:

В HTML5 они эквивалентны.

Как узнать кодировку сайта. Смотреть фото Как узнать кодировку сайта. Смотреть картинку Как узнать кодировку сайта. Картинка про Как узнать кодировку сайта. Фото Как узнать кодировку сайтаТег кодировки в HTML

В темах WordPress обычно тег «charset» с кодировкой указан по умолчанию, но лучше проверить.

Кодировка в файле httpd.conf

Инструкции для сервера находятся в файле httpd.conf, обычно его можно найти на пути «/usr/local/apache/conf/».

Если вам нужно сменить кодировку Windows-1251 на UTF-8, замените строчку «AddDefaultCharset windows-1251» на «AddDefaultCharset utf-8».

Осторожнее: если вы измените в файле кодировку по умолчанию, то она изменится для всех проектов на этом сервере.

Убедитесь, что сервер не передает HTTP-заголовки с конфликтующими кодировками.

Кодировка документа

Готовые файлы HTML важно сохранять в нужной кодировке сайта. Узнать текущую кодировку файла можно через Notepad++: откройте файл и зайдите в «Encoding». Меняется она там же: чтобы сменить кодировку на UTF-8, выберите «Convert to UTF-8 without BOOM». Нужно выбрать «без BOOM», чтобы не было пустых символов.

Кодировка Базы данных

Выбирайте нужную кодировку сразу при создании базы данных. Распространенный вариант — «UTF-8 general ci».

Где менять кодировку у БД:

С новой БД проще, но если вы меняете кодировку у существующей базы, то у созданных таблиц и колонок заданы свои кодировки, которые тоже нужно поменять.

Для всех таблиц, колонок, файлов, сервера и вообще всего, что связано с сайтом, должна быть одна кодировка.

Проблема может не решиться, если все дело в кодировке подключения к базе данных. Что делать:

Если вы хотите указать Windows-1251, то пишите не «utf-8», а «cp1251» — обозначение для кодировки Windows-1251 у MySQL.

Чтобы установить UTF-8 по умолчанию, откройте на сервере my.cnf и добавьте следующее:

Вы когда-нибудь сталкивались с проблемами кодировки на сайте?

Источник

Как узнать кодировку сайта?

Как узнать кодировку сайта. Смотреть фото Как узнать кодировку сайта. Смотреть картинку Как узнать кодировку сайта. Картинка про Как узнать кодировку сайта. Фото Как узнать кодировку сайта

Как узнать кодировку сайта. Смотреть фото Как узнать кодировку сайта. Смотреть картинку Как узнать кодировку сайта. Картинка про Как узнать кодировку сайта. Фото Как узнать кодировку сайта

Узнаём набор символов

В видео о том, как сделать поиск на сайте от Google я чуть упомянул про кодировку. А в этой маленькой статье опишу данный процесс текстом.

Сначала, кстати, рекомендую почитать статью «что такое кодировки текста«.

Если вы хотите знать, какова кодировка на страницах вашего интернет-проекта, то проще всего сделать это так:

Как узнать кодировку сайта. Смотреть фото Как узнать кодировку сайта. Смотреть картинку Как узнать кодировку сайта. Картинка про Как узнать кодировку сайта. Фото Как узнать кодировку сайта

Как узнать кодировку сайта. Смотреть фото Как узнать кодировку сайта. Смотреть картинку Как узнать кодировку сайта. Картинка про Как узнать кодировку сайта. Фото Как узнать кодировку сайта

Мета тег с кодировкой (UTF-8)

Поэтому можно в поиске ввести слово charset и посмотреть, что найдётся.

Вполне возможно, что ничего и не найдётся — значит кодировка не задана и её не узнать. Это не очень хорошо, поэтому лучше добавьте код:

Как узнать кодировку сайта. Смотреть фото Как узнать кодировку сайта. Смотреть картинку Как узнать кодировку сайта. Картинка про Как узнать кодировку сайта. Фото Как узнать кодировку сайта

Наверное, это всё про то, как можно узнать кодировку сайта. Хотя очень велика вероятность, что это будет UTF-8 (и вероятность поменьше, что будет windows-1251). Если, например, вы создали сайт на WordPress, то можете вообще не проверять — там точно UTF-8.

не получается установить у себя на странице
рекламу от wmlink
вот этот код

вообще не чего не появляется
помогите разобраться в чём причина

Здесь тоже не появилось.
Ну в любом случае — пишите им в Support.

Скажите, а вотя тоже не могу установить рекламу одной сети, а там в коде проскакивает 1251, это может влиять на отображение рекламы?

Да, конечно. Кодировки не совпадают, значит.

meta http-equiv=»X-UA-Compatible» content=»IE=edge»

Эта штука конкретно для Internet Explorer, посмотрите тут: habrahabr.ru/company/microsoft/blog/243215/

Сообщать мне о новых комментариях к этой статье

Источник

Непонятные символы на сайте. Как задать кодировку страницы?

Как узнать кодировку сайта. Смотреть фото Как узнать кодировку сайта. Смотреть картинку Как узнать кодировку сайта. Картинка про Как узнать кодировку сайта. Фото Как узнать кодировку сайта

Как узнать кодировку сайта. Смотреть фото Как узнать кодировку сайта. Смотреть картинку Как узнать кодировку сайта. Картинка про Как узнать кодировку сайта. Фото Как узнать кодировку сайта

Задаём набор символов

Думаю, раз уж я написал про то, как узнать кодировку сайта, то логично описать и то, как вообще её указывать на веб-странице. Но сначала надо описать, для чего это нужно делать.

Суть здесь в том, что браузер не может понять, в какой кодировке показывать текст открытой страницы.

Если кодировка не задана, то браузер может попытаться её угадать, но обычно у него это не получается и можно видеть какие-нибудь такие непонятные символы на сайте:

Как узнать кодировку сайта. Смотреть фото Как узнать кодировку сайта. Смотреть картинку Как узнать кодировку сайта. Картинка про Как узнать кодировку сайта. Фото Как узнать кодировку сайта

На картинке выше сделан скриншот заголовка данной статьи при несовпадении кодировки текста и кодировки в браузере. Т.к. тексты всего проекта web-ru.net в UTF-8, а просмотр был произведён в windows-1251, то показаны такие символы.

Как правило, ответственность за верное отображение всех текстов на веб-странице лежит на вебмастере и чтобы избежать этих маленьких проблем, следует сделать простые технические вещи.

Как задать кодировку страницы сайта?

Есть 3 способа сделать это. Но лучше их сразу совместить.

Файл(ы)

Необходимо чтобы файл страницы, или файлы шаблонов (если сайт на движке) были бы все в одной кодировке, например, в UTF-8. Почитайте, как сменить кодировку файла быстро.

Мета-тег

Нужно добавить на каждую страницу (или в шаблон шапки) специальный мета-тег, сообщающий браузеру о том, какой набор символов ему использовать для отображения текстов. Тег этот стандартный и выглядит обычно так:

Как узнать кодировку сайта. Смотреть фото Как узнать кодировку сайта. Смотреть картинку Как узнать кодировку сайта. Картинка про Как узнать кодировку сайта. Фото Как узнать кодировку сайта

Как узнать кодировку сайта. Смотреть фото Как узнать кодировку сайта. Смотреть картинку Как узнать кодировку сайта. Картинка про Как узнать кодировку сайта. Фото Как узнать кодировку сайта

Надо вставить его в раздел head — лучше в самое начало, сразу после открывающего head:

Как узнать кодировку сайта. Смотреть фото Как узнать кодировку сайта. Смотреть картинку Как узнать кодировку сайта. Картинка про Как узнать кодировку сайта. Фото Как узнать кодировку сайта

Для этого в нём нужно прописать такую строчку:

Вот и всё. Если вы примените последовательно 3 этих способа задания кодировки на своём проекте, то вероятность того, что всё будет отображено как надо, близка к 100 %.

Как «увидеть», что скрывается за непонятными символами на сайте?

Если вы зашли на веб-страницу, видите «кракозябры» и хотите увидеть нормальный текст, то тут только два пути:

К счастью, практически все современные веб-проекты делаются в кодировке UTF-8, которая является «универсальной» для разных алфавитов и поэтому всё менее и менее вероятно увидеть эти непонятные символы в Интернет.

Источник

HackWare.ru

Этичный хакинг и тестирование на проникновение, информационная безопасность

Как быстро узнать и преобразовать кодировку

Бывает, что в веб-браузере вместо читаемого текста показывается что-то вроде:

то есть совершенно нечитаемые символы.

Или так, когда английский символы показываются нормально, а вместо других символов знак процента и буквы с цифрами:

Бывают строки состоящие из больших и маленьких букв с цифрами, на конце может быть один или два знака равно:

Иногда приходится сталкиваться с текстом, в котором регулярно встречается обратный слэш с иксом (\x) после которого идут буквы и цифры:

Чтобы быстро расшифровать кодировку, даже когда вы не знаете как закодирована строка, воспользуйтесь бесплатным онлайн-сервисом по определению и преобразованию кодировки. Этот сервис скопирован отсюда http://0xcc.net/jsescape/.

Принцип работы очень простой — в окно вы вставляете строку в неизвестной кодировке, а сервис пытается преобразовать в каждую из поддерживаемых им кодировок. То есть если в поле Простой текст вы видите читаемый текст, значит ваша строка успешно расшифрована. Попробую понять смысл — Выполните Ð²Ñ Ð¾Ð´ или зарегистрируйтесь:

Как узнать кодировку сайта. Смотреть фото Как узнать кодировку сайта. Смотреть картинку Как узнать кодировку сайта. Картинка про Как узнать кодировку сайта. Фото Как узнать кодировку сайта

Получилось! Эта строка означает:

Теперь разберёмся со строкой:

Как узнать кодировку сайта. Смотреть фото Как узнать кодировку сайта. Смотреть картинку Как узнать кодировку сайта. Картинка про Как узнать кодировку сайта. Фото Как узнать кодировку сайта

Её значение оказалось:

А теперь посмотрим на сообщение из письма от мошенников:

Как узнать кодировку сайта. Смотреть фото Как узнать кодировку сайта. Смотреть картинку Как узнать кодировку сайта. Картинка про Как узнать кодировку сайта. Фото Как узнать кодировку сайта

Как определить кодировку

Некоторые часто встречающиеся кодировки вполне можно определить «на глаз». Определение кодировки невооружённым глазом может сильно ускорить процесс расшифровки строки или быстрее понять причину, почему текст выведен в таком виде.

URL кодировка

Стандарт URL использует набор символов US-ASCII. Это имеет серьёзный недостаток, поскольку разрешается использовать лишь латинские буквы, цифры и несколько знаков пунктуации. Все другие символы необходимо перекодировать. Например, перекодироваться должны буквы кириллицы, буквы с диакритическими знаками, лигатуры, иероглифы. Перекодирующая кодировка описана в стандарте RFC 3986 и называется URL-encoding, URLencoded или percent‐encoding.

Данные из веб-форм, когда Content-Type указан как application/x-www-form-urlencoded также передаются в URL кодировке.

Base64

Я почти уверен, что вы когда-либо видели сообщения в этой кодировке — они пишутся большими и маленькими латинскими буквами, а также цифрами. На конце может быть один или два знака равно:

В любом случае, почти наверняка вы используете эту кодировку почти каждый день, даже сами того не зная, поскольку сообщения электронной почты очень часто используют Base64, особенно для писем, к котором приложены файлы (фотографии, документы и прочее).

Base64 — стандарт кодирования двоичных данных при помощи только 64 символов ASCII. Алфавит кодирования содержит текстово-цифровые латинские символы A-Z, a-z и 0-9 (62 знака) и 2 дополнительных символа, зависящих от системы реализации. Каждые 3 исходных байта кодируются 4 символами (увеличение на ¹⁄₃).

Эта система широко используется в электронной почте для представления бинарных файлов в тексте письма (транспортное кодирование).

Указанный сервис также умеет декодировать из Base64, а также кодировать в Base64, но имеется особенность: довольно часто длинная строка Base64 в email разбивается на строки одинаковой длины (по причинам удобства). В сервисе, на который дана ссылка, нужно убрать лишние переводы строк, то есть вводимые данные должны быть в одну строку, иначе после первого символа «новая строка» сообщение будет декодировано неверно.

Кодировка UTF-8

Неправильно отображаемая кодировка UTF-8 выглядит как большие буквы N и D с дополнительными линиями, встречаются дроби 3/4.

В данном случае кодировка UTF-8 обработана как кодировка ISO-8859-1 или CP1258. С помощью указанного сервиса такие строки можно расшифровать если скопировать их в окна Quoted-printable или URL.

UTF-8 кодировка обработанная как ANSI напоминает строки из больших букв P, C, Г и маленьких букв r и s:

Экранированные последовательности

Экранированные последовательности особенно часто можно увидеть в исходном коде программ. Если вы хотите узнать, что означает строка записанная таким образом, то скопируйте её в одно из полей:

Такие строки используются в ситуациях, когда есть опасность, что написанные буквами национального алфавита строки исказятся (например, браузер неправильно поймёт кодировку веб-страницы):

Как конвертировать в экранированные последовательности

На этой же странице, как уже можно догадаться, можно конвертировать и в саму экранированную последовательность символов.

Если вы хотите углубить своё понимание строк, познакомиться с непечатанными символами, узнать что такое управляющие символы, узнать о других формах записи строк и о выполнении с ними логических операций, то рекомендуется для расширения кругозора статья «ASCII и шестнадцатеричное представление строк. Побитовые операции со строками».

Как изменить кодировку строки или документа без сторонних сервисов

Хотя показанный выше сервис НЕ отсылает введённые данные на сервер, а обходится исключительно с помощью JavaScript, запущенном в браузере пользователя, вполне возможно, что вы хотите изменить кодировку не используя сайты.

Double Commander при просмотре текстовых файлов (для этого выделите файл и нажмите F3) или при редактировании (F4) вы можете после открытия изменить кодировку, а также сохранить с другой кодировкой.

Как узнать кодировку сайта. Смотреть фото Как узнать кодировку сайта. Смотреть картинку Как узнать кодировку сайта. Картинка про Как узнать кодировку сайта. Фото Как узнать кодировку сайта

Ещё один вариант для тех, у кого Linux, — использовать командную строку. С помощью неё можно узнать кодировку непонятной строки, а также изменить её на правильную. Для этого смотрите статью «Как определить кодировку файла или строки. Как конвертировать файлы в кодировку UTF-8 в Linux».

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *