Итерации кодировки utf8 и â символы в тексте. Как определить исходную и перекодировать?

392
09 января 2017, 23:52

Есть текст UTF-8 , в нем есть ряд символов вида

$bad_symbols = array('â', 'â','â','â');

"В жизни" на сайте эти символы выглядят как одинарные или двойные кавычки, тире.

Это популярная тема, гуглил и нашел ответ http://stackoverflow.com/questions/2477452/%C3%A2%E2%82%AC-showing-on-page-instead-of , но я не понимаю как участники с помощью таблиц вроде этой определяют исходную кодировку https://www.charset.org/utf-8 (какова механика действий?)

Я попробовал перекодировать эти символы, получил их в виде (что за вид, кстати?)

â = â

’ = ’

, но что мне делать с этим дальше? Как понять исходную кодировку? И как избавиться от этого, привести к нормальному виду? Если же не получается к нормальному виду привести, то хотя-бы как определить все строки с такими символами, может есть хук какой-то? Я сейчас решаю это вручную, нахожу все такие символы и str_replace - адовый костыль.

Также пробовал все возможные варианты ICONV

$z = 'Itâs a pity to cut beautiful curly hair. If itâs';
iconv('CP-1252','UTF-8',$z);
iconv('windows-1252','UTF-8',$z);
iconv('ISO-8859-1','UTF-8',$z);
iconv('UTF-8','ISO-8859-1',$z);
iconv('UTF-8','CP-1252',$z);
iconv('UTF-8','windows-1252',$z);

Результат всегда False , и ничего не меняется!

READ ALSO
В MySQL не добавляются данные моим парсером

В MySQL не добавляются данные моим парсером

Вот кусок моего кода, ответственный за запись в базу:

312
Дополнительные поля modx revo

Дополнительные поля modx revo

Всем привет, сделал допполя на форме по этому уроку

426
Simple Html Dom Parser, как исключить class?

Simple Html Dom Parser, как исключить class?

Парсинг страницы с помощью PHP Simple HTML Dom Parser:

370
Как включить подсказки для JavaScript в Eclipse?

Как включить подсказки для JavaScript в Eclipse?

Для Java, HTML, CSS подсказки работают, а для JavaScript нет

367