Decodificar caracteres a UTF-8

Email this to someoneShare on FacebookShare on Google+Share on LinkedInTweet about this on Twitter

Uno de los problemas más comunes en programación son los caracteres extraños que aparecen dentro de una cadena PHP causados por su codificación en latín. Con la siguiente función en PHP conseguiremos buscar y reemplazar utilizando str_replace() esos caracteres por los mismos ya codificados en UTF8.

PHP: función para decodificar caracteres a UTF-8

function decodificar_utf8($cadena){

$buscar = array(
‘À’, ‘Á’, ‘Â’, ‘Ã’, ‘Ä’, ‘Å’, ‘Æ’, ‘Ă’, ‘Ą’,
‘Ç’, ‘Ć’, ‘Č’, ‘Œ’,
‘Ď’, ‘Đ’,
‘à’, ‘á’, ‘â’, ‘ã’, ‘ä’, ‘å’, ‘æ’, ‘ă’, ‘ą’,
‘ç’, ‘ć’, ‘č’, ‘œ’,
‘ď’, ‘đ’,
‘È’, ‘É’, ‘Ê’, ‘Ë’, ‘Ę’, ‘Ě’,
‘Ğ’,
‘Ì’, ‘Í’, ‘Î’, ‘Ï’, ‘İ’,
‘Ĺ’, ‘Ľ’, ‘Ł’,
‘è’, ‘é’, ‘ê’, ‘ë’, ‘ę’, ‘ě’,
‘ğ’,
‘ì’, ‘í’, ‘î’, ‘ï’, ‘ı’,
‘ĺ’, ‘ľ’, ‘ł’,
‘Ñ’, ‘Ń’, ‘Ň’,
‘Ò’, ‘Ó’, ‘Ô’, ‘Õ’, ‘Ö’, ‘Ø’, ‘Ő’,
‘Ŕ’, ‘Ř’,
‘Ś’, ‘Ş’, ‘Š’,
‘ñ’, ‘ń’, ‘ň’,
‘ò’, ‘ó’, ‘ô’, ‘ö’, ‘ø’, ‘ő’,
‘ŕ’, ‘ř’,
‘ś’, ‘ş’, ‘š’,
‘Ţ’, ‘Ť’,
‘Ù’, ‘Ú’, ‘Û’, ‘Ų’, ‘Ü’, ‘Ů’, ‘Ű’,
‘Ý’, ‘ß’,
‘Ź’, ‘Ż’, ‘Ž’,
‘ţ’, ‘ť’,
‘ù’, ‘ú’, ‘û’, ‘ų’, ‘ü’, ‘ů’, ‘ű’,
‘ý’, ‘ÿ’,
‘ź’, ‘ż’, ‘ž’,
‘А’, ‘Б’, ‘В’, ‘Г’, ‘Д’, ‘Е’, ‘Ё’, ‘Ж’, ‘З’, ‘И’, ‘Й’, ‘К’, ‘Л’, ‘М’, ‘Н’, ‘О’, ‘П’, ‘Р’,
‘а’, ‘б’, ‘в’, ‘г’, ‘д’, ‘е’, ‘ё’, ‘ж’, ‘з’, ‘и’, ‘й’, ‘к’, ‘л’, ‘м’, ‘н’, ‘о’, ‘р’,
‘С’, ‘Т’, ‘У’, ‘Ф’, ‘Х’, ‘Ц’, ‘Ч’, ‘Ш’, ‘Щ’, ‘Ъ’, ‘Ы’, ‘Ь’, ‘Э’, ‘Ю’, ‘Я’,
‘с’, ‘т’, ‘у’, ‘ф’, ‘х’, ‘ц’, ‘ч’, ‘ш’, ‘щ’, ‘ъ’, ‘ы’, ‘ь’, ‘э’, ‘ю’, ‘я’
);

$remplazar = array(
‘A’, ‘A’, ‘A’, ‘A’, ‘A’, ‘A’, ‘AE’, ‘A’, ‘A’,
‘C’, ‘C’, ‘C’, ‘CE’,
‘D’, ‘D’,
‘a’, ‘a’, ‘a’, ‘a’, ‘a’, ‘a’, ‘ae’, ‘a’, ‘a’,
‘c’, ‘c’, ‘c’, ‘ce’,
‘d’, ‘d’,
‘E’, ‘E’, ‘E’, ‘E’, ‘E’, ‘E’,
‘G’,
‘I’, ‘I’, ‘I’, ‘I’, ‘I’,
‘L’, ‘L’, ‘L’,
‘e’, ‘e’, ‘e’, ‘e’, ‘e’, ‘e’,
‘g’,
‘i’, ‘i’, ‘i’, ‘i’, ‘i’,
‘l’, ‘l’, ‘l’,
‘N’, ‘N’, ‘N’,
‘O’, ‘O’, ‘O’, ‘O’, ‘O’, ‘O’, ‘O’,
‘R’, ‘R’,
‘S’, ‘S’, ‘S’,
‘n’, ‘n’, ‘n’,
‘o’, ‘o’, ‘o’, ‘o’, ‘o’, ‘o’,
‘r’, ‘r’,
‘s’, ‘s’, ‘s’,
‘T’, ‘T’,
‘U’, ‘U’, ‘U’, ‘U’, ‘U’, ‘U’, ‘U’,
‘Y’, ‘Y’,
‘Z’, ‘Z’, ‘Z’,
‘t’, ‘t’,
‘u’, ‘u’, ‘u’, ‘u’, ‘u’, ‘u’, ‘u’,
‘y’, ‘y’,
‘z’, ‘z’, ‘z’,
‘A’, ‘B’, ‘B’, ‘r’, ‘A’, ‘E’, ‘E’, ‘X’, ‘3’, ‘N’, ‘N’, ‘K’, ‘N’, ‘M’, ‘H’, ‘O’, ‘N’, ‘P’,
‘a’, ‘b’, ‘b’, ‘r’, ‘a’, ‘e’, ‘e’, ‘x’, ‘3’, ‘n’, ‘n’, ‘k’, ‘n’, ‘m’, ‘h’, ‘o’, ‘p’,
‘C’, ‘T’, ‘Y’, ‘O’, ‘X’, ‘U’, ‘u’, ‘W’, ‘W’, ‘b’, ‘b’, ‘b’, ‘E’, ‘O’, ‘R’,
‘c’, ‘t’, ‘y’, ‘o’, ‘x’, ‘u’, ‘u’, ‘w’, ‘w’, ‘b’, ‘b’, ‘b’, ‘e’, ‘o’, ‘r’
);

return str_replace($buscar, $remplazar, $cadena);

}

En bufa.es nos dan algúnos consejos para evitar futuros problemas con la codificación de caracteres de vuestra base de datos MySql:

– Comprobar que los campos string estén en utf8_spanish_ci y el cotejamiento de las tablas en utf_unicode_ci

– Utilizar el siguiente metatag en la cabecera de las páginas:

<meta http-equiv=”Content-type” content=”text/html; charset=utf-8″ />

– Para PHP, insertar el siguiente código justo antes de vuestra query:

mysql_query(“SET NAMES ‘utf8′”);

Un comentario

  1. hepabest.com dijo:
    11 julio, 2014
    Responder

    hepabest.com…

    Decodificar caracteres a UTF-8 – Blog Adpv…

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

De conformidad con lo establecido en la LOPD, Adpv Advertising Provider S.L. garantiza la adopción de las medidas necesarias para asegurar el tratamiento confidencial de los datos de carácter personal. Así mismo le informamos de la inclusión de sus datos en un fichero con la finalidad de mantener su relación negocial o contractual con Adpv Advertising Provider S.L. y de la posibilidad de ejercer los derechos de acceso, rectificación, cancelación y oposición en la siguiente dirección: Ercilla, 26, 1Dcha., 48011, Bilbao, Bizkaia. Privacidad.