A vueltas con la codificación de caracteres.

Hacía una eternidad que no creaba una entrada en este blog, y de hecho el blog estaba desactivado después de ciertas desagradables experiencias de hacking por mantener versiones antiguas de WordPress.

Pero otra cosa también me impedía volver a poner el blog en marcha: en algún momento, en alguna actualización, la codificación de los textos de entradas, comentarios y páginas almacenados en la base de datos se estropeó.

Al ser un problema no especialmente común, creí que encontraría alguna herramienta para conectar a un servidor MySQL, seleccionar una tabla y un campo y volver a aplicar la codificación UTF-8, pero no he encontrado forma de hacerlo, así que he gastado media mañana en hacer una pequeña aplicación en Lazarus para hacer exactamente esto.

En realidad, hasta con Lazarus me he encontrado con problemas, ya que no he logrado conseguir que con ninguna de las funciones que vienen incluídas con el IDE, obligar a volver a decodificar un formato UTF-8 que, aunque está guardado como UTF-8, en realidad es una representación ANSI de una cadena UTF-8. Si, ya se que es un lío, pero es lo que hay.

Pero no sería el programador que soy si no tuviera respuesta a los problemas que se van acumulando, así que me he hecho yo mismo la función de conversión para reinterpretar una cadena UTF-8 desde y hacia una cadena UTF-8.

No estoy seguro si habrá mucha más gente que se encontrará en este mismo problema, pero por si acaso dejo aquí la descarga del programa.

El programa es freeware y si lo descargas estás aceptando que no tengo ninguna responsabilidad de lo que ocurra si usas correcta o incorrectamente este programa. Descargar.