PHP und UTF-8 – eine Anleitung, Einleitung

Es ist kein Geheimnis, dass PHP und Multibyte-Zeichensätze wie etwa UTF-8 nicht gut zusammen gehen. Dies hat drei Gründer:

  • Die meisten PHP-Funktionen setzen wie selbstverständlich ANSI-Strings voraus, etwa die meisten String-Funktionen
  • Bei PHP-Funktionen, die Multibyte-Zeichensätze verarbeiten können, wie etwa htmlentities(), werden diese nicht benutzt.
  • Und last not least ist der korrekte Einsatz von MySQL und UTF-8 auch nicht einfach.

Ich werden diesen drei Problemfeldern nachspüren.

Teil 1: UTF-8 und MySQL

Teil 2: Webseiten als UTF-8 ausliefern

Teil 3: PHP String Funktionen

Exkurs: Exkurs: Falsche Daten in der DB fixen

Published: November 22 2007