Unicode, Dammit!
Man muss nicht nur Python lieben, auch dessen User sind knorke (jetzt konnte ich das Wort auch mal verwenden! @renke)
Die Library “BeautifulSoup“, welche sich zum Parsen schlechter HTML und XML Dokumente eignet, besitzt eine Klasse, welche Dokumente in das Unicode encoding umcodiert – egal, was diese davon halten. Und diese Klasse heißt doch tatsächlich UnicodeDammit.
“Beautiful Soup uses a class called UnicodeDammit to detect the encodings of documents you give it and convert them to Unicode, no matter what.“
]]>
Man muss nicht nur Python lieben, auch dessen User sind knorke (jetzt konnte ich das Wort auch mal verwenden! @renke)
Die Library “BeautifulSoup“, welche sich zum Parsen schlechter HTML und XML Dokumente eignet, besitzt eine Klasse, welche Dokumente in das Unicode encoding umcodiert – egal, was diese davon halten. Und diese Klasse heißt doch tatsächlich UnicodeDammit.
“Beautiful Soup uses a class called UnicodeDammit to detect the encodings of documents you give it and convert them to Unicode, no matter what.“





