Skip to content

Unicode, Dammit!

by Matthias Derer on August 21st, 2008

Man muss nicht nur Python lieben, auch dessen User sind knorke (jetzt konnte ich das Wort auch mal verwenden! @renke)
Die Library “BeautifulSoup“, welche sich zum Parsen schlechter HTML und XML Dokumente eignet, besitzt eine Klasse, welche Dokumente in das Unicode encoding umcodiert – egal, was diese davon halten. Und diese Klasse heißt doch tatsächlich UnicodeDammit.
Beautiful Soup uses a class called UnicodeDammit to detect the encodings of documents you give it and convert them to Unicode, no matter what.

]]>

Man muss nicht nur Python lieben, auch dessen User sind knorke (jetzt konnte ich das Wort auch mal verwenden! @renke)
Die Library “BeautifulSoup“, welche sich zum Parsen schlechter HTML und XML Dokumente eignet, besitzt eine Klasse, welche Dokumente in das Unicode encoding umcodiert – egal, was diese davon halten. Und diese Klasse heißt doch tatsächlich UnicodeDammit.
Beautiful Soup uses a class called UnicodeDammit to detect the encodings of documents you give it and convert them to Unicode, no matter what.

From → Uncategorized

No comments yet

Leave a Reply

Note: XHTML is allowed. Your email address will never be published.

Subscribe to this comment feed via RSS