auの日記

プログラミング初心者の日記。(auはハンドルネームです)

Pythonで\u200bと\u3000を消す方法

auです。

CSVファイルを開いた際に、「\u200bや\u3000」といった文字コードを見ることがあります。

これを消す際に行う処理を見つけたので、残しておきます。

\u200bと\u3000とは

そもそもこいつらは、半角空白の文字コードと、全角空白の文字コードです。

print(title[0])

のように、1行だけ表示する際には大丈夫ですが

print(title_list)

のように、まとめて表示する際に、この文字コードが表示されました。なぜだろう?

対処法

対処法は以下のようにします。

title.replace('\u200b', '')
title.replace('\u3000', '')

replaceで、該当の文字列を置換しているだけですね。

これだけで消去することができたので、困っている人はやってみてください。