「String」タグアーカイブ

Pythonでnkf

Pythonで文字コードが不明な文字列（例えばインターネット上のHTMLは文字コードが間違っている場合があります）はnkfを使うと簡単に取り扱うことができるみたいです。

# emerge -pv app-i18n/nkf

These are the packages that would be merged, in order:

Calculating dependencies... done!
[ebuild   R    ] app-i18n/nkf-2.0.7  USE="python -perl"

USEフラグにpythonを付けているとPythonからnkfが使えます。

>>> import nkf
>>> nkf.nkf('-w', 'こんにちは').decode('utf-8')
u'\u3053\u3093\u306b\u3061\u306f'

手軽なので重宝しそうです。

xyzzyで開いたファイルの文字コードを変更

コメントを残す

ファイルを開いた後で文字コードを変更する手順

C-u M-x revert-buffer

として、変換したい文字コードを入力

Encoding: sjis

リンク

xyzzy – カスタマイズ可能で軽快な Windows 用テキストエディタ
http://xyzzy-022.github.io/

数値文字参照への変換

コメントを残す

文字列を数値文字参照に変換するツールを作ってみました。

~~数値文字参照への変換ツール~~
（サーバー移転に伴いサービス終了しました。）

数値文字参照を使うと、例えばaという文字は次のようにも表記できます。

10進数による表記	16進数による表記
a	a

Webサイトにメールアドレスを書く際、直接アドレスを書く代わりに数値文字参照を使ってボットに収集され難くする利用を想定しています。

ただ、昔ならともかく、現在ではどこまで効果があるのか不明です。

My note

パソコンやプログラミング関連で勉強したことの覚え書き

「String」タグアーカイブ

Pythonでnkf

xyzzyで開いたファイルの文字コードを変更

リンク

数値文字参照への変換