asp.net做的网站模板下载,公司网站 正式上线,深圳市官网网站建设报价,可以推广的平台参考资料
【 nkf 】コマンド――文字コードと改行コードを変換するnkfコマンドでファイルの文字コードと改行コードを統一する 目录 一. 前期准备二. 乱码现象与分析三. nkf命令3.1 nkf --guess 查看文件编码3.2 nkf -w8 UTF-8(BOM)编码显示3.3 nkf -wd --overwrite 覆盖源文件…参考资料
【 nkf 】コマンド――文字コードと改行コードを変換するnkfコマンドでファイルの文字コードと改行コードを統一する 目录 一. 前期准备二. 乱码现象与分析三. nkf命令3.1 nkf --guess 查看文件编码3.2 nkf -w8 UTF-8(BOM)编码显示3.3 nkf -wd --overwrite 覆盖源文件 一. 前期准备
⏹有如下文件business-content-1.csv
業務,時間,会社,コスト
販売,2025,JMW会社,1000円
中古,2024,清掃会社,2000円
看病,2023,病院小林,1566円
ゴミ回収,2025,長野県回収,7853円
テレビ改装,2589,東京都テレビ,4454152円⏹由下图可见
该csv文件的编码为Shift-JIS换行符为LF 二. 乱码现象与分析
我们直接使用cat命令打开文件的话可以看到终端窗口出现了乱码。 我们使用的是Tera Term连接工具默认编码为UTF-8格式而csv文本为Shift-JIS格式所以出现了乱码。
若我们将终端的显示编码改为Shift-JIS格式之后再次cat可以看到文件显示正常。 若不允许修改终端显示code使用nkf命令即可解决此问题。 三. nkf命令
nkfNetwork Kanji Filter命令是Linux和其他类Unix操作系统中的一个命令行工具用于进行字符编码转换。它主要用于在不同字符编码之间转换文本以及进行换行符的转换。
⏹输出配置项
短配置项長配置项意味-j--jisJISコードを出力するデフォルト-e--eucEUCコードを出力する-s--sjisシフトJISコードを出力する-w,-w80UTF-8コードを出力するBOMなし-w8UTF-8コードを出力するBOM有り-w16,-w16B0UTF-16コードを出力するビッグエンディアンBOMなし-w16BUTF-16コードを出力するビッグエンディアンBOM有り-w16LUTF-16コードを出力するリトルエンディアンBOM有り-w16L0UTF-16コードを出力するリトルエンディアンBOMなし-IISO-2022-JP以外の漢字コードを「〓げた記号」に変換する--oc 文字コード出力する文字コードを「EUC-JP」や「UTF-8」などで指定する--overwriteファイルを変換して上書きする
⏹换行符配置项
短配置项長配置项意味-d,-Lu改行をLFにするUNIX系-c,-Lw改行をCRLFにするWindows系-Lm改行をCRにするOS Xより前のmac OS系
3.1 nkf --guess 查看文件编码
nkf --guess ./business-content-1.csv
# Shift_JIS (LF)3.2 nkf -w8 UTF-8(BOM)编码显示
显示前3行使用utf-8编码显示
cat ./business-content-1.csv | head -3 | nkf -w8
head -3 ./business-content-1.csv | nkf -w8業務,時間,会社,コスト
販売,2025,JMW会社,1000円
中古,2024,清掃会社,2000円3.3 nkf -wd --overwrite 覆盖源文件
w使用UTF-8(无BOM)模式编码w8使用UTF-8(有BOM)模式编码d将换行符改为 LF