UTF8碼中文字排序錯誤/ 'sort' failed for zh_TW.UTF-8 on mac OSX (linux, at least mxlinux, is good)
UTF8 sorting likely relies on the encoding values, but not the UTF8 characters themselves.
中文字排序並非以筆劃,而是內碼排列。但是在linux 下內定不懂UTF8 排序。
I tried sort the following but failed.
嘗試排序以下文字,完全忽略不加變更。
checking export
看語言已經支援UTF-8了...
guessing it's the 'sort' command default encoding is ascii, not working on utf8. must use
必須更改 LC_ALL
now works
中文字排序並非以筆劃,而是內碼排列。但是在linux 下內定不懂UTF8 排序。
I tried sort the following but failed.
嘗試排序以下文字,完全忽略不加變更。
乾隆
光绪
咸丰
孔子
宣统
尼采
岳飞
牛顿
科尔
苏轼
趙微
道光
邵雍
陆游
雍正
顺治
严篙 # 奸臣
乾隆 # 帝王
何洁 # 藝人
光绪 # 帝王
刘欢 # 藝人
和坤 # 奸臣
咸丰 # 帝王
宣统 # 帝王
崇祯 # 帝王
康熙 # 帝王
慈禧 # 皇后
朱熹 # 文人
杨澜 # 藝人
林肯 # 帝王
歌德 # 文人
秦桧 # 奸臣
舒淇 # 藝人
看語言已經支援UTF-8了...
declare -x LANG="en_US.UTF-8"
guessing it's the 'sort' command default encoding is ascii, not working on utf8. must use
必須更改 LC_ALL
export LC_ALL=C
now works
严篙 # 奸臣
乾隆
乾隆 # 帝王
何洁 # 藝人
光绪
光绪 # 帝王
刘欢 # 藝人
和坤 # 奸臣
咸丰
咸丰 # 帝王
孔子
宣统
宣统 # 帝王
尼采
岳飞
崇祯 # 帝王
康熙 # 帝王
慈禧 # 皇后
朱熹 # 文人
杨澜 # 藝人
林肯 # 帝王
歌德 # 文人
牛顿
科尔
秦桧 # 奸臣
舒淇 # 藝人
苏轼
趙微
道光
邵雍
陆游
雍正
顺治
0 Comments:
Post a Comment
Subscribe to Post Comments [Atom]
<< Home