前言
大家都知道,Ubuntu系统对中文的支持还是比较友好,除了对TEXT文件编码的识别有点问题以外。
gedit直接打开中文txt文件
出现这种问题的原因是txt文件是在Windows环境下生成,Ubuntu下文本阅读器如vim和gedit对文件编码格式不能自动识别。
这里给出几种可能的解决方案。
文件格式转换
利用 dos2unix unix2dos unix2mac 等命令将txt文件从源操作系统转换到目标操作系统。
如果这几个命令不存在,请使用下面的命令进行安装。
sudo apt install dos2unix sudo apt install unix2dos
使用如下命令进行格式转换:
dos2unix [options] [FILE ...] [-n INFILE OUTFILE ...] unix2dos [options] [FILE ...] [-n INFILE OUTFILE ...]
这种转换会改变原来文件的一些属性如生成时间等。如果文件需要从两个不同操作系统进行访问时,这个解决方案是不合适的。
.VIMRC设置缺省编码格式
这个解决方案适合我这样的vim爱好者。
解决问题的方法是按照下图修改 /etc/vim/vimrc 或者是 /etc/vim/vimrc.local 文件。
/etc/vim/vimrc中会调用/etc/vim/vimrc.local。修改两者中任一个都行。推荐修改/etc/vim/vimrc.local。
然后再次使用vim打开同样的文件,bingo,搞定。
gedit强制限定编码打开
gedit是Ubuntu下强大的文本编辑软件。直接使用gedit来打开中文txt文件是最有吸引力的解决方案。
其实这个解决方案更简单。
首先使用 chardet3 来检测文件的编码格式。
chardet3 常用的正则表达式总结.txt
运行的结果显示该文件的编码格式是GB2312:
常用的正则表达式总结.txt: GB2312 with confidence 0.99
知道了编码格式后可以在运行gedit时加入encoding选项,如下
gedit --encoding GB2312 常用的正则表达式总结.txt
同样可以正常打开该txt文件,如下图所示。
总结
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,如果有疑问大家可以留言交流,谢谢大家对的支持。
稳了!魔兽国服回归的3条重磅消息!官宣时间再确认!
昨天有一位朋友在大神群里分享,自己亚服账号被封号之后居然弹出了国服的封号信息对话框。
这里面让他访问的是一个国服的战网网址,com.cn和后面的zh都非常明白地表明这就是国服战网。
而他在复制这个网址并且进行登录之后,确实是网易的网址,也就是我们熟悉的停服之后国服发布的暴雪游戏产品运营到期开放退款的说明。这是一件比较奇怪的事情,因为以前都没有出现这样的情况,现在突然提示跳转到国服战网的网址,是不是说明了简体中文客户端已经开始进行更新了呢?
更新日志
- 小骆驼-《草原狼2(蓝光CD)》[原抓WAV+CUE]
- 群星《欢迎来到我身边 电影原声专辑》[320K/MP3][105.02MB]
- 群星《欢迎来到我身边 电影原声专辑》[FLAC/分轨][480.9MB]
- 雷婷《梦里蓝天HQⅡ》 2023头版限量编号低速原抓[WAV+CUE][463M]
- 群星《2024好听新歌42》AI调整音效【WAV分轨】
- 王思雨-《思念陪着鸿雁飞》WAV
- 王思雨《喜马拉雅HQ》头版限量编号[WAV+CUE]
- 李健《无时无刻》[WAV+CUE][590M]
- 陈奕迅《酝酿》[WAV分轨][502M]
- 卓依婷《化蝶》2CD[WAV+CUE][1.1G]
- 群星《吉他王(黑胶CD)》[WAV+CUE]
- 齐秦《穿乐(穿越)》[WAV+CUE]
- 发烧珍品《数位CD音响测试-动向效果(九)》【WAV+CUE】
- 邝美云《邝美云精装歌集》[DSF][1.6G]
- 吕方《爱一回伤一回》[WAV+CUE][454M]