Vim 中读写特殊字符

Unix Vim Windows 字符编码

在跨平台工作中由于不同编辑器处理换行和空白字符风格不一致, 常常在Vim下会看到一些特殊字符。这些特殊字符的含义可通过digraph-table查询, 也可根据digraph-table或Unicode/ASCII编码手动输入这些特殊字符。

查看特殊字符

Vim中可见特殊字符会直接显示,不可见特殊字符会显示为该字符在命令行的输入方式, 例如\r显示为^M。通过:help digraph-table可看到所有Vim中可输入的特殊字符, 该文档的第一页如下:

char  digraph  hex   dec   official name
^@      NU     0x00   0    NULL   (NUL)
^A      SH     0x01   1    START OF HEADING (SOH)
^B      SX     0x02   2    START OF TEXT (STX)
^C      EX     0x03   3    END OF TEXT (ETX)
^D      ET     0x04   4    END OF TRANSMISSION (EOT)
^E      EQ     0x05   5    ENQUIRY (ENQ)
^F      AK     0x06   6    ACKNOWLEDGE (ACK)
^G      BL     0x07   7    BELL (BEL)
^H      BS     0x08   8    BACKSPACE (BS)
^I      HT     0x09   9    CHARACTER TABULATION (HT)
^@      LF     0x0a   10   LINE FEED (LF)
^K      VT     0x0b   11   LINE TABULATION (VT)
^L      FF     0x0c   12   FORM FEED (FF)
^M      CR     0x0d   13   CARRIAGE RETURN (CR)

第一列为特殊字符,第二列为digraph(见下文),第三列为十六进制表示, 第四列为十进制表示,第五列为该字符的官方名称。

显示当前文件的二进制编码可输入:%!xxd,该命令会替换文件内容!恢复::%!xdd -r

通过digraph输入

Vim中显然没有什么特殊字符选择工具,但提供了两种输入特殊字符的方式:

  • 通过两个字符来输入一个特殊字符(digraph)。
  • 直接通过编码值(ASCII或Unicode)输入。

其中digraph是一种类似双拼的方法,连续输入两个字符来表示一个特殊字符。 需要先按下前导键<Ctrl-K>,例如在编辑模式下输入:

<Ctrl-K>Rg

将会出现®字符,其中"Rg"是该字符的digraph(双拼)。 所有的digraph可以通过:help digraph-table查询。

通过字符编码输入

除了digraph,还可直接通过字符编码来输入它,该字符不需要在Vim的digraph-table中。 这种方式也是在插入模式下进行的,需要先按下前导键<Ctrl-V>(Windows下<Ctrl-Q>)。 有下列5种方式:

  • 十进制值ASCII:^Vnnn (000 <= nnn <= 255)
  • 八进制值:^VOnnn 或 ^Vonnn (000 <= nnn <= 377)
  • 十六进制值:^VXnn or ^Vxnn (00 <= nn <= FF)
  • 十六进制BMP Unicode:^Vunnnn (0000 <= nnnn <= FFFF)
  • 十六进制任何Unicode:^VUnnnnnnnn (00000000 <= nnnnnnnn <= 7FFFFFFF)

上述操作都是在Unicode字符编码设置下进行的。例如:

<Ctrl-V>065

将会输出A字符,65是它的ASCII编码,而Unicode兼容ASCII。

换行的搜索/替换/输入

如果你还不了解Vim的搜索和替换,请移步在 Vim 中优雅地查找和替换

换行在Vim中的行为很特殊也不够一致,需要单独讨论一下。首先区分一下\r\n

  • 前者是回车(Carriage Return),在Vim中可通过<c-k>CR输入,显示为^M
  • 后者是换行(New Line),在Vim中通过<CR>(回车)键输入,显示为回车并换行;

所以对于Windows风格换行(\r\n)在Vim中会在每行结尾显示^M

替换

注意使用:s命令替换为换行(New Line)时,应当使用\r(相当于回车键)而不是\n。 例如将所有逗号替换为换行:

:%s/,/\r/g

如果使用\n则目标会被替换为空字符NULL(显示为^@)。

将DOS风格换行(\r\n)的文件转为Unix风格换行(\n)其实很简单,不需要手动查找替换:

:set fileformat=unix 
:w

搜索

在搜索模式(/)搜索换行时仍然应当使用\n字符,因为Vim的换行(Unix风格)确实是\n而不是\r\n。例如:

/foo\nbar

可以匹配到所有的:

foo
bar

查看不可见字符

除了特殊字符外,ASCII字符中还有大量的不可见字符,例如空格回车制表符等。 这些字符可以通过list变量来控制它们的显示与否:

" 显示隐藏字符
:set list
" 不显示隐藏字符
:set nolist
" 设置显示哪些隐藏字符
:set listchars=eol:$,tab:>-,trail:~,extends:>,precedes:<

参考阅读

Harttle

致力于简单的、一致的、高效的前端开发

看看这个?