TeX 的宏 \ 第一集

Garfileo posted @ 2010年5月21日 18:56 in LuaTeX 道阻且长 with tags tex luatex , 6125 阅读

以 ‘\’ 为开头的 TeX 命令被称为“控制序列”。如果一个控制序列仅由字母组成，将其称为“控制字”。如果一个控制序列由非字母构成，将其称为“控制符”。对于 TeX 用户使用 \def 定义的新的控制序列，将其称为“宏”。

把它嚼碎

\def\vec{$A_1,A_2,\ldots,A_n$} 定义了 \vec 宏，这个宏的值是一串“token（记号）”。所谓 token，其为 TeX 对文稿（即 .tex 文件）进行初步处理后所生成的中间数据，提供给 TeX 内部的后续处理过程使用。一个 token，可以是一个字符，可以是一个控制序列，也可以是一个参数。由 TeX 文稿生成 token 的过程，经常被比喻为食物在口中被牙齿嚼碎的过程。TeX 文稿被嚼碎后，还要被传送到食道、胃以及肠道等器官内依序处理。

若一个宏被定义，它的值会被保存在一个表中，以便 TeX 对该宏展开时使用。注意，囊括宏值的括号需要对称出现。

看这样一个例子：\def\abc{1 \x a}。宏 \abc 会被 tex 程序嚼碎为 4 个 token：

“1”，其 catecode 为 12，所属类别为其他字符（数字、符号等）
“ ”，其 catecode 为 10，所属类别为空格
“\x ”，无 catecode，所属类别为控制序列
“a”，其 catecode 为 11，所属类别为字母

要使用一个已定义的宏，输入其名称即可。例如输入 \vec，即调用前面所定义的那个宏。tex 程序在处理文稿时，遇到 \vec，就将其展开，即从保存宏值的表中复制其值并替换。

tex 程序在咀嚼 TeX 文稿的过程中，遇到宏的定义语句，只是简单的将宏的定义转化为一系列 token，然后找块内存空间存放起来。只有在宏被调用时，tex 程序方对其进行展开处理，从内存中调出其对应 token 系列，然后对其中的每个 token 作以下处理：如果是字符 token，就排版显示；如果是宏 token，就进一步展开；如果是 TeX 的基本命令，就执行。

来看这样一个另类的例子：\def\test{\catcode`\\=12 \everypar{*}}。在 \test 宏的定义中，首先使用 \catcode`\\=12 将字符 “\” 的 catecode 修改为 12，即将 “\” 作为很普通的字符，然后又使用控制序列 \everypar{*} 实现在每个段落之前添加“*”字符。这个示例的另类之处在于给 TeX 新手造成了一点点字面上的悬念：既然已将字符 “\” 定义为一般字符，那么 \everypar 就应该失效。一定不要忘记：宏在定义时，其值所包含的控制序列仅仅被 tex 程序转化为 token，并不执行它们。

事实上，对于上例所定义的 \test 宏，即使调用它，也不会出错，\everypar 工作正常。这是因为 tex 程序在处理宏的定义时，已将 \everypar 转化为 token 并保存。在调用 \test 时，即便 \catcode 会篡改 “\” 的本意，但它不会影响 \everypar，只会影响 \test 宏调用语句之后的控制序列。

藉由参数而变化

宏可以节省 TeX 文稿的输入时间，因为我们可将需要频繁输入的一些文字信息定义为简单的宏并使用。事实上，宏最大的妙用就是赋予其参数后所产生的各种变化，像 LaTeX 与 ConTeXt 格式，皆由 TeX 所变。

上一节所定义的宏 \vec，现在对其重新定义并赋予它两个参数：\def\vec#1#2{$#1_1,#1_2,\ldots,#1_{#2}$}。这样，如果我们想输入 $a_1,a_2,...,a_n$ 或者 $b_1,b_2,...,b_10$ 这样的向量，只需调用宏 \vec an 或 \vec b{10} 即可。在宏的定义中，我们将“#1” 与“#2”这种形式所表示的参数称为“形参”；而在调用宏时，例如 \vec an，我们将“a” 和“n”称为“实参”。

对于 \def\abc#1{#1}，tex 程序将其嚼碎后可得：\def, \abc, #1, {, #1, }。

要注意的是，在调用有参数的宏时，如果参数的字符超过 1 个，需要用编组符号（一般为“{”与“}”）将其囊括起来。例如对于 \def\test#1#2#3{#1, #2, #3} 定义的宏，使用 \test abc def ghk 来调用，那么 \test 的参数 #1, #2, #3 分别为 a, b, c。若想将“abc”，“def”和“ghk”作为 \test 的参数，则宏的调用方式为 \test{abc}{def}{ghk}。

在定义宏的时候，可为其参数添加一些定界符。例如 \def\test[#1][#2]{#1 and #2}，可通过形如 \test[param1][param2] 的方式调用。一般，为参数添加定界符，主要目的是让宏的调用代码看起来优雅一些。一个比较复杂的参数定界示例如下：

\def\ifempty#1\\{\ifemp#1\endA\endB}
\def\ifemp#1#2\endB{\ifx#1\endA}

所定义的宏 \ifempty 用于测试其参数是否为空，它只接受 1 个参数，且以 \\ 作为定界符，也就是说，\ifempty 的调用形式为 \ifempty xxx\\，位于 \ifempty 与 \\ 之间的字符串 xxx 是 \ifempty 的参数。下面通过代入具体的参数用以分析 \ifempty 的展开过程：

若参数为字符串“abc”，\ifempty 展开可得 \ifemp abc\endA\endB。此时“abc”中，“a” 为 \ifemp 的第一个参数，而“bc\endA” 为其第二个参数。对 \ifemp 进一步展开，可得 \ifx a\endA，此时“a”与“\endA” 定然是不相等的，因此本例中 \ifempty 的测试结果为 false。
若参数为空值，\ifempty 展开可得 \ifemp \endA\endB。此时\ifemp 的第一个参数为“\endA”，第二个参数为空。对 \ifemp 进一步展开，可得 \ifx \endA\endA，此时“\endA”与“\endA” 定然是相等的，因此本例中 \ifempty 的测试结果为 true。

宏的命名规则

宏的命名必然要遵循 TeX 控制序列的命名规范，即只能使用字母或单个非字母字符进行命名。但是，在了解宏的参数定界符的概念之后，假象上可认为宏的命名之后也可以是字母与非字母字符的混合物，虽然这样通常很危险。

例如\def\test1{...}，看上去是定义了一个名为“\test1”的宏，实际上定义的却是“\test”，那个数字“1”不过是“\test”的参数定界符而已，尽管“\test”并无参数。如果继续有\def\test2{...}，会把 tex 程序搞的很郁闷，它可能会提醒你：

    ! Use of \test doesn't match its definition.

转载时，希望不要链接文中图片，另外请保留本文原始出处：http://garfileo.is-programmer.com

相关文章
全局相关文章

# emerge -e world

抱怨，除了可用于彰显自己的懦弱之外一无是处！

TeX 的宏 \ 第一集

把它嚼碎

藉由参数而变化

宏的命名规则

分类

标签云

最新评论

最新留言