markdown-it的文档和语法确实有点难理解, 我也只琢磨出了我想要的插件的写法, 所以 这篇文章目前应该叫: 为markdown-it编写一个渲染自定义块语法的插件.
我也是看着几个关键字(也就是文档的一级目录, 如Ruler, Token),看了 解析,再去看看其他插件是怎么写的, 才猜得略知一二。
介于其他资料只是写了原理,而没有写如何修改, 所以我就再输出一下我的思路。
Token
Token是最终会被渲染的数据结构,Ruler会将# hello
转换为如下token (以简化)。
{
render: 'h1',
content: 'hello'
}
这个数据格式能很方便的渲染成HTML。
Ruler
Ruler将md转换为另一个语法: Token,在markdown-ite中Ruler分两种, 分别对应解析block和inline的Ruler
- block: 多行的语法, 如 code, table 等
- inline: 单行的语法, 如
# *
等
其中block优先级高, 需要先执行。如果要自定义插件去解析md, 则一定需要写这个。
Parsing
运行Ruler的东西就叫Parsing,一个Parsing中有多个Ruler,他们执行有先后。在markdown-it中有两个Parsing,分别是block和inline。block始终比inline先执行.
Render
Render就是将token渲染成为HTML。如果要自定义插件去解析md, 则一定需要写这个。#
的渲染函数如下
function render(tokens, idx){
let content = tokens[idx].content;
return '<h1>'+content+'</h1>'
}
总结流程
当markdown-it实例创建出来,就会生成几个默认的东西,ParsingBlock,ParsingInline 以及它们的默认Rulers。
首先运行ParsingBlock之中的Rules去解析一次md,再运行ParsingInline的Rules,将两次得到的Token组合在一起(具体怎么组合我没深入了)就可以交由Render渲染了。
如何写
我们如果要自定义语法, 就需要自定义Rules用来解析语法和Render用来渲染语法。这里我建议读者去参考官方插件的写法, 就这点官方文档, 想从零写插件基本不可能。
- 如果想编写自定义
容器
, 可以看markdown-it-container - 如果想编写
块
, 可以看markdown-it-math - 如果想编写
inline
, 可以看markdown-it-mark - 容器: 只是给目标内容添加一个包裹层, 不会影响其中内容的渲染, 如果你要做折叠效果的话就应该使用这个语法.
- 块: 多行语法, 如table, 整个块中的内容就交由这个语法渲染.
- inline: 一行的语法, 如#
我在做以上需求的时候,就是抄的markdown-it-math,不多说了, cv走起。只需要两行代码:
// 由于我们要覆盖默认的code的解析器, 所以需要在code之前添加.
md.block.ruler.before('code', 'yaml2json', block);
md.renderer.rules.yaml2json = render;
然后再写100行
let open = '``` yaml'
let close = '```'
function block(state, startLine, endLine, silent) {
var openDelim, len, params, nextLine, token, firstLine, lastLine, lastLinePos,
haveEndMarker = false,
pos = state.bMarks[startLine] + state.tShift[startLine],
max = state.eMarks[startLine];
if (pos + open.length > max) {
return false;
}
openDelim = state.src.slice(pos, pos + open.length);
if (openDelim !== open) {
return false;
}
pos += open.length;
firstLine = state.src.slice(pos, max);
// Since start is found, we can report success here in validation mode
if (silent) {
return true;
}
if (firstLine.trim().slice(-close.length) === close) {
// Single line expression
firstLine = firstLine.trim().slice(0, -close.length);
haveEndMarker = true;
}
// search end of block
nextLine = startLine;
for (; ;) {
if (haveEndMarker) {
break;
}
nextLine++;
if (nextLine >= endLine) {
// unclosed block should be autoclosed by end of document.
// also block seems to be autoclosed by end of parent
break;
}
pos = state.bMarks[nextLine] + state.tShift[nextLine];
max = state.eMarks[nextLine];
if (pos < max && state.tShift[nextLine] < state.blkIndent) {
// non-empty line with negative indent should stop the list:
break;
}
if (state.src.slice(pos, max).trim().slice(-close.length) !== close) {
continue;
}
if (state.tShift[nextLine] - state.blkIndent >= 4) {
// closing block math should be indented less then 4 spaces
continue;
}
lastLinePos = state.src.slice(0, max).lastIndexOf(close);
lastLine = state.src.slice(pos, lastLinePos);
pos += lastLine.length + close.length;
// make sure tail has spaces only
pos = state.skipSpaces(pos);
if (pos < max) {
continue;
}
// found!
haveEndMarker = true;
}
// If math block has heading spaces, they should be removed from its inner block
len = state.tShift[startLine];
state.line = nextLine + (haveEndMarker ? 1 : 0);
token = state.push('yaml2json', 'yaml2json', 0);
token.block = true;
token.content = (firstLine && firstLine.trim() ? firstLine + '\n' : '') +
state.getLines(startLine + 1, nextLine, len, true) +
(lastLine && lastLine.trim() ? lastLine : '');
token.info = params;
token.map = [startLine, state.line];
token.markup = open;
return true;
}
block方法我也理解不了,说实话还是好复杂,我就cv了刚刚提到的math插件并且删掉了不用的代码。其实这么多代码只是为了获取从开始标记到结束标记的块的内容。
import yaml from 'js-yaml'
function render(tokens, idx) {
let content = tokens[idx].content;
let y = yaml.load(content)
let html = JSON.stringify(y, null, 4)
return '<pre>'+html+'</pre>';
}
render的入参和出参都和简单, 一看就懂。由于我们覆盖掉了默认的code解析器,所以就没有代码高亮功能了。我没有这个需求, 所以我可以这样写,这样写的好处是不会污染ruler代码。如果你需要代码高亮功能,可以不自定义render而使用默认的code的render,那么解析YAML的代码就应该写在ruler里。或者你还可以使用 hightlight-js 插件自己去高亮代码。