Minimax Pdf

📄 学术级 PDF 排版,HTML 驱动

HTML-first PDF生成技能,专为报告、论文等长文档设计,确保Linux环境下稳定的分页布局、可搜索文本与专业学术风格输出。

收藏
6.2k
安装
3k
版本
1.0.0
CLS 安全性认证2026-05-08
点击查看完整报告 >

使用说明

minimax-pdf 技能评估

核心用途

minimax-pdf 是一套面向学术与专业场景的 HTML-to-PDF 转换技能,核心定位是替代传统 LaTeX/Word 排版工作流,通过标准化 HTML 模板生成印刷级 PDF 文档。其设计哲学强调"稳定性优先"——在 Linux 服务器运行时保证分页可控、文本可选、链接可点,而非追求浏览器端的视觉炫技。

显著优点

1. 工程化约束体系
技能文档以"Hard Constraints"形式明确禁止 screenshot/print hacks、Paged.js 手动注入、动态图表库等不稳定路径,大幅降低跨环境翻车概率。对 CSS counters、emoji 装饰、深色主题等易踩坑点均有黑名单管控。

2. 学术场景深度优化

  • 内置 IEEE 数字引用格式模板与参考文献校验规则
  • 显式编号策略(markup-level labels)替代 CSS counters,避免分页重排导致的编号漂移
  • KaTeX 数学公式与 Mermaid 图表的标准化集成方案
  • 目录页码自动解析(target-counter)与交叉引用完整性检查

3. Linux 运行时适配
针对服务器无 GUI 环境优化,明确使用 html_to_pdf 单一入口,禁用本地浏览器打印等依赖图形栈的操作,确保容器化部署稳定性。

4. 意图分类与澄清策略
将用户请求细分为 Build/Transform/Existing-ops/LaTeX-explicit 四类管道,并执行"最多一轮澄清"原则,平衡灵活性与执行效率。

潜在局限

  • 视觉风格单一 明确排斥 dashboard 美学(卡片、KPI 墙、深色装饰条),仅提供 print-academic 视觉方向,对商业提案、营销手册等场景适配性弱
  • 动态内容受限 强制预渲染图表为静态图片,ECharts/Plotly 等交互式图表无法保留探索功能
  • 版式调试门槛 虽然提供 F9 调参优先级表,但仍需理解 CSS Paged Media 与 Paged.js 的底层机制,非前端开发者上手成本较高
  • 中文排版细节未覆盖 文档未提及 CJK 行尾标点挤压、禁则处理、竖排等需求,中文科技论文可能需要额外补丁

适合人群

  • 技术写作者、学术研究者、需要版本可控的自动化报告生成场景
  • 已有 HTML 内容需批量转 PDF 的 DevOps/数据工程团队
  • 对 LaTeX 编译链感到头痛,但不愿牺牲学术排版规范的用户

常规风险

  • 动态图表预渲染环节若处理不当,易出现分辨率不足或字体嵌入失败
  • 跨字体 fallback(尤其 emoji 与 CJK)在 Linux 环境可能产生非预期字形替换
  • 复杂表格横向溢出时,自动缩放策略可能破坏可读性

安全解读

核心用法

minimax-pdf 是一套面向专业文档生产的 HTML-first PDF 技能规范,核心工作流程为:Intent 解析 → 内容治理 → HTML 生成 → html_to_pdf 转换 → 保真度校验。

文档类型支持:学术报告、研究论文、技术白皮书、结构化商业文档。转换入口严格限定为 html_to_pdf,禁止截图拼接或浏览器打印等降级方案。

关键约束

  • 不手动注入 Paged.js(运行时自动处理)
  • 禁用 CSS counters(分页 DOM 漂移会导致编号断裂)
  • 图表必须预渲染为静态图片(禁 ECharts/Chart.js/D3 等动态库)
  • 默认采用「print-academic」视觉风格:灰度调色板、高密度表格、简洁标题层级

排版系统:A4 页面(2.4cm×1.9cm 边距)、11pt 正文/1.6-1.7 行高、IEEE 数字引用格式。封面支持「Minimal」纯文字和「Designed」低饱和度几何两种变体,全出血设计需用绝对定位 <img> 而非 CSS background-image。

编号与引用:显式 HTML 属性替代 CSS counters,如 <figcaption data-caption="Figure 1">。目录页码通过 target-counter(attr(href url), page) 自动解析,支持文内页码引用。

显著优点

  • 分页稳定性:针对 Linux 运行时深度优化,预置 overflow guards 和 break-inside 规则,避免表格/代码块跨页断裂
  • 引用完整性:强制要求可验证引用(作者/标题/年份/来源),禁止虚构文献,支持锚点一致性校验
  • 转换保真度:三阶段图像校验(源提取→HTML 标签→转换结果)、链接强制保留(preserve_links=true
  • 无障碍输出:文本可搜索选择,无截图回退,符合学术存档标准
  • 意图分类清晰:Build/Transform/Existing/LaTeX 四通道分流,减少反复确认

潜在缺点与局限性

  • 交互元素缺失:动态图表、可折叠章节、嵌入式视频等富交互特性被显式禁止
  • Emoji 与装饰受限:Linux 字体回退不一致,图标需以纯文本标签替代
  • 浏览器依赖:Paged.js 运行时行为偶有不可预测性,需遵循「不手动注入」规则规避
  • 公式引擎绑定:数学排版锁定 KaTeX,复杂 TeX 宏可能需预编译
  • Mermaid 不稳定:复杂拓扑图建议直接输出静态 SVG/PNG

适合人群

  • 需要LaTeX 级排版质量但偏好 HTML/CSS 工作流的技术作者
  • 追求可版本控制、可 diff 文档源文件的研发团队
  • 必须在Linux 服务器端稳定产出 PDF 的自动化流水线
  • 重视引用可验证性的学术写作、合规报告场景

常规风险

  • CSS 计数器误用:开发者可能习惯性使用 counter-reset,导致分页后编号错乱
  • 图表尺寸失控:未遵循 landscape 比例预渲染,引发分页留白或截断
  • 封面全出血实现错误:误用 background-image 导致打印边距白边
  • 动态内容泄露:未禁用 JS 图表库,渲染时触发意外网络请求
  • 引用锚点漂移:id 置于内联元素而非容器级,造成交叉引用失效

Minimax Pdf 内容

手动下载zip · 5.5 kB
SKILL.mdtext/markdown
请选择文件