expanso-language-detect

🌐 声明式 AI 语言检测管道

基于 Expanso Edge 平台的 AI 语言检测工具,通过 OpenAI API 或本地 Ollama 实现多语言文本识别,支持 CLI 管道与 MCP 服务器双模式部署。

收藏
5.5k
安装
2.1k
版本
0.0.0
CLS 安全性认证2026-05-10
点击查看完整报告 >

使用说明

核心用法

language-detect 是一款基于 Expanso Edge 平台的声明式语言检测技能,采用 YAML 配置驱动而非传统代码实现。用户可通过三种方式调用:CLI 管道模式适合命令行快速检测,将文本通过管道传入即可获取语言识别结果;MCP 服务器模式则作为长期运行的 HTTP 服务,默认监听 8080 端口,便于集成到 AI 助手或其他自动化工作流;此外还支持一键部署至 Expanso Cloud 实现云端托管。该技能底层调用 OpenAI 的 gpt-4o-mini 模型进行语言判断,同时兼容本地 Ollama 后端,满足离线场景需求。

显著优点

该技能的最大亮点在于架构的简洁性与透明性。作为纯文档型资产,它完全摒弃了可执行脚本,仅通过声明式 YAML 配置即可完成功能定义,极大降低了安全审计成本。平台内置的 mapping 处理器和 openai_chat_completion 组件确保了执行环境的可控性。输入输出结构经过严格定义,包含类型校验、必填项检查、默认值回退及错误捕获机制,配合 trace_id 实现全链路追踪。权限申请精准克制,仅需 OPENAI_API_KEY 且由用户主动配置,无敏感信息静默收集行为。支持双后端架构(OpenAI 云端 / Ollama 本地)则兼顾了便捷性与数据隐私。

潜在缺点与局限性

首先,该技能强依赖 Expanso Edge 平台,用户需额外安装 expanso-edge 二进制文件,增加了环境准备成本。其次,云端模式依赖外部 API,存在网络延迟和可用性风险,不适合对实时性要求极高的场景。输入缓冲区限制为 100KB,超大文本需手动分段处理。MCP 模式的默认网络配置(0.0.0.0:8080)若直接暴露于公网可能存在安全隐患,需用户自行配置防火墙或反向代理。此外,作为 T3 来源的个人开发者作品,长期维护承诺与商业支持能力存疑。

适合的目标群体

该技能特别适合以下用户:构建多语言内容处理管道的开发者、需要在 CLI 环境快速集成语言检测能力的运维人员、正在搭建 AI 助手工作流并寻求 MCP 兼容组件的产品团队,以及对数据隐私敏感、希望灵活选择云端或本地推理模式的企业用户。教育科研领域的文本分析场景亦是理想用例。

使用风险

主要风险集中于依赖链与网络配置层面。Expanso Edge 平台的版本兼容性、OpenAI API 的配额与计费波动、Ollama 本地服务的资源占用均需纳入考量。MCP 模式的网络暴露面若配置不当可能引发未授权访问。建议生产环境启用输入长度监控、配置请求速率限制,并建立 API 故障时的降级策略。

安全解读

核心用法

language-detect 是一款基于 Expanso 框架的 AI 驱动语言检测 Skill,支持两种运行模式:

  • CLI 管道模式:通过标准输入流快速检测单条文本语言
  • MCP 服务器模式:作为长期运行的 Model Context Protocol 服务,供其他工具集成调用

用户可通过 expanso-edge 本地运行,或一键部署至 Expanso Cloud。配置灵活,既可直接调用 OpenAI GPT 模型获得高精度识别,也可切换至本地 Ollama 后端实现完全离线、零外传的隐私保护方案。

显著优点

1. 零代码安全风险:纯 YAML 声明式配置,无 eval/exec/system 等危险函数,从根本上杜绝代码注入攻击
2. 双后端灵活架构:OpenAI 云端高精度 vs Ollama 本地零隐私风险,用户自主掌控数据流向

3. T1 级可信来源:维护者为 GitHub 知名开发者 aronchick,隶属 openclaw 开源组织,MIT 许可证完全透明

4. 标准化凭证管理:API Key 通过环境变量注入,无硬编码,符合安全最佳实践

5. TLS 加密传输:云端调用全程 TLS 1.3 保护,网络流量可审计

潜在缺点与局限性

| 局限类型 | 说明 |
|---------|------|
| 外部依赖 | 默认依赖 OpenAI API 可用性与速率限制 |
| 成本因素 | 高频调用可能产生 API 费用 |
| 本地配置门槛 | Ollama 后端需用户自行部署本地模型 |
| 无输入验证 | 当前未对输入长度做严格限制(缓冲上限 100KB) |
| 无重试机制 | CLI 模式未配置请求超时与自动重试 |

适合人群

  • 开发者/运维人员:需要快速集成语言检测能力至 CLI 工具链或自动化管道
  • 隐私敏感用户:可通过 Ollama 后端实现完全本地化的语言识别,数据零外传
  • 多语言内容处理团队:构建内容分类、国际化预处理等场景的基础设施
  • AI 应用构建者:通过 MCP 协议将语言检测能力嵌入更复杂的 Agent 工作流

常规风险

1. 数据出境风险:默认配置下文本内容发送至 OpenAI 美国服务器,需评估合规要求
2. API Key 泄露:用户自行保管的密钥若配置不当可能暴露于进程列表或日志

3. 服务可用性:依赖 OpenAI 服务状态,高峰期可能遇到速率限制

4. 模型幻觉:虽为简单分类任务,极端短文本或代码混淆内容可能存在误判

> 💡 建议:生产环境部署前优先配置 Ollama 本地后端,或在文档明确的知情同意下使用 OpenAI 方案。

expanso-language-detect 内容

test文件夹
fixtures文件夹
手动下载zip · 3.1 kB
input.txttext/plain
请选择文件