核心用法
Causal Inference Skill 为 Agent 行为添加了一层轻量级因果推理能力。它不依赖简单的模式匹配,而是通过建模干预(interventions)和反事实(counterfactuals)来预测行动结果。核心工作流程包括:在行动前记录预状态、查询因果模型预测结果分布、在不确定性高或风险大时请求用户确认;行动后记录完整事件并设置结果追踪;观察到结果后更新模型参数。
该 Skill 支持从邮件、日历、消息、任务四大领域的历史数据自动回填,快速启动因果模型。用户可通过 backfill_email.py、、backfill_calendar.py、、backfill_messages.py 等脚本解析现有日志,重建过去的行动-结果对,无需从零开始积累数据。
显著优点
科学决策框架:将日常行动(何时发邮件、如何安排会议)转化为可验证的因果推断问题,避免直觉偏差。例如,可量化"早上发邮件 vs 晚上发邮件"对回复率的实际治疗效果。
不确定性量化:不仅给出点估计,还提供置信区间和拒绝机制。当预测不确定性超过 30% 或预期收益低于 10% 时,系统会拒绝执行或升级至人工确认。
可审计的学习闭环:每个预测都留下可证伪的记录(falsifiable audit trail),结果观测后自动更新模型,形成持续改进的反馈循环。
多域统一抽象:邮件、日历、消息、任务等不同领域共享同一套"行动-上下文-结果"数据结构,便于跨域分析和策略迁移。
潜在缺点与局限性
数据依赖性强:因果推断需要足够的样本量才能识别治疗效果。对于低频行动(如季度财务审批),模型可能长期处于高不确定性状态,频繁触发人工确认,降低自动化价值。
简化因果假设:文档中的因果图仅包含 10-30 个可观测变量,且假设结构已知。现实中遗漏变量偏差(unobserved confounding)可能导致错误结论,而 Skill 未提供敏感性分析工具。
外部工具耦合:依赖 gog(Google API CLI)和 wacli(WhatsApp CLI)等第三方工具获取数据,这些工具的可获得性、稳定性和权限模型不在 Skill 控制范围内。
无自动因果发现:用户需手动指定因果图结构(如 send_time → reply_prob),Skill 不会从数据中自动学习因果结构,对非技术用户门槛较高。
适合的目标群体
- 数据驱动型专业人士:销售、运营、产品经理等需要优化日常沟通策略的用户
- 研究者与分析师:希望将因果推断方法应用于个人工作流的学术或商业分析师
- 自动化爱好者:愿意投入初期配置成本,换取长期决策质量提升的效率追求者
- 多平台用户:同时使用 Gmail、Google Calendar、WhatsApp/Slack/Discord 的跨平台工作者
不适合:对数据隐私极度敏感、不愿授权邮件/消息访问权限的用户;行动频率极低、无法积累统计样本的场景;需要实时毫秒级决策的高频交易系统。
使用风险
性能风险:历史数据回填涉及大量外部 API 调用和本地文件 I/O,首次运行可能耗时数分钟至数小时,取决于数据规模。action_log.jsonl 无限追加可能导致磁盘空间耗尽,需手动配置日志轮转。
依赖项风险:gog 和 wacli 非 Python 标准库,需单独安装配置。若 Google/WhatsApp 更改 API 或 CLI 工具停止维护,Skill 核心功能将失效。
模型误用风险:用户可能将相关性误解为因果性,或在样本不足时过度信任点估计。Skill 虽提供不确定性量化,但最终决策责任仍在用户。
数据一致性风险:回填的历史数据依赖外部服务的完整性和准确性。若邮件被删除、日历事件被修改,重建的因果图可能出现结构断裂。