agent-selfie

🤳 AI 代理专属形象设计师

基于 Google Gemini API 的 AI 代理自画像生成器,支持情绪主题与风格演化,为 AI 代理快速创建专业头像与视觉身份。

收藏
18.6k
安装
3.9k
版本
v1.2.1
CLS 安全性认证2026-05-09
点击查看完整报告 >

使用说明

核心用法

agent-selfie 是一款专为 AI 代理设计的自画像生成工具,通过调用 Google Gemini 图像生成 API,根据用户定义的人格配置(personality)、情绪状态(mood)和主题风格(theme)自动生成头像、横幅或完整竖版图片。用户可通过命令行指定 JSON 格式的人格描述(包含名称、视觉风格、性格氛围),或选择预设的 8 种情绪(如 professional、creative、chill)和 8 种季节/节日主题(如 spring、halloween、christmas)。输出支持三种格式:1:1 头像、16:9 横幅和 9:16 竖版,并可批量生成带 HTML 画廊的展示页面。

显著优点

极简依赖:纯 Python 3 标准库实现,零第三方包依赖,部署轻量且维护成本低。高度可定制:人格配置系统允许精细控制视觉特征与性格表达,支持从动漫风格到写实机器人的广泛创作空间。平台适配性强:针对 Discord、Twitter/X、AgentGram 等主流平台提供格式与使用建议,开箱即用。自动化友好:内置 Cron 集成示例,支持定时自动生成代理形象更新。生态联动:与 AgentGram 社交技能、gemini-image-gen 通用图像生成技能形成互补,构建完整的 AI 代理视觉工作流。

潜在缺点与局限性

单一供应商锁定:完全依赖 Google Gemini API,若服务中断、政策变更或区域限制将直接影响可用性。无本地模型选项:必须联网并消耗 API 配额,无法离线运行或控制推理成本。提示词透明度有限:用户输入的 style/vibe 描述直接透传至 API,缺乏本地预处理或安全过滤,存在提示词注入风险。输出可控性一般:图像生成结果受模型随机性影响,复杂描述可能出现风格偏离,需多次尝试。功能边界清晰但狭窄:专注"自画像"场景,不支持通用图像编辑、风格迁移或已有图像的迭代优化。

适合的目标群体

  • AI 代理开发者:需要为聊天机器人、虚拟助手快速建立视觉身份的独立开发者或小团队
  • 社交媒体运营者:管理 AI 人格账号(如 Twitter/X 上的 AI 角色),需要定期更新头像/横幅内容
  • 创意实验者:探索 AI 代理人格化表达、构建虚拟角色 IP 的内容创作者
  • 教育/演示场景:教学演示中需要可视化展示 AI 代理"形象"的讲师或学生

使用风险

API 密钥管理:GEMINI_API_KEY 泄露可能导致配额被盗用,建议配合密钥轮换与最小权限原则。网络稳定性:生成过程依赖 Google 服务可用性,高并发或批量任务需考虑重试与退避策略。内容合规:生成内容受 Gemini API 使用政策约束,特定风格描述可能触发安全过滤导致生成失败。存储管理:批量生成模式下 PNG 与 HTML 文件持续累积,需定期清理输出目录避免磁盘空间耗尽。

安全解读

agent-selfie 综合评估

核心用法

agent-selfie 是一款专为 AI 代理设计的视觉身份生成工具,通过 Google Gemini 图像生成 API,为代理创建专属头像、横幅和完整视觉形象。用户可通过命令行指定 personality 配置(名称、视觉风格、性格气质)、mood 情绪状态(happy/focused/creative 等 8 种)、theme 季节主题(四季+节日 8 种)以及 format 输出格式(avatar 1:1 / banner 16:9 / full 竖版),批量生成并自动归档到本地画廊。

核心工作流:配置 personality → 选择 mood/theme → 指定 format → 生成 PNG + 自动生成 HTML 画廊。支持与 Discord、Twitter/X、AgentGram 等平台直接集成, Cron 定时任务可实现「每日自动更新头像」。

显著优点

1. 零依赖安全架构:纯 Python 标准库实现(urllib、pathlib、argparse 等),无第三方包,从根本上消除供应链攻击风险。
2. 极简部署:仅需 GEMINI_API_KEY 环境变量即可运行,单文件 286 行代码,审计成本极低。

3. 情绪驱动的动态身份:首创 mood-based 生成机制,让 AI 代理的视觉形象随「情绪」演进,增强人格化表达。

4. 平台原生适配:内置 avatar/banner/full 三种预设比例,直接匹配主流社交平台规格。

5. 完全开源可审计:GitHub 公开仓库,MIT 协议,代码透明度高。

潜在缺点与局限性

  • 单一 API 依赖:完全绑定 Google Gemini,若服务受限或定价调整,迁移成本较高。
  • 无图像编辑能力:仅支持生成,不支持局部重绘、风格迁移等进阶编辑。
  • T3 来源风险:个人开发者维护(IISweetHeartII),缺乏组织级 SLA 和安全背书。
  • 密钥管理警示:虽建议用 .env 管理,但实际仍依赖用户环境变量,存在误提交风险。
  • 无内置缓存/去重:重复生成相同配置会消耗 API 额度。

适合人群

  • AI 代理开发者:为 Claude、GPT 等代理快速建立视觉身份
  • Discord/Twitter Bot 运营者:需要定期更换头像/横幅的自动化场景
  • 数字艺术家与创作者:探索 AI 代理人格化表达的实验性项目
  • 安全敏感环境:因零依赖特性,适合对供应链安全要求极高的场景

常规风险

  • API 密钥泄露:命令行 export 可能进入 shell history,建议改用 .env + direnv。
  • 内容政策合规:Gemini API 对生成内容有安全过滤,某些 personality 描述可能触发拒绝。
  • Rate Limit 与成本:批量生成(--count)需注意 Google 配额与计费。
  • T3 维护风险:个人项目可能因作者精力而停更,生产环境建议 fork 自维护。

agent-selfie 内容

scripts文件夹
手动下载zip · 9.7 kB
selfie.pytext/plain
请选择文件