daichangya 发布的文章

GitHub 日榜观察 · 第三名:system_prompts_leaks

仓库asgeirtj/system_prompts_leaks
榜单GitHub Trending · Today(按页面排序为当日 第三名;榜单会随时变化,请以官方页为准)
快照(GitHub API):约 36333 Star;6005 Fork;主语言 ;License None;Topics ai, ai-transparency, anthropic, chatgpt, claude, claude-code, gemini, generative-ai, gpt-5, grok, large-language-models, llm, openai, perplexity, prompt-engineering, system-prompt, system-prompts, xai;Archived False
撰稿说明:由定时任务调用 Cursor Agent 根据公开 README 与 API 整理,非项目方官方稿件

它是什么

system_prompts_leaks 是一个以 Markdown 等形式归档「系统提示词」摘录 的公开仓库。根据 GitHub 仓库简介,内容来自多款产品的已公开或流传文本,并 定期更新

Extracted system prompts from ChatGPT (GPT-5.4, GPT-5.3, Codex), Claude (Opus 4.6, Sonnet 4.6, Claude Code), Gemini (3.1 Pro, 3 Flash, CLI), Grok (4.2, 4), Perplexity, and more. Updated regularly.

它不是需要编译安装的「应用」,而是 供阅读、对照与研究的文本资料集;价值在于把分散信息集中存放,便于讨论 prompt 工程、模型行为边界与 AI 透明度(与 Topics 中的 ai-transparencyprompt-engineering 等一致)。

为什么容易上日榜: 大模型系统提示词直接影响回答风格与安全策略,社区对「各厂商实际写了什么」持续好奇;榜单排名仅反映当日热度,不代表官方背书。


怎么安装(本地副本)

仓库 未在 API 中标注 License,且默认分支为 main。若你只需阅读,可直接在 GitHub 网页打开文件,无需安装任何依赖。

要在本地有一份可搜索的副本,使用 Git 克隆即可(与常见开源文档仓用法一致):

git clone https://github.com/asgeirtj/system_prompts_leaks.git
cd system_prompts_leaks

可选:用编辑器全局搜索关键词,或用 grep/rg 在目录内检索(具体文件名与目录层级以仓库当前结构为准,请以 仓库主页 为准)。


怎么使用(最小路径)

  1. 零安装:浏览器打开 https://github.com/asgeirtj/system_prompts_leaks,在文件树中点开对应 Markdown(或仓库 README 中若列出索引,从其入口进入)。
  2. 已克隆:进入 system_prompts_leaks 目录,用你喜欢的编辑器打开感兴趣的 .md 文件即可;无服务端、无 npm install / pip install 类启动步骤。

若你关心 ChatGPT(GPT-5.4, GPT-5.3, Codex)Claude(Opus 4.6, Sonnet 4.6, Claude Code)Gemini(3.1 Pro, 3 Flash, CLI)Grok(4.2, 4)Perplexity 等条目,请以仓库内实际文件名与说明为准;简介中的型号名称会随上游产品迭代而变化。


合规与风险(必读)

  • 许可证:API 显示 License: None,不等于「可任意商用转载」。复制、再发布或用于训练前,请自行判断版权与各平台服务条款;本文不构成法律意见。
  • 供应链:内容来自第三方整理与网络流传,不保证与厂商当前线上版本逐字一致,也可能存在节选或过时。
  • 隐私:本仓为静态文本,克隆与阅读一般不涉及你的对话数据;但若你在不可信环境操作,仍遵循常规 Git 与网络安全习惯。
  • Archived:当前 未归档Archived: false),但未来仓库状态可能变更,请以 GitHub 页面为准。
  • 伦理:系统提示词研究有助于理解模型行为,也可能被误用于规避安全策略;请遵守当地法规与平台规则,理性、负责任地使用

适合谁

  • 研究者 / prompt 工程师:对比不同产品线提示词结构与约束表述。
  • 开发者与审计方:在合规前提下做透明度与行为分析参考(须交叉验证官方文档)。
  • 普通读者:满足好奇心时建议同时阅读各厂商公开说明,避免单一摘录来源以偏概全。

推荐结论

值得作为 「社区整理的参考资料」 收藏,但务必带着 无 License、非官方、可能滞后 的前提使用。若你需要 可商用的单一事实来源,应以各厂商官方文档与协议为准;本仓库更适合研究与讨论场景。


延伸阅读

GitHub 日榜观察 · 第二名:oh-my-codex

仓库Yeachan-Heo/oh-my-codex
网站yeachan-heo.github.io/oh-my-codex-website
榜单GitHub Trending · Today(按页面排序为当日第二名;榜单会随时变化,请以官方页为准)
快照参考(GitHub API):约 11656 Star;1083 Fork;主语言 TypeScript;API 中 License 字段未标注;Archived False
撰稿说明:由定时任务调用 Cursor Agent 根据公开 README 与 API 整理,非项目方官方稿件

它是什么

oh-my-codex(OMX) 是面向 OpenAI Codex CLI工作流层:不取代 Codex 的执行引擎,而是在其上补齐「更强的默认会话、从澄清到完成的一致流程、可复用的角色与 skills、以及落在项目里的状态与指引」。README 用一句话概括:OmX - Oh My codeX: Your codex is not alone. Add hooks, agent teams, HUDs, and so much more.

典型能力包括:用 $deep-interview$ralplan$team$ralph 等约定技能串联工作;通过项目内的 AGENTS.md 做范围化指引;在 .omx/ 下持久化计划、日志、记忆与模式跟踪。若你只想用「裸」Codex、不要额外工作流,README 也明说可能不需要 OMX。


怎么安装

环境与依赖

  • Node.js 20+(README 徽章:node >=20
  • 已全局安装并配置好 Codex CLInpm install -g @openai/codex,并完成 Codex 鉴权
  • 若后续要用 团队持久运行时:macOS/Linux 需 tmux;原生 Windows 需 psmux(详见下文平台说明)

推荐默认一条龙(README「Recommended default flow」)

npm install -g @openai/codex oh-my-codex
omx setup
omx --madmax --high

omx setup 会安装 prompts、skills、配置与 AGENTS 脚手架;omx --madmax --high 按 README 是偏「拉满」的启动方式(若机器吃紧可考虑降低并发,见「合规与风险」中的已知问题)。

团队模式相关(可选)

omx team 依赖 tmux 系后端,README 给出的安装示例:

平台安装
macOSbrew install tmux
Ubuntu/Debiansudo apt install tmux
Fedorasudo dnf install tmux
Archsudo pacman -S tmux
Windowswinget install psmux
Windows (WSL2)sudo apt install tmux

怎么使用

最小可跑路径(第一次会话)

  1. 按上一节完成安装后,用推荐方式启动:
omx --madmax --high
  1. Codex 会话里(不是单独再开一个 shell 演示)按 README 的「canonical workflow」输入,例如:
$deep-interview "clarify the authentication change"
$ralplan "approve the safest implementation path"
$ralph "carry the approved plan to completion"
$team 3:executor "execute the approved plan in parallel"

语义上:$deep-interview 在需求边界不清时做澄清;$ralplan 把范围落成可审批的实现计划并权衡取舍;之后二选一:$team 做需要协调的并行执行,$ralph单一负责人持续推进的完成闭环。会话中还可通过 /skills 浏览已装 skills。

进阶操作面(非必读入门)

  • 团队运行时(需要 durable tmux/worktree 协调时再上,而非默认第一步):
omx team 3:executor "fix the failing tests with verification"
omx team status <team-name>
omx team resume <team-name>
omx team shutdown <team-name>
  • 运维向omx doctor 用于安装自检;omx hud --watch 为监控向界面,非主流程。
  • 只读探索 / Shell 辅助
omx explore --prompt "find where team state is written"
omx sparkshell git status
omx sparkshell --tmux-pane %12 --tail-lines 400

更细的步骤与概念见仓库内文档(下一节链接)。


合规与风险

  • 许可证:README License 一节写明 MIT;npm 徽章亦为 MIT。GitHub API 返回的 license 可能为空,以仓库 README 与 npm 发布页为准做合规判断。
  • 供应链:通过 npm install -g oh-my-codex(及 @openai/codex)拉取依赖时,建议锁定版本、关注发行说明,并在企业环境走内部镜像与审计流程。
  • 数据与隐私:OMX 依附 Codex 与 OpenAI 侧配置工作,涉及代码与提示内容上传策略时,需按你方政策与 OpenAI 条款单独评估。
  • 已知问题(Intel Mac):README 说明在部分 Intel Mac 上,带 --madmax --high 的启动可能拉高 syspolicyd / trustd CPU(Gatekeeper 并发校验)。可尝试:
    xattr -dr com.apple.quarantine $(which omx)、在系统安全设置里把终端加入 Developer Tools 允许列表,或降低并发(避免 --madmax --high)。
  • 归档状态:当前 API 显示 Archived: false,若日后变更请以仓库页为准。

适合谁

  • 已经在用 Codex CLI、希望有统一「澄清 → 定案 → 执行/并行」套路的开发者。
  • 需要在项目内沉淀计划、日志与运行时状态(.omx/)的小团队或个人。
  • 愿意接受一层约定$deep-interview 等)来换更可重复工作流的人;若你坚持极简、零魔法命令,则可能不是目标用户。

推荐结论

值得在日榜语境下关注:OMX 把「Codex 仍是执行核心」讲清楚,同时给出可复制的默认路径与可选团队运行时,文档入口(Getting Started、Agents、Skills、Integrations)齐全。上手建议严格按 omx setupomx --madmax --high 走一遍 README 示例,再决定是否启用 omx team;Intel Mac 若遇 CPU 尖峰,优先按官方 Known issues 降级并发或处理隔离属性。


延伸阅读

GitHub 日榜观察 · 第一名:OpenScreen

仓库siddharthvaddem/openscreen
项目站openscreen.vercel.app
榜单GitHub Trending · Today(按页面排序为当日第 1 位;榜单会随时变化,请以官方页为准)
快照参考(GitHub API):约 15814 Star;1075 Fork;主语言 TypeScript;License MIT License;Topics electron, open-source, pixijs, screen-capture, screen-recorder;Archived False
撰稿说明:由定时任务调用 Cursor Agent 根据公开 README 与 API 整理,非项目方官方稿件

它是什么

OpenScreen 是面向 产品演示与操作录屏免费开源 桌面应用,定位上自述为 Screen Studio 的简化替代(并非 1:1 克隆):不订阅、无水印,个人与商业使用均免费,可修改与分发。技术栈包括 Electron、React、TypeScript、Vite、PixiJS、dnd-timeline

核心能力(与 README「Core Features」一致):全屏或指定窗口录制;自动/手动缩放(可设深度);麦克风与 系统音频 采集;缩放时长与位置可自定义;画面裁剪;壁纸/纯色/渐变/自定义背景;平移缩放 Motion blur;文字/箭头/图片 标注;片段 修剪、分段 变速;多 画幅比例与分辨率 导出。

README 明确项目仍处于 beta,可能存在不稳定;作者欢迎通过 issue 反馈。


怎么安装

官方推荐从 GitHub Releases 下载对应平台的最新安装包,按平台说明操作。

macOS

Gatekeeper 拦截未签名应用,安装后在终端执行(路径以实际安装为准):

xattr -rd com.apple.quarantine /Applications/Openscreen.app

注意:在 系统设置 > 隐私与安全性 中为终端开启 完全磁盘访问,再执行上述命令。随后在 系统偏好设置 > 安全性与隐私 中为应用授予 屏幕录制辅助功能(Accessibility) 等权限,再启动应用。

Linux

从 Releases 下载 .AppImage,赋予执行权限并运行:

chmod +x Openscreen-Linux-*.AppImage
./Openscreen-Linux-*.AppImage

若因 sandbox 报错无法启动,可尝试:

./Openscreen-Linux-*.AppImage --no-sandbox

部分桌面环境需单独授予 屏幕录制 相关权限。

Windows

README 未单独成章,与通用说明一致:在 Releases 下载 Windows 安装包安装即可;系统音频采集 README 写明 开箱可用


怎么使用(最小路径)

  1. 完成上一节 安装 并解决平台权限(macOS/Linux 尤其重要)。
  2. 从应用程序菜单或快捷方式 启动 Openscreen(macOS 为 Openscreen.app)。
  3. 在应用内按 README 所述选择 整屏或指定窗口 开始录制,按需使用缩放、标注、裁剪与导出选项。

README 未给出 CLI 子命令式的「一行启动录制」说明;日常最小路径即 安装 → 授权 → 打开 GUI 操作。若参与开发或自建,需查看仓库内源码与 issue;贡献方向可参考仓库 project roadmap


合规与风险

  • 许可证:项目采用 MIT License;README 写明使用者同意作者 不对使用中的问题、损害或索赔承担责任
  • 供应链与阶段:仓库 未归档;功能与稳定性以 beta 为准,升级与发布以 GitHub Releases 为准。
  • 隐私与数据:录屏与 系统音频 涉及敏感内容,需在团队流程中单独评估 同意、留存与披露;系统音频依赖 Electron desktopCapturer,存在平台差异:

    • macOS:需 macOS 13+macOS 14.2+ 会提示音频采集权限;macOS 12 及以下 不支持系统音频(麦克风仍可用)。
    • Windows:README 称系统音频 可直接使用
    • Linux:需 PipeWire(Ubuntu 22.04+、Fedora 34+ 等默认);仅 PulseAudio 的老环境可能无系统音频(麦克风通常仍可用)。

适合谁

  • 独立开发者 / 小团队:需要免费、可商用的演示录像工具,接受功能比 Screen Studio 更精简。
  • 内容制作者:需要缩放、标注、多比例导出等「基础但够用」的剪辑向能力。
  • 贡献者:可通过 open issues 与 roadmap 了解方向并提交 PR。

推荐结论

若目标是 零订阅成本、MIT 许可、本地桌面录屏 + 简单后期式调整,OpenScreen 与当前文档、API 信息一致,值得从 Releases 装一版试用;若依赖 稳定的系统音频 或旧版 macOS/Linux,请先对照上文 Limitations 核对环境。需要 Screen Studio 全套高级能力时,README 亦建议支持官方产品。


延伸阅读

GitHub 日榜观察 · 第二名:VibeVoice

仓库microsoft/VibeVoice
项目站microsoft.github.io/VibeVoice
榜单GitHub Trending · Today(按页面排序为当日 第二名;榜单会随时变化,请以官方页为准)
快照(GitHub API):约 34707 Star;3946 Fork;主语言 Python;License MIT License;Topics ;Archived False
撰稿说明:由定时任务调用 Cursor Agent 根据公开 README 与 API 整理,非项目方官方稿件

它是什么

VibeVoice 是微软在 GitHub 上开源的 Open-Source Frontier Voice AI(前沿语音 AI 模型族),面向 自动语音识别(ASR)文本转语音(TTS) 等场景。技术侧 README 强调:约 7.5 Hz连续语音 tokenizer(声学 + 语义) 兼顾长序列效率与音质;next-token diffusionLLM 理解文本与对话流,用 diffusion head 补声学细节(详见 Project Page 与 README 内论文链接)。

Hugging Face 集合(模型总入口):huggingface.co/collections/microsoft/vibevoice-68a2ef24a875c44be47b034f


当前仓库里「能玩什么」(以 README 为准)

README 将能力对应到多条产品线,详细说明在仓库 docs/

  1. VibeVoice-ASR
    单次推理可处理长约 60 分钟 音频(64K token 内),输出带 说话人 / 时间戳 / 文本 的结构化转写;支持 Customized Hotwords(自定义热词)50+ 语言。入口含 PlaygroundHugging FaceFinetuningvLLMdocs/vibevoice-vllm-asr.mdVibeVoice ASR 已纳入 Transformers v5.3.0,可通过 Hugging Face Transformers 接入。
  2. VibeVoice-Realtime-0.5B
    0.5B 参数,流式文本输入、实时 TTS(README 称首包可听延迟约 300ms 量级)、长段生成约 10 分钟 量级;可跑 Colab
  3. VibeVoice-TTS
    README 仍介绍长文本/多说话人 TTS 论文与效果(约 90 分钟、最多 4 说话人 等),但仓库内代码有重大调整(见下节「重要变更」)。

怎么安装

README 给出覆盖全仓的单一 pip install 行;自托管须按各模型文档装依赖。

1. 获取源码

git clone https://github.com/microsoft/VibeVoice.git
cd VibeVoice

2. 按方向阅读官方安装与依赖

3. 权重

README 表格指向 Hugging Face,例如 VibeVoice-ASR-7BVibeVoice-Realtime-0.5B。快速体验可优先 Playground / Colab,不必先搭满本地环境。


怎么使用(最小可运行路径)

路径 A:ASR(浏览器,零本地安装)
打开 ASR Playground,按页面提示上传或录制,查看结构化转写。

路径 B:流式 TTS(Colab)
在浏览器打开并顺序运行单元格:

vibevoice_realtime_colab.ipynb

路径 C:另一份 Colab(README 徽章)
VibeVoice_colab.ipynb

本地 / 代码集成
使用 Transformers 调用 ASR 时,升级到包含 VibeVoice ASR 的 Transformers 版本,并遵循 docs/vibevoice-asr.md 中的用法章节;具体 API、CLI 与脚本以仓库当前 docs/demo/ 为准。

重要变更(必读)

README 2025-09-05 说明:为强调负责任使用,已从本仓库移除 VibeVoice-TTS 代码。长文本多说话人 TTS 的论文与 Hugging Face 说明仍在,但克隆本仓库不应再假设能直接跑通原 TTS 训练/推理全套脚本;请以当前文件与 Hugging Face 为准。官方 Risks and Limitations 提示:存在偏见与错误;高质量合成语音有深度伪造与虚假信息风险;不建议未经验证直接用于商业或生产,默认面向 研发;须符合当地法律并建议披露 AI 生成内容。


合规与风险

  • 许可证MIT Licensespdx_id: MIT);权重与第三方依赖须各自遵守条款。
  • 供应链:自 GitHub / Hugging Face 拉取模型与包时,生产环境应固定版本并审计依赖。
  • 数据与隐私:处理用户语音须单独满足同意、留存、跨境与行业合规。
  • 模型局限(README 要点):输出可能不准或有偏;发布与 Qwen2.5 1.5b 等相关基座带来的偏见可能继承。合成语音滥用风险由部署方管控。
  • 仓库状态Archived False,主分支 main

适合谁

  • 研究 / 算法:语音 × LLM × diffusion、长音频 ASR、说话人与时间戳联合建模、ASR 微调与 vLLM。
  • 产品原型:会议转写、字幕、语音输入——先用 Playground / Colab 验证再考虑自托管。
  • 含 TTS 全链路的团队:先核对仓库是否仍含所需代码,并规划滥用防护(鉴权、场景限制、水印等)。

推荐结论

值得关注,但要带着「研究框架 + 责任声明」去读。 ASR 与 Realtime 文档、Transformers 集成与社区采用(如 README 提到的 Vibing 输入法)较完整;VibeVoice-TTS 代码已移除 后,勿按旧文「克隆即跑通长文本 TTS 全套」规划。优先 Playground / Colab / Hugging Face,再深入 docs/finetuning-asr/


延伸阅读