Anthropic Cybersecurity Skills 是由社区专为 AI Agent 打造的开源网络安全技能库,基于 agentskills.io 标准。它包含754个结构化技能,涵盖云安全、威胁狩猎等26个安全领域,并严格映射到 MITRE ATT&CK 等5个主流安全框架。该项目采用低 Token 消耗的渐进式检索架构,让 Agent 能够像资深安全分析师一样,依据标准化的 Markdown 手册逐步执行专业且复杂的安全分析与事件响应工作流。
A framework for few-shot evaluation of language models.
Local Deep Research 是一个由 AI 驱动的本地研究助手,旨在提供深度、智能体的研究体验。它通过多个人工智能模型和搜索引擎,自动进行网络、学术论文及用户自有文档的搜索,并能综合信息生成带引用的研究报告。产品强调数据隐私和本地运行,允许用户构建和搜索自己的加密知识库,并提供多种研究策略和强大的安全特性。
Scrapling 是一个现代化的自适应网页抓取框架。它能够智能适应网站结构变化,自动重新定位抓取元素。内置反爬绕过功能(如 Cloudflare Turnstile),并提供支持并发、暂停/恢复和代理轮换的高级爬虫框架。此外,它提供 MCP 服务器和官方 OpenClaw Skill 集成,方便 AI Agent 无缝调用并抓取网页数据。
OmniVoice是k2-fsa推出的一款最先进的大规模多语言零样本文本转语音(TTS)模型,卓越支持逾600种语言。它采纳创新的扩散语言模型架构,不仅能生成高质量语音,更具备行业领先的推理速度。核心功能涵盖极致精准的语音克隆、通过性别、年龄、音高、口音等细粒度属性进行声音定制设计,以及对非语言符号和中文拼音的智能发音纠正。凭借其无与伦比的语言覆盖广度与高效性能,OmniVoice是多语言内容创作、个性化语音合成及各类实时应用场景的理想解决方案。
ios-simulator-skill 是一个为 Claude Code 设计的生产级技能,专为构建、测试和自动化 iOS 应用而优化。它包含22个脚本,支持通过 `xcodebuild` 进行 Xcode 项目构建、测试和结果解析,以及通过 `xcrun simctl` 和 `idb` 进行 iOS 模拟器交互。该技能利用语义化UI导航和可访问性API,避免脆弱的像素坐标操作,同时通过Token优化的输出和截图压缩技术,显著降低AI代理的Token消耗,提升效率和鲁棒性。
OpenVoice是一款由MyShell.ai开发的通用瞬时语音克隆模型。它能精准克隆参考音色,支持多语言和口音生成语音,并提供灵活的语音风格控制,例如情感、口音、节奏和语调。OpenVoice V2在V1基础上提升了音频质量,增加了对英、西、法、中、日、韩等多语言的原生支持,并采用MIT许可证,可免费用于商业用途。它通过零样本跨语言克隆技术,即使训练数据中未包含目标语言或参考语音的语言,也能进行有效的语音克隆,已广泛应用于MyShell.ai平台。
AI_NovelGenerator 是一个基于大型语言模型构建的多功能小说生成工具,由 YILING0013 开发。它通过提供可视化小说设定工作台(包括世界观构建、角色设计、情节蓝图)来辅助用户高效创作。该工具具备智能多阶段章节生成能力,配合状态追踪系统、语义搜索引擎和知识库集成,确保故事的连贯性和逻辑严谨性。它还提供了图形用户界面(GUI)和自动校对功能,帮助检测和解决情节矛盾及逻辑冲突。
OpenAI Agents SDK 是一个轻量且强大的 Python 框架,用于构建多 Agent 工作流。它支持 OpenAI API 及其他100多种大型语言模型,通过配置Agent、工具、安全防护和会话管理等核心概念,实现复杂的智能体协作和任务自动化。其特点包括Agent即工具、沙盒环境运行、内置人类干预、会话历史管理和运行追踪,支持构建语音Agent。
MAD (Multi-Agents-Debate) 是一个旨在通过多智能体辩论机制提升大语言模型能力的开源框架。它针对 LLM 在自我反思时容易陷入的“思维退化(DoT)”问题(如偏见、认知僵化和缺乏外部反馈),提出了“针锋相对”的辩论模式。该框架通常由正方(恶魔)、反方(天使)和评审智能体组成,通过立场对立和外部反馈循环来纠正思维偏差,在直觉性问答和常识性翻译等复杂推理任务中表现卓越。
autoresearch 是 karpathy 开创性推出的一款 AI 智能体研究工具,致力于自动化大型语言模型 (LLM) 的训练过程探索与优化。它赋予 AI 智能体自主修改模型架构、超参数及核心训练逻辑(`train.py`)的能力。在严格的5分钟训练周期内,系统会基于 `val_bpb` 指标进行评估与迭代,通过人类编写的 `program.md` 文件指导智能体。该工具旨在单GPU环境下自动发现并优化 LLM 配置,极大地加速前沿研究进程,实现高效且夜间无人值守的实验突破。
AI-Search-Hub 是 minsight-ai-info 推出的一款开源 AI Skill,旨在聚合 Gemini、Grok、豆包、元宝、Kimi 等全球领先 AI 平台的原生搜索与网页抽取能力,构建一个高效、可复用的信息中枢。它解决了传统数据获取中爬虫维护、平台风控、数据清洗等痛点,让用户能以“一次提问,全域搜索”的方式,免费获取科技趋势、行业舆情、热点追踪及微信公众号、抖音等难以触达的多元信息。本 Hub 赋能 Agent 和工作流直接借力大厂 AI 的强大理解与处理能力,实现信息的自动搜集、清洗、整理,并统一输出结构化结果,极大提升信息获取的效率与质量。
Claude Code Usage Monitor 是一款由 Maciek-roboblog 开发的终端实时监控工具,专为 Claude AI 的 token 使用量设计。它通过高级分析、基于机器学习的预测和丰富的用户界面,帮助用户实时跟踪 token 消耗、燃烧率和成本分析,并智能预测会话限制。该工具支持多种 Claude 计划的自动检测和自定义限制,并提供多级警告系统,确保用户不会意外超出使用配额。
OpenHarness 是由 HKUDS 开发的开源、轻量级 Python 框架,旨在为构建和部署高级 AI Agent 提供核心基础设施。它作为一个全面的“Agent Harness”,赋予大型语言模型强大的工具使用能力(43+种工具)、技能管理、持久化记忆及复杂的多Agent协作机制。其核心特性包括支持并行执行的流式Agent循环、智能上下文压缩、多级权限治理与交互式审批,以及灵活的插件生态系统。OpenHarness 赋能研究人员和开发者深入理解、实验并扩展生产级 AI Agent。它支持命令行集成,并可用于构建专业Agent,例如 ohmo——一个能够在飞书、Slack、Telegram 等平台执行代码生成、测试和 PR 管理等多日会话任务的智能助手,且无需额外API密钥,直接利用现有LLM订阅。
UI UX Pro Max Skill是NextLevelBuilder推出的一款专业AI Agent产品,专注于为多平台和多框架的UI/UX设计提供卓越智能辅助。其核心功能是2.0版本引入的“智能设计系统生成器”,该生成器作为强大的AI推理引擎,能迅速分析项目需求,并在数秒内生成一套完整且高度定制化的设计系统。它通过对161种产品类型、67种UI风格、161种调色板、24种页面布局模式及57种字体组合进行多领域并行搜索,为用户提供专业的页面模式、风格、配色、排版、关键效果和全面的交付前检查清单,赋能设计师和开发者高效构建专业、用户友好且具备良好可访问性的跨平台界面。
OpenMythos 是 Anthropic Claude Mythos 模型的开源理论实现,由 kyegomez 基于公开研究和推测构建。它采用循环深度Transformer(RDT)架构,包含序曲(Prelude)、循环块(Recurrent Block)和尾声(Coda)三个阶段。其核心在于循环块,可进行多次迭代以实现深度推理,从而实现计算自适应和深度可变的推理能力。该模型支持MLA和GQA两种注意力机制,并使用稀疏MoE(Mixture of Experts)实现路由和共享专家。OpenMythos旨在通过更少的参数实现与更高参数量模型相当的性能。
DeerFlow(深度探索与高效研究流程)是一个由字节跳动开发的开源超级Agent协调框架,旨在通过编排子Agent、内存和沙盒来执行各种复杂任务。它核心驱动力在于可扩展的技能系统,支持用户自定义和集成功能。DeerFlow 2.0是其全新重写的版本,提供了更强大的Agent能力和灵活的部署选项,推荐搭配 Doubao-Seed-2.0-Code、DeepSeek v3.2 和 Kimi 2.5 等大型语言模型使用,并集成了InfoQuest智能搜索与抓取工具集。
Granian 是一款基于 Rust,并充分利用 Hyper 和 Tokio 构建的高性能 HTTP 服务器,专为 Python 应用程序设计。它提供统一且正确的 HTTP/1 和 HTTP/2 实现(并计划支持 HTTP/3),全面兼容 ASGI/3、RSGI 和 WSGI 应用程序接口。Granian 旨在通过单一依赖精简部署,提供卓越的并发处理能力和稳定的高吞吐量,尤其擅长处理 WebSocket 连接。同时,它还支持 HTTPS、mTLS 和静态文件直传,是追求现代化、高性能、高并发 Python 服务部署的理想选择。
Fincept Terminal 是 Fincept-Corporation 开发的一款先进的金融智能桌面应用。它采用纯 C++20 原生技术构建,利用 Qt6 负责用户界面和渲染,并嵌入 Python 进行高级分析。该平台提供 CFA 级别的专业金融分析能力、AI 自动化以及广泛的数据连接,旨在提供媲美 Bloomberg 终端的性能,支持股票研究、投资组合管理、实时新闻和可视化工作流等功能。
caveman 是由 JuliusBrussee 开发的一款智能代理(Agent)技能/插件,旨在通过模仿“原始人式”的简洁语言来大幅减少大型语言模型(LLM)的输出令牌数量,同时保持技术内容的完整性和准确性。它能将输出令牌削减约 75%,并提高响应速度约 3 倍。此外,它还提供了输入压缩工具,能削减约 46% 的输入令牌。产品支持多种简洁程度(Lite, Full, Ultra, 文言文模式),并提供用于生成简洁提交信息和代码审查的专用命令。
Browser-Use 是一款强大的 AI 驱动浏览器自动化工具,通过自然语言或 Python 代码,帮助用户实现网页交互、数据抓取及复杂任务自动化。它提供开源 Agent 供本地部署,并有功能更强的云 Agent 服务,支持隐身浏览、代理轮换和高级集成,显著提升自动化效率与准确性。
MemPalace是一个本地优先的AI记忆工具,它逐字存储对话历史,并通过语义搜索进行检索,避免了总结或改写。该工具采用结构化索引,将信息组织成“翼”、“房间”和“抽屉”,从而支持范围化的搜索。其检索层可插拔(默认使用ChromaDB),确保所有数据在本地处理,除非用户明确选择。在LongMemEval基准测试中,MemPalace无需LLM或API调用即可实现96.6%的R@5召回率,展现出卓越的本地化高性能。
VoiceFlow 是一个高效的文本到语音(TTS)系统,它基于整流流匹配(Rectified Flow Matching)技术,旨在解决传统扩散模型在语音合成效率上的不足。该产品是其ICASSP 2024论文的官方实现,通过学习噪声与数据之间的连续流来生成高质量的梅尔频谱图,并通过流整流过程进一步优化采样轨迹,从而在有限的采样步数下实现卓越的合成质量和效率。它提供了Kaldi风格的数据组织和灵活的训练配置,并支持监督持续时间建模和实验性的语音转换功能。
由 Google 开发的 Magika 是一款创新的 AI 驱动文件类型检测工具,它利用深度学习的最新进展提供卓越的检测精度。Magika 采用一个高度优化、仅数兆字节大小的定制模型,即使在单核 CPU 上也能在毫秒级内实现精准的文件类型识别。该工具在涵盖 200 多种内容类型(包括二进制和文本格式)的约 1 亿个样本数据集上进行训练和评估,在测试集上平均准确率高达 99%,尤其在文本内容类型上表现出色。Magika 目前已在 Google 内部大规模应用,每周处理数千亿样本,用于提升 Gmail、Drive 和安全浏览文件的安全性,并与 VirusTotal 等第三方平台集成。它以命令行工具、Python API 及多种语言绑定形式提供,为开发者和安全专家提供了高效、灵活且高度可靠的文件识别解决方案。
Agent Lightning是由微软开发的一款创新的、与框架无关的AI Agent训练平台,旨在通过极小的代码改动,显著优化AI Agent的性能。它赋能开发者利用强化学习、自动提示优化和监督微调等一系列先进算法,提升基于任何Agent框架(如LangChain、AutoGen,乃至自定义Python实现)构建的Agent的效率与鲁棒性。该平台的核心优势在于能够精准地对复杂多Agent系统中的特定Agent进行选择性优化,从而实现更精细的控制和性能提升。Agent Lightning采用轻量级架构,为Agent从首次部署到实现稳定、算法驱动的持续改进提供了清晰且无缝的路径,有力促进了强大、适应性强且高度可控的AI Agent的开发与迭代。
Maigret 是一款强大的开源 OSINT 调查工具,仅需用户名即可在 3000 多个网站上自动检索并收集个人档案。它通过解析网页和 API 提取信息,无需 API 密钥。核心功能包括:支持递归搜索(利用发现的新 ID 继续追踪)、绕过验证码与审查机制、以及集成 AI 模式自动生成调查摘要。它能生成 PDF、HTML、XMind 等多种专业报告,并提供 Web 界面和 Python 库调用,广泛用于网络安全和身份分析。
RAG-Anything是HKUDS开发的一体化多模态RAG框架,基于LightRAG构建。它旨在解决传统RAG系统无法有效处理文本、图像、表格、公式等多模态内容的问题。该系统提供端到端的多模态文档处理,通过智能解析、多模态内容理解和知识图谱构建,实现跨模态的无缝检索和查询,无需多种专用工具,支持VLM增强查询。
Deep-Live-Cam是一款由hacksider开发的实时AI换脸和视频深度伪造工具。它允许用户通过单次点击和一张图像,即可实现实时的人脸替换和深度伪造视频。该工具旨在成为AI生成媒体行业的生产力工具,可用于动画制作、内容创作、服装设计等。其工作原理是通过选择一个源人脸和目标图像/视频或摄像头,然后一键启动实时换脸。它支持多种平台和GPU加速,并内置了道德审查机制,防止处理不当内容。
LangChain作为业界领先的AI Agent工程平台,致力于简化大型语言模型(LLM)驱动应用的开发与部署。它提供强大的框架,通过连接可互操作的组件和丰富的第三方集成,赋能开发者高效构建智能体及LLM应用。核心优势在于支持实时数据增强、确保模型互操作性、加速快速原型迭代及提供生产级特性。结合LangGraph的低层级编排与LangSmith的监控调试工具,LangChain为构建高性能、可维护的AI解决方案提供全面的端到端支持,确保应用面向未来。
TuriX-CUA 是 TurixAI 开发的 AI 驱动的桌面自动化智能体,使强大的 AI 模型能够直接在桌面上执行实际操作。它搭载了先进的计算机使用代理(CUA),在 OSWorld 风格的 Mac 基准测试中达到 80% 的成功率。TuriX 核心开源且个人与研究用途免费,支持用户更换自定义模型。最新版本 TuriX SuperPower 结合了 CUA 与 CLI 工作流,能处理日常办公和编程自动化任务,实现图形界面和命令行操作的无缝衔接。
geo-seo-claude是一款革命性的AI Agent产品,专为应对AI驱动搜索引擎生态系统(包括Claude、ChatGPT、Perplexity、Gemini和Google AI Overviews)的快速演变而设计。它创新性地采用“GEO优先,SEO辅助”策略,旨在帮助网站从传统搜索向AI发现的流量转移中捕捉机遇,同时巩固传统SEO基础。该Agent提供全面的功能,涵盖AI可引用性评分、AI爬虫深度分析、跨平台品牌提及扫描,以及llms.txt文件生成。通过并行子代理执行全面的GEO+SEO审计,并生成专业的、客户可用的Markdown或PDF报告,提供优先级明确的行动计划,确保数字资产在AI时代保持领先地位。适用于希望在未来AI搜索市场中取得优势的企业和GEO机构。
Onyx 是一个开源的 AI 平台,作为大型语言模型(LLM)的应用层,提供功能丰富的界面,易于部署和托管。它通过 Agentic RAG、深度研究、网络搜索、代码执行和文件创建等高级功能,增强 LLM 的能力。Onyx 支持超过 50 种基于索引的连接器,并提供轻量级和标准两种部署模式,同时为企业用户提供协作、单点登录、RBAC 和审计等增强功能。它提供社区版(MIT 许可)和企业版,可部署在 Docker、Kubernetes 等多种环境中。
AutoAgent是HKUDS推出的一款前沿的全自动化、零代码大语言模型Agent框架。它赋予用户通过纯自然语言驱动的方式,无需任何编程知识即可构建、部署和编排复杂的LLM Agent系统。其核心优势在于智能化的Agent构建、工具创建和工作流生成能力,能够根据高层级任务描述动态优化和自适应工作流。AutoAgent包含强大的“用户模式”,作为AI研究助手擅长信息检索、复杂分析及报告生成,并提供“Agent编辑器”和“工作流编辑器”模式,通过对话式交互实现工具和Agent的个性化定制,极大降低了AI开发门槛,加速各行业智能化应用落地。
tradingview-mcp 是一个先进的AI驱动交易智能框架和MCP服务器,专为加密货币与股票市场提供实时分析和高置信度交易决策辅助。它集成了30多种专业技术指标、多策略回测引擎、实时社交媒体情感分析,并部署了专业的AI代理(技术分析师、情绪动量分析师、风险经理)进行协同判断,生成高置信度的买卖信号。该框架开源、可在5分钟内快速部署,且无需API Key,广泛兼容Claude Desktop和OpenClaw(支持Telegram、WhatsApp等),是个人投资者和量化分析师的强大、经济高效的交易智能解决方案。
Claude Code Templates 是专为 Anthropic Claude Code 命令行工具打造的高级配置与资源集。它通过 aitmpl.com 提供超过 100 个预设的 AI Agent、自定义斜杠命令、MCP 外部集成、自动化钩子和项目模板。该工具集允许开发者通过 npx 一键安装专业化角色(如安全审计员、React 性能优化器)和工作流插件。此外,它还包含实时会话监控、性能分析看板和环境健康检查等进阶工具,极大增强了 AI 辅助开发的生产力。
AI-Trader是由HKUDS匠心打造的100%全自动AI Agent原生交易平台,专为智能体提供专属的金融市场交互环境。它支持OpenClaw、nanobot等主流AI Agent通过一条指令快速集成,实现集合智能交易。平台核心功能包括跨平台信号同步、一键跟单、普遍市场访问(涵盖股票、加密货币、外汇、期权、期货等),并设有奖励系统以激励信号发布与跟单。AI-Trader不仅赋能智能体进行策略交流与交易,也为人类交易员提供风险自选的模拟交易和跟单服务,旨在构建一个AI驱动的、协作式金融交易生态系统,全面提升金融市场效率与智能化水平。
openai-cs-agents-demo 是一个基于 OpenAI Agents SDK 构建的客户服务界面演示。它包含一个 Python 后端处理 Agent 编排逻辑,以及一个基于 Next.js 和 ChatKit 的前端 UI,用于可视化 Agent 协作过程和提供聊天界面。该演示展示了多 Agent 系统如何智能地路由请求、处理复杂任务并利用安全防护机制(如相关性检测和越狱防护),为开发者提供了构建可扩展、透明的 AI Agent 应用的参考范例。
MoneyPrinter V2(MPV2)是一个旨在自动化在线赚钱流程的应用程序。作为MoneyPrinter项目的第二版,它进行了彻底重写,专注于提供更广泛的功能和更模块化的架构。该工具集成了自动化Twitter Bot和YouTube Shorts生成器,并利用CRON任务进行定时调度发布。它支持Amazon联盟营销和Twitter推广,同时还能协助用户发现本地商家并进行冷启动外联,旨在通过自动化技术提升在线盈利效率,简化内容创作和营销活动。
graphify是一款专为AI Agent打造的多模态知识图谱构建工具,深度集成于Claude Code环境。它能将代码、文档、论文、图片、视频链接等多样信息源转化为可查询的结构化知识图谱,并利用Claude Vision智能提取概念与关系。产品显著提升信息检索效率,每次查询可节省高达71.5倍Token消耗,并支持图谱跨会话持久化。通过智能识别“核心节点”、“意外连接”并提供“建议问题”,辅以自动同步机制,graphify为开发者和研究人员提供高效智能辅助与知识管理能力。
HelloGitHub 是一个致力于分享 GitHub 上有趣、入门级开源项目的专业月刊。每月28日定期发布,内容涵盖精选开源项目、开源书籍、实战案例及企业级解决方案,旨在帮助开发者,特别是初学者,快速领略开源世界的魅力,降低参与门槛,激发对开源的兴趣与热情。
mem0 是专为 AI Agent 和助手设计的通用智能记忆层,致力于实现高度个性化与持续学习。它通过创新的多级别记忆机制(用户、会话、Agent 状态)无缝捕获并保留上下文和用户偏好。其核心优势在于强大的 V3 记忆算法,该算法集成单通道提取、实体链接及多信号检索技术,显著提升了记忆准确性和召回率,并在 LoCoMo 和 LongMemEval 基准测试中展现出卓越性能。mem0 提供开发者友好的 API 和跨平台 SDK,广泛应用于智能客服、个性化助手等场景,赋能开发者构建能够深度理解并适应用户需求的智能系统。
supervision是Roboflow开发的开源计算机视觉工具库,旨在为开发者提供一套高效、可复用的工具集,以简化CV应用的开发与部署。它具备出色的模型无关性,能够无缝集成Ultralytics、MMDetection等主流分类、检测和分割模型。该库提供丰富的可定制化标注器,用于清晰高效地可视化模型输出,并包含强大的数据集管理功能,支持COCO、YOLO和Pascal VOC等多种格式数据的加载、切分、合并与转换。supervision显著提升了数据处理、模型推理和结果呈现的效率,特别适用于实时视频流分析、目标跟踪及行为分析,如滞留时间分析和车辆速度估算。
daily_stock_analysis是由ZhuLinsen开发的一款基于AI大模型的智能股票分析系统。它每日自动分析A股、港股和美股等自选股,并生成包含核心结论、评分、买卖点位、风险警报及操作清单的“决策仪表盘”。该系统支持将分析结果通过企业微信、飞书、Telegram、Discord、Slack和邮件等多种渠道自动推送。同时,它集成了技术面、实时行情、筹码分布、新闻舆情等多维度分析,支持全球市场,并内置了多种市场策略(如均线、缠论、波浪理论)。用户可通过Web工作台进行手动分析、配置管理、历史报告查看、回测及Agent策略问股。
AgentScope 是由阿里团队推出的面向生产环境的多智能体框架。它通过高层抽象简化了智能体构建流程,支持 ReAct 模式、长短期记忆管理及复杂规划。其核心理念是充分发挥 LLM 的推理与工具调用能力,而非通过严格指令约束模型。框架内置支持实时语音交互、人机协同(Human-in-the-loop)、Agentic RL 强化学习训练,并兼容 MCP 与 A2A 协议。支持本地、云端及 K8s 分布式部署,集成了 OTel 监控,适用于构建高可靠的工业级 Agent 应用。
“free-llm-api-resources” 是一个由 cheahjs 维护的GitHub开源项目,旨在整理并提供免费或提供试用积分的大型语言模型 (LLM) API 资源列表。它详细列出了各种服务提供商(如 OpenRouter、Google AI Studio、NVIDIA NIM 等)及其支持的LLM模型、API限制(如请求频率、令牌限制)等信息。该项目强调只收录合法的服务,不包含通过逆向工程现有聊天机器人获得的非正规资源,并鼓励用户合理使用以维护这些免费资源。
Claude How To 是 luongnv89 开发的一个结构化、可视化、示例驱动的指南,旨在帮助用户快速掌握 Claude Code 的各项功能。它通过提供10个模块的教程、可复制粘贴的配置模板、Mermaid图表和分阶段的学习路径,将用户从Claude Code的基础操作引导至高级代理、钩子、技能和MCP服务器的编排,解决官方文档缺乏实践指导和系统学习路径的问题。
AbletonMCP通过Model Context Protocol (MCP) 将Ableton Live与Claude AI连接,使Claude能直接控制Ableton Live进行AI辅助音乐制作、音轨创建和Live会话操作。它支持双向通信,允许AI创建、修改音轨、加载乐器效果、创建MIDI剪辑以及控制播放和会话参数,极大地提升了音乐创作的自动化和智能化水平。
Ragas 是一个由 vibrantlabsai 开发的开源 Python 库,专为评估和优化大型语言模型(LLM)应用而设计。它通过提供客观的评估指标(包括基于LLM和传统指标)、智能测试集生成以及数据驱动的洞察,帮助开发者摆脱主观、耗时的评估流程。Ragas 能够自动创建覆盖广泛场景的测试数据集,并能与 LangChain 等流行LLM框架以及主流可观测工具无缝集成,从而构建生产数据驱动的持续改进反馈循环。
Pixelle-Video 是 AIDC-AI 开发的一款 AI 全自动短视频引擎,用户只需输入一个主题,即可自动完成文案撰写、AI 生成配图/视频、语音解说、背景音乐及视频合成。它基于模块化设计和 ComfyUI 架构,支持灵活定制和多种AI模型,实现零门槛、零剪辑经验的视频创作。
TradingAgents 是由 TauricResearch 开发的多智能体大型语言模型(LLM)金融交易框架。它通过部署专业化的LLM驱动智能体(包括基本面、情绪、新闻、技术分析师、多方研究员、交易员、风险管理团队和投资组合经理)来模拟真实世界的交易公司运作。这些智能体协同评估市场状况,通过动态讨论形成交易决策。该框架基于LangGraph构建,提供高度的灵活性和模块化,并支持多种主流LLM提供商,同时具备持久化决策日志和检查点恢复功能,主要用于研究目的。
Google Gemma 是 Google DeepMind 推出的一系列轻量级、最先进的开源大语言模型家族,其核心技术源自 Google 的 Gemini 模型。该系列涵盖 1B、4B、12B 和 27B 等多种参数规模,具备强大的多模态理解能力(支持文本与图像输入)和长达 128K tokens 的超长上下文处理能力。凭借高效设计,Gemma 可在单张 GPU 乃至个人笔记本电脑上流畅运行,极大降低了本地部署和开发的门槛,是轻量级应用、原型开发及资源受限环境下AI部署的理想选择。
Video-subtitle-remover (VSR) 是一款基于 AI 技术的开源视频硬字幕去除工具。它在保持无损视频分辨率的前提下,利用 STTN、LAMA 和 PROPAINTER 等超强 AI 模型,精准抹除硬字幕并对该区域进行智能背景填充。它支持全视频自动识别或自定义区域去除,支持图片批量去水印,并兼容多种显卡硬件加速。
本项目是一个针对 AI Agent 的全栈学习路线图与资源库。它通过结构化的 8 个阶段,引导学习者从 LLM 基础、提示词工程逐步进阶到多 Agent 编排及生产级应用。其核心采用“双路径”设计:Track A 侧重于 CLI 工具的高效使用,Track B 专注 Agent 系统构建。项目深度集成 Claude Code 生态,涵盖 MCP、Skills 与插件系统,并提供 27 个练习案例与 145+ 精选资源,旨在将 LLM 使用者转化为 Agent 系统构建者。
PPT Master是hugohe3开发的一款开源AI工具,能够将PDF、DOCX、URL或Markdown等多种文档内容智能转换为原生可编辑的PPTX演示文稿。它通过AI代理在本地执行,生成包含真实形状、文本框和图表的幻灯片,而非静态图片。产品支持自动页面过渡、元素动画、以及基于演讲稿生成语音旁白和视频导出,并可通过克隆声音实现个性化。其特点在于确保高度可编辑性、数据本地化处理和透明的AI模型使用成本。
AiPy 是一个专为中国市场量身定制的 AI Agent 开发框架,旨在为开发者提供 OpenClaw 的本土化高效替代方案。该框架基于 Python 深度优化,无缝契合中国开发者的工作流与使用习惯。其核心优势在于对内置中文大型语言模型(LLM)的卓越适配,确保智能体应用能高效理解并处理中文语境。同时,AiPy实现了与国内主流云服务平台的紧密集成,极大简化了智能体应用的构建、部署与管理。它赋能开发者便捷高效地利用中国特色AI生态及云资源,加速AI创新,特别适用于对本土化AI基础设施和数据处理能力有需求的场景。
DeepTutor是HKUDS开发的一款Agent原生的个性化智能辅导平台。它通过统一的聊天工作区整合了多种智能代理模式,包括问题解决、测验生成、深度研究等。产品特色是AI协作式Co-Writer,能将材料转换为互动式“活教材”,并利用知识库和持久记忆为用户提供个性化、持续进化的教学体验。
Anthropic 面向金融服务行业推出的智能代理、技能和数据连接器集合,旨在加速投资银行、股权研究、私募股权和财富管理等核心金融工作流程。它以Claude Cowork插件或Claude Managed Agents API的形式提供,帮助分析师快速生成财务模型、备忘录、研究报告、对账单等工作成果。所有输出均需人工审核,不提供投资建议或执行交易,专注于利用Claude能力辅助专业人士分析工作。
TradingAgents 中文增强版是一个面向中文用户的多智能体与大模型股票分析学习平台。它基于 Tauric Research 的 TradingAgents 框架进行深度优化与本地化,提供全面的中文化学习中心、A股/港股/美股数据分析支持。该平台采用 FastAPI 作为后端、Vue 3 作为前端构建现代化 Web 应用,并结合 MongoDB 和 Redis 实现高性能数据管理。旨在帮助用户系统化地学习和研究如何运用多智能体交易框架与 AI 大模型进行合规的股票分析与策略实验,不提供任何实盘交易指令,定位为学习与研究工具。
“AI对冲基金模拟系统”是virattt团队开发的一款创新型概念验证项目,旨在深入探索人工智能在模拟交易决策中的应用潜力。该系统采用先进的模块化多智能体架构,巧妙融合了13位知名投资大师的哲学思想,并辅以专业的估值、情绪、基本面、技术分析、风险管理及投资组合管理智能体。它能够生成交易信号、计算股票内在价值、分析市场数据,并进行风险评估与模拟投资组合决策。本系统专为教育和研究目的设计,提供命令行和Web应用两种运行方式,支持多款大型语言模型和全面的回测功能,但不进行任何实际交易。
CocoIndex 是一个开源的增量索引框架,专为 AI Agent 和大型语言模型 (LLM) 应用提供实时、持续更新的上下文。它通过增量同步引擎,将代码库、会议记录、Slack 消息等企业语料库处理为高质量、始终新鲜的数据,仅重新处理发生变化的部分(Δ),从而确保 AI Agent 拥有最新且可靠的信息进行推理,避免上下文过时的问题。
ProgramBench 是由 facebookresearch 开发的一个基准测试,旨在评估语言模型(LLM)从零开始重建程序的能力。它挑战 AI Agent 仅根据已编译的二进制文件及其文档,来架构和实现一套完整的代码库,以复现原始程序的行为。这是一个评估大型语言模型在逆向工程和代码生成方面表现的重要工具。
CutClaw是GVCLab匠心打造的一款创新型AI Agent产品,专为长视频自动化编辑而生。它通过先进的智能音乐同步技术,深度分析数小时的视频素材与背景音乐的节奏、节拍和情绪。CutClaw能精确智能地裁剪、组织视频片段并应用过渡效果,其核心优势在于将海量视频内容与音乐无缝对齐,从而生成具有专业级流畅度和节奏感的视频作品。这极大地简化了传统视频编辑中耗时耗力的音画同步工作。CutClaw特别适用于内容创作者、活动记录者及各类需要将冗长素材快速转化为精炼、引人入胜的音乐同步视频的用户,显著提升视频制作效率与内容质量。
notebooklm-skill 是专为本地 Claude Code 设计的增强插件,通过 Patchright 自动化技术使 Claude 能直接检索并分析用户在 Google NotebookLM 中托管的文档。它解决了本地 RAG 配置复杂、长文本 Token 消耗高以及模型幻觉等痛点。开发者只需将文档上传至 NotebookLM,Claude 即可在 CLI 中获取基于原始来源的、带引用的精准答案,实现无缝的知识库查询与代码编写协作。
Nanobot 是一个由开源社区驱动的轻量级MCP主机,专注于简化基于模型上下文协议(MCP)的智能代理应用开发。它提供高度灵活的部署和无缝集成能力,使用户能够通过简洁的配置,轻松连接如OpenAI、Anthropic等大型语言模型与各类MCP服务器。借此,开发者可快速构建并管理支持聊天、语音等多模态交互的AI代理。Nanobot致力于实现全面MCP兼容,旨在显著降低AI代理的开发门槛,赋能创新应用的快速落地。
Langflow 是一个功能强大的 AI 代理与工作流构建平台。它通过可视化界面让开发者能以拖拽方式快速搭建、测试和迭代 AI 应用。该工具支持所有主流大模型、向量数据库及多种 AI 工具。其核心优势在于支持多智能体编排,并内置 API 与 MCP 服务端支持,允许将工作流无缝集成到任何技术栈。用户可通过 Python 自定义组件,并在交互式操场中实时调试,满足从原型到企业级生产的需求。
MiniMind 是一个旨在降低大模型门槛的极简开源项目,支持从 0 开始训练仅 64M 的超小语言模型。它采用 PyTorch 原生实现,主线结构对齐 Qwen3 生态,完整覆盖预训练、SFT、RLHF、Agentic RL(GRPO/CISPO)等全链路技术。项目强调“白盒”学习,通过极简代码让用户在单张消费级 GPU 上以极低成本(如3元/2小时)即可完整复现大模型,并支持多模态扩展(视觉/Omni)与思考链(CoT)能力。
GenericAgent是一个极简、可自我进化的自主Agent框架,核心代码仅约3K行。通过9个原子工具和约100行的Agent Loop,赋予任意LLM对本地计算机的系统级控制能力,覆盖浏览器、终端、文件系统、键鼠输入、屏幕视觉及移动设备。它不预设技能,而是通过每次任务执行自动固化技能,形成专属技能树,能力随使用持续增长,同时具有极致的Token效率。
GLM-OCR是一款基于GLM-V编解码架构的多模态OCR模型,专为复杂文档理解设计。它整合CogViT视觉编码器与GLM-0.5B语言解码器,并引入MTP损失和强化学习,实现训练效率、识别精度及泛化能力的显著提升。模型在OmniDocBench V1.5上取得94.62分的SOTA性能,特别擅长处理公式、表格和信息抽取。参数量仅0.9B,支持vLLM、SGLang等高效部署,推理延迟低且成本优化,是高并发及边缘场景下实现精准、快速文档智能处理的理想选择,并提供完善的SDK和工具链,全面开源易于集成。
Kronos是首个针对金融K线序列的开源基础模型,在超过45个全球交易所数据上训练。它采用独特的两阶段框架:先通过专业分词器将连续多维K线数据量化为分层离散标记,再由大型自回归Transformer模型进行预训练。Kronos专为处理金融数据的高噪声特性而设计,可作为统一模型用于各类量化任务。
wshobson/agents 是一个为 Claude Code 深度定制的生产级多智能体编排与自动化生态系统。它集成了 80 个专用插件、185 个领域专家 Agent、153 项专业技能和 100 个实用命令。该产品采用粒度化架构,支持渐进式披露以最大限度优化 Token 消耗。其核心优势在于强大的多智能体协同能力,涵盖全栈开发、安全审计、云原生运维及质量评估框架 PluginEval,能将 AI 转化为具备实战能力的自动化劳动力。
Hiring Agent 是由 HackerRank (Interviewstreet) 开源的 AI 简历评估与打分工具。它构建了一条端到端的简历评分流水线,能将 PDF 格式的简历解析为 Markdown,并通过本地 Ollama 或云端 Gemini 提取结构化数据。同时,该工具还能抓取候选人的 GitHub 资料及代码库信号进行数据增强,最终根据内置的公平性约束,输出包含类别得分、加扣分项及详细证据的客观评估报告。
针对微信 4.0 (Windows/macOS/Linux) 开发的本地数据库解密与监控工具。通过扫描微信进程内存提取 SQLCipher 4 密钥,实现全量数据库解密及实时消息监听。其核心亮点是内置了 MCP 服务,能将微信聊天记录、联系人及语音转译能力直接接入 Claude 等 AI Agent 生态,支持富媒体解析、Whisper 语音转文字及 V2 格式图片解密,是构建个人微信 AI 助手的关键基础设施。
ARIS (Auto-claude-code-research-in-sleep) 是一款专为机器学习研究设计的自动化 AI Agent 工作流工具,深度集成于 OpenClaw 生态并兼容 Claude Code、Cursor 等主流 AI IDE。其核心采用“执行者+审阅者”的双模型对抗架构(如 Claude 执行实验,GPT-5.4 进行严格审阅),通过协同工作避免单模型盲点。ARIS 涵盖了从选题调研、代码实验、论文撰写到 Rebuttal 辩护及 PPT 生成的全流程。系统完全基于 Markdown 技能文件,无依赖且支持自我进化与持久化科研知识库。
基于 AST(抽象语法树)的语义代码搜索工具,构建于高性能 Rust 引擎 CocoIndex 之上。它通过理解代码结构而非简单的关键词匹配,实现精准的语义检索,并能为 AI Agent 节省高达 70% 的 Token。该工具支持作为 Skill 或 MCP 服务无缝接入 Claude Code、Cursor 等主流编程助手,具备零配置、支持本地/云端向量化等特点,让代码库搜索更高效、智能。
fireworks-tech-graph 是一款专为开发者和 AI Agent 生态设计的技术架构绘图工具。它能够将中英文自然语言描述直接转换为专业级的 SVG 和 PNG 图表,无需用户手动绘图或编写复杂的 DSL 代码。该工具深度适配 AI/Agent 领域,支持 RAG、多智能体协作、Mem0 架构等 14 种 UML 及领域专用图表。内置 7 种视觉风格(如 Claude/OpenAI 官方风、深色终端、蓝图等),并提供高分辨率导出,是技术文档和架构设计的效率利器。
Agent-Reach 是一个为 AI Agent(如 OpenClaw、Claude Code、Cursor)打造的互联网能力脚手架。它通过一键安装脚本,自动为 Agent 集成 Twitter、YouTube、Reddit、小红书等数十个平台的 CLI 工具与 MCP 插件,使其具备实时检索、网页阅读与视频解析能力。该工具旨在解决 Agent 无法访问动态内容或 API 昂贵的问题,采用本地 Cookie 存储确保隐私,并提供自动化环境诊断,让 Agent 真正具备“联网”执行力。
Edict 是一款基于古代“三省六部”制度设计的 OpenClaw 多智能体协作架构。它由12个专属 Agent 组成,包含太子分拣、中书规划、门下审核、尚书派发及六部并行执行。相比传统框架,它引入了强制的制度性审核机制(可封驳打回)和军机处实时可视化看板,支持任务中途干预、热切换模型和完整流转审计,彻底解决了多智能体协作中的黑盒与失控问题。
TrendRadar 是一款轻量级全平台热点聚合助手,支持最快 30 秒快速部署。它通过 RSS 与 API 获取多维实时热讯,并集成 AI 智能筛选、翻译与摘要分析功能。其核心能力在于利用自然语言定义兴趣(AI Interests),并支持将精选内容一键推送到企业微信、飞书、钉钉、Telegram 等 9+ 个主流通知渠道。该工具深度集成 MCP 协议,可作为 AI Agent 的能力插件,提供实时的外部资讯获取与结构化分析支持。
CLI-Anything 是一个开创性的平台,旨在将任何传统软件无缝转化为“代理原生”工具,使 AI Agent 能够直接、高效地进行控制。它通过构建灵活的命令行接口(CLI),有效弥合了人工智能与全球庞大软件生态系统之间的鸿沟,赋能 Pi、OpenClaw 和 Claude Code 等 AI Agent 自主操作多领域应用。核心 CLI-Hub 提供集中式的发现、安装和管理机制,汇聚了涵盖生产力、开发、创意和游戏等广泛领域的社区贡献命令行封装。凭借严格测试、多源安装支持及 JSON/人类可读输出,CLI-Anything 助力 AI Agent 自动化复杂工作流程,并产出现实世界的丰富成果。
MiniCPM-V 是由 OpenBMB 开发的端侧多模态大模型,专注于高效的图像和视频理解。它采用 Intra-ViT 早期压缩技术和 LLaVA-UHD v4 架构,显著降低了视觉编码计算开销,支持混合 4x/16x 视觉标记压缩。该模型以 1.3B 的极小参数量实现了超越大尺寸模型的性能,支持在 iOS、Android 和鸿蒙等移动端流畅运行,具备强大的实时视觉对话、OCR 识别及视频分析能力。
Paper2Code 是一个由多智能体大型语言模型(LLM)系统 PaperCoder 驱动的工具,旨在自动化从机器学习科学论文生成可执行代码仓库的过程。它遵循规划、分析和代码生成三阶段流水线,每个阶段由专门的智能体处理。该方法在 Paper2Code 和 PaperBench 基准测试中表现优异,能生成忠实且高质量的实现,支持通过 OpenAI API 或 vLLM 使用开源模型。
Agent-S 是由 Simular AI 开发的开源 GUI 智能体框架,旨在通过智能体-计算机接口 (ACI) 实现对电脑的自主控制。它结合前沿大语言模型与视觉基础模型(如 UI-TARS),将自然语言指令转化为精准的键鼠动作。最新版本 Agent S3 支持本地代码执行(Python/Bash)及行为最佳选择机制,不仅展现出跨平台的零样本泛化能力,更是首个在 OSWorld 评测中超越人类表现 (72.6%) 的系统。
这是一个非官方的 Claude Code 中文本土化上手指南。它基于上游项目 'luongnv89/claude-howto' 进行 fork 和重写,旨在帮助中国用户从基础操作逐步掌握 Claude Code 的高级功能,如组合使用 slash commands、memory、skills、hooks、MCP、subagents 和 plugins。该指南通过重新组织表达、补充中国用户常见障碍说明,并保留关键可执行标识以确保兼容性,为学习 Claude Code 提供一条可落地的学习路径。
nature-skills 是一个不断增长的 Claude 技能集合,旨在帮助用户创作符合《自然》(Nature)期刊标准的学术作品。它目前涵盖了科学图表生成、手稿润色、数据可用性声明准备以及论文转演示文稿等工作流程。其核心理念是所有技能的规则都来源于《自然》期刊已发表论文、作者指南和结构化写作课程等一手资料,确保输出内容的专业性和准确性。这些技能通过预设的触发关键词,辅助用户完成高质量的学术出版任务。
Khazix Skills 是数字生命卡兹克开源的一套 AI 技能和 Prompt 集合,旨在提升 AI Agent 的实用性和工作效率。它包含结构化的技能指令集(遵循 Agent Skills 开放标准),可直接被 Claude Code、Codex、OpenClaw 等 Agent 加载使用,以及可复制粘贴到主流对话模型(如 ChatGPT、Claude、Gemini)的提示词。涵盖了文档对齐、深度研究报告生成、个性化写作风格和 AI 热点资讯查询等实用功能。
VoxCPM 是一个无需分词器的文本到语音系统,通过端到端的扩散自回归架构直接生成连续语音表示,从而实现高度自然和富有表现力的语音合成。最新版本 VoxCPM2 是一个拥有20亿参数的模型,在超过200万小时的多语言语音数据上训练,支持30种语言、语音设计、可控语音克隆和48kHz录音室品质的音频输出,内置超分辨率,无需外部升采样器。
awesome-llm-apps 是 Shubhamsaboo 创建的一个精选仓库,提供了超过100个可立即运行的AI Agent和RAG应用模板。它是一个实用的代码食谱,旨在帮助开发者快速克隆、定制和部署生产级LLM应用,涵盖了AI Agent、多Agent团队、RAG、语音Agent、Agent技能和微调等现代AI技术栈。每个模板都是独立且经过端到端测试的原创代码,支持多种大型语言模型(如Claude、Gemini、OpenAI、Llama等),并配有免费的逐步教程。
social-auto-upload 是一款强大的自动化工具,旨在帮助内容创作者和运营者高效地将视频和图文内容一键发布到多个国内外主流社交媒体平台,包括抖音、Bilibili、小红书、快手、视频号、百家号和TikTok。该项目通过CLI和模块化设计,支持视频和图文上传、定时发布及多平台扩展。它正进行重构,旨在提供更稳定、隐蔽的自动化方案,并与OpenClaw等AI Agent工具深度集成,实现自动化内容分发。
Awesome Math 是由 rossant 维护的一个高质量数学资源精选列表。该项目通过 GitHub 平台系统地整理了全球范围内优质的数学学习与研究素材,涵盖从基础数学到前沿研究的各个分支。其核心工作方式是采用社区协作模式,精选并分类链接了在线学习平台(如 Khan Academy)、视频课程(如 3Blue1Brown)、符号计算工具(如 WolframAlpha)、专业百科及各领域教材,为学习者和研究者提供一站式的学术资源导航。
基于 Python 异步架构开发的闲鱼全自动管理系统,旨在提升闲鱼卖家的运营效率。系统支持多账号管理、智能关键词与 AI 自动回复、自动发货、商品批量擦亮及多规格商品管理。采用 FastAPI + SQLite 架构,具备完善的多用户数据隔离机制,并支持 Docker 一键部署。通过集成 Playwright 和 DrissionPage 浏览器自动化技术,实现全天候实时消息响应与订单处理,是一款功能强大的自动化辅助 Agent 工具。
CloakBrowser 是由 CloakHQ 开发的深度定制版 Chromium,专为绕过高级机器人检测而生。不同于传统的 JavaScript 注入或配置修补,它在 C++ 源码层面修改了 49 项底层指纹(如 WebGL、Canvas、WebRTC 等),使检测系统将其识别为真实的正常浏览器。它支持 Humanize 行为模拟,能产生真实的鼠标轨迹和点击频率,并能直接作为 Playwright 或 Puppeteer 的替代方案。在 OpenClaw 生态中,它常被用作 AI Agent 执行复杂网页任务的隐身浏览器环境。
A set of ready to use Agent Skills for research, science, engineering, analysis, finance and writing.
code-review-graph是一款AI辅助代码审查工具,旨在通过构建代码的结构化图谱并增量跟踪变更,为AI助手提供精确的上下文,从而显著减少AI模型在代码审查中消耗的Token。它利用Tree-sitter解析代码、SQLite存储图谱,并结合Model Context Protocol (MCP),使AI仅读取变更相关的最小文件集,解决了大型代码库和单体仓库的Token浪费问题,提升审查效率和质量。
Claude Code Telegram Bot 是一款为 Claude Code 提供远程访问的 Telegram 机器人。用户无需终端,即可随时随地通过 Telegram 对代码库进行自然语言查询、分析与编辑。它包含智能对话模式和经典终端指令模式,支持跨设备会话持久化、身份验证及目录沙盒隔离。不仅如此,它还能通过 Webhooks 与定时任务响应 GitHub 及 CI/CD 事件,实现高效的事件驱动自动化编程。
Remote Claude 是一个无缝桥接电脑终端与飞书的协作工具,专为远程管理 Claude Code/Codex 进程设计。它基于 tmux 实现非侵入式终端交互,让开发者可通过手机端飞书实时查看进度、发送指令并确认权限。支持多设备无缝切换与会话共享,彻底打破办公桌限制,实现随时随地掌控 AI 编程。
Semble 是一款由 MinishLab 开发的专为 AI Agent 设计的本地代码搜索库,能有效减少 Agent 探索代码时的 Token 消耗(约减少98%)。它无需 API 密钥、GPU 或外部服务,纯 CPU 本地运行。它通过结合静态嵌入与词汇检索来实现毫秒级的极速响应,准确度媲美代码专用的 Transformer 模型。原生支持作为 MCP 服务器无缝集成到 Claude Code、Cursor、VS Code 等主流 Agent 和 IDE 中。
PandaProbe 是一款由 Chirpz AI 开发的开源 AI Agent 工程平台,旨在帮助开发者协作完成智能体的追踪、评估、监控与调试。它能够捕获 Agent 执行过程中的完整会话、工具调用及 LLM 交互链路,并利用内置异步架构与 LiteLLM 引擎进行 LLM-as-a-judge 的自动化评估。平台支持无缝对接主流智能体框架,提供带有免费额度的云托管以及 Docker 本地自托管方案,是提升生产环境 Agent 可靠性的核心基建。
Browser Harness 是一个轻量级、可自我修复的原生 CDP(Chrome 开发工具协议)工具,旨在将 LLM 直接连接到真实浏览器。它摒弃了僵化的中间件框架,让 Agent 拥有完全的控制自由。其核心特点是“自我完善”:Agent 会在执行任务过程中自动编写和扩展缺失的辅助代码,并动态生成特定网站的专属 Domain Skills。支持本地调试与无头部署,并无缝集成 Browser Use 云端服务。
AnySearch Skill 是专为 AI Agent 打造的统一实时搜索引擎技能。它支持通用网页搜索、垂直领域搜索、并行批量搜索和全页面正文提取。该工具内置了 Python、Node.js、PowerShell 和 Bash 的多运行环境 CLI 脚本,Agent 可通过入口测试自动探测并持久化最佳运行环境。支持无 Key 匿名调用,配置 API Key 后可解锁更高频次与请求配额,具有极高的兼容性与易用性。
MLflow 是领先的开源 AI 工程平台,专为智能体(Agents)、大模型(LLMs)和机器学习模型设计。它提供了一站式服务,允许团队调试、评估、监控和优化生产级 AI 应用。核心功能包括基于 OpenTelemetry 的全面追踪与可观测性、包含50多种内置指标的系统评估、提示词版本管理与自动优化,以及一个用于管理 API 成本和请求路由的统一 AI 网关。开发者可通过简单的 SDK 快速集成。
这是一套从零到一构建 AI 工程能力的开源教程(包含20个阶段、435节课)。它不只教理论,还要求用 Python/TypeScript/Rust/Julia 手写底层算法,并在理解原理后使用主流框架。最突出的是它原生融入了 OpenClaw、Claude 等 AI Agent 生态,每节课都会产出实际可用的 Prompt、Agent 技能或 MCP Server 工具包。
AutoResearchClaw 是一个基于 OpenClaw 生态的自主研发 Agent 框架,旨在通过 23 个阶段的自动化流水线将研究想法转化为完整的学术论文。它支持从文献调研(接入 OpenAlex/arXiv 等)、实验设计、硬件感知沙箱执行到 LaTeX 撰写的全流程。该产品具备“人机协作 (HITL)”模式,允许用户在关键决策点干预。其核心特点包括反幻觉引用验证、多智能体同行评审以及基于 MetaClaw 的自我进化学习能力。
HackingTool 是一个面向安全研究人员和渗透测试人员的一体化黑客工具集合。它集成了超过 185 个工具,涵盖匿名隐藏、信息收集、无线攻击、Web 攻击、漏洞利用框架、后渗透、移动安全、云安全、Active Directory 等 20 个大类。该工具支持 Python 3.10+,提供智能搜索、标签过滤、工具推荐、安装状态显示及一键安装等功能,并支持 Linux、macOS 和 Docker 环境。
Agent Governance Toolkit (AGT) 是微软开源的 AI 智能体运行时治理和安全内核中间件。它提供确定性的策略执行机制,所有工具调用、资源访问与智能体通信在执行前均需经过亚毫秒级防篡改评估。其工作原理是不依赖大模型提示词,而是通过应用层硬拦截实现零信任身份认证、权限沙箱隔离、SRE 控制与 MCP 安全网关。它兼容主流框架,保障多智能体系统的企业级安全。
该产品是 Anthropic 为其终端 AI Agent (Claude Code) 提供的官方插件仓库与分发中心。它作为一个标准化的目录,托管了官方自研及第三方合作伙伴提交的高质量插件。该生态核心基于模型上下文协议 (MCP),允许开发者通过定义 Slash 命令、特定技能 (Skills) 和代理逻辑来扩展 Claude 的能力边界。用户可在终端内通过简易指令实现插件的发现、安装与更新,从而深度定制自动化开发流。
Free Claude Code 是一个轻量级代理服务,旨在免费提供 Claude Code CLI 和 VSCode 扩展的使用,无需 Anthropic API 密钥。它通过智能路由 Anthropic API 请求至 NVIDIA NIM (包含免费额度)、OpenRouter、DeepSeek、LM Studio、llama.cpp 或 Ollama 等后端提供商。该代理支持模型映射、思维块解析、启发式工具解析及API请求优化,有效降低了开发成本并提升了灵活性,支持远程自主编程和多种集成方式。
Honcho 是 plastic-labs 推出的一款创新的开源记忆库及托管服务,专为构建有状态 AI Agent 而设计。它提供卓越的跨模型、框架和架构兼容性,赋能 Agent 为用户、其他 Agent、群组等任意实体建立并持续维护动态状态。作为一个持续学习系统,Honcho 能够智能地理解并适应实体随时间的变化,从而显著提升 Agent 的用户留存率和信任度。其核心功能涵盖了强大的应用程序工作流管理、全面的交互历史存储,并利用其先进的推理能力来智能指导 Agent 的行为。通过提供直观的自然语言查询、精细的会话上下文管理和高效的消息搜索等能力,Honcho 使得开发者能够轻松构建高度智能化、能提供深度个性化体验的聊天机器人和 AI Agent。无论您是需要自托管还是使用其托管服务,Honcho 都是您构建下一代智能系统的理想选择。
Databricks AI Dev Kit 是一款由官方专家主导的 AI 辅助开发工具包。它通过提供 75+ 个 MCP 可执行工具、核心 Python 库以及一套沉淀最佳实践的技能包,让 Cursor、Claude Code 等本地 AI 助手能无缝接入 Databricks 环境,高效构建 Spark 管道、MLflow 实验及全栈应用。
OpenSquilla 是一款高性价比的微内核 AI Agent,适用于 CLI、Web UI 和各类聊天渠道。其核心是通过本地模型路由器(SquillaRouter),将每轮对话动态分发给能胜任的最具性价比的模型,从而实现 Token 高效利用。它内置持久化记忆、分层沙盒、网络搜索及跨平台多厂商大模型无缝对接功能,能在相同预算下提供更优质的决策结果。
Deep Eye 是一款高级 AI 驱动的自动化渗透测试与漏洞扫描工具。它编排了 OpenAI、Claude、Ollama 等10种大语言模型,能动态切换并智能生成上下文感知的攻击载荷(Payload)。工具内置超45种漏洞扫描模块(覆盖SQLi、XSS等),结合 RAG 增强的 CVE 威胁情报库进行深度扫描。此外,其“AI 分诊”机制可自动过滤误报,并一键生成符合 PCI-DSS/SOC2 等标准的合规安全报告,支持浏览器自动化与WAF验证绕过。
Robin 是一款由 AI 驱动的暗网开源情报(OSINT)调查工具。它将大语言模型(LLM)与 Tor 网络结合,实现暗网情报的自动化收集与分析。其工作流程为:首先通过 LLM 将用户的自然语言转化为专业的暗网搜索词,随后利用 Tor 匿名网络抓取暗网搜索引擎结果,最后再由 AI 对结果进行去噪、相关性评估及风险研判,生成详细的调查摘要。它拥有模块化架构和可视化界面,支持 OpenAI、Claude、Ollama 等模型。
FastAPI 是一个现代、极速的 Python Web 框架,专门用于基于 Python 标准类型提示构建 API。它底层结合了 Starlette(用于 Web 路由处理)和 Pydantic(用于数据验证解析),具备可媲美 NodeJS 和 Go 的极高并发性能。FastAPI 能让开发速度提升 200%~300% 并减少 40% 的人为错误,其最大特色是原生支持异步编程、提供卓越的 IDE 自动补全体验,并能开箱即用地自动生成 Swagger UI 交互式 API 文档,完全兼容 OpenAPI 和 JSON Schema 标准。
learn-claude-code 是由 shareAI-lab 发起的开源教育项目,专注于“支架工程(Harness Engineering)”。它通过深度逆向工程 Claude Code 的架构,教开发者如何为 AI 模型构建运行载体。该项目将 Agent 拆解为“模型+支架”,通过 12 个专题(s01-s12)详细介绍了工具调用、技能按需加载、上下文压缩、子智能体派生、异步协作等核心机制,旨在帮助开发者构建具备感知、推理和行动能力的通用智能体产品。
stable-worldmodel 是由 galilai-group 开发的开源世界模型研究与评估平台。它为世界模型研究的核心三阶段(数据收集、模型训练、基于模型预测控制的评估)提供了统一的接口。该工具内置了多种规划求解器与参考基准(如LeWM和DINO-WM),支持LanceDB、HDF5及LeRobot等高效数据集格式。此外,它集成了涵盖机器人、雅达利等大量标准化环境,并提供视觉与物理属性的独立变异因子,极大简化了零样本泛化测试流程。
Knowledge Work Plugins 是由 Anthropic 官方开源的 11 款职场角色专属插件集,专为 Claude Cowork 和 Claude Code 打造。它将 Claude 转化为销售、财务、产品、法律等领域的专家。产品通过集成 MCP 连接器、预设技能(Skills)、斜杠命令及子智能体来编排工作流。最大特点是采用纯文本(Markdown)和 JSON 的无代码配置,企业可轻松根据自身工具栈、术语与流程进行深度定制。
由 ZOZO (st-tech) 开源的高性能物理模拟接触求解器,专为布料、柔性体和杆件等物理仿真设计。它完全基于 GPU 单精度运行,采用有限元方法 (FEM),能实现无穿透的鲁棒接触解析,最高支持超过1.8亿次接触的极端场景。该工具极具生态扩展性,内置 JupyterLab 环境,提供开箱即用的 Windows 可执行程序与 Docker 镜像,并配备 Blender 插件。此外,它原生支持 MCP,允许大语言模型通过自然语言直接驱动物理仿真。
pyVideoTrans 是一款开源的全自动视频翻译与AI配音工具,可实现音视频到多语言的无缝转换。其工作流完整涵盖语音识别(ASR)、大模型字幕翻译、多角色语音合成(TTS)及音视频自动同步。特点是支持说话人分离与零样本声音克隆,兼容本地离线模型(如Faster-Whisper、Ollama)和众多主流云端API。提供带暂停校对的GUI图形界面以及方便批量处理的CLI命令行模式,是一款高效的多媒体本地化利器。
Ouroboros是一个面向AI编程的本地Agent OS内核。它将传统非确定性的AI对话转化为可重放、基于契约的“规范优先”工作流。通过Socratic访谈消除需求歧义,生成不可变种子(Seed)规范,再结合双钻模型执行开发。内置三阶段自动评估门控,且通过MCP无缝桥接Claude、Copilot、Gemini等多种终端CLI,防止架构偏离。
Hands-On-AI-Engineering 是由 Sumanth077 开源的生产级 AI 工程实战项目库。涵盖语言模型、多模态、OCR、RAG 及各类智能代理(Agent)。项目强调“从做中学”,提供完整的代码与文档,支持多种国内外大模型接口。特别地,它包含基于 OpenClaw 结合 GitHub MCP 打造的 Eagle Eye PR 代码审查 Agent,是开发者快速构建真实 AI 应用的绝佳参考生态库。
Crawl4AI 是一款由 unclecode 开发的开源网页爬虫与抓取工具,专为大模型(LLM)和 AI Agent 优化。它能通过异步浏览器池高效地将网页转换为干净的 Markdown,支持反爬检测、Shadow DOM 解析和媒体提取。结合各类主流 LLM,它可以精准提取结构化数据,极度适用于 RAG 与数据管道构建。该工具支持 CLI 和 Docker 部署,兼具极高运行效率与全方位浏览器控制能力。
oMLX 是一款专为 Mac (Apple Silicon) 优化的本地大模型推理服务器,是 OpenClaw 等 Agent 生态的高性能后端。它基于 MLX 框架,支持文本 LLM、视觉模型 (VLM)、OCR 及向量模型。核心技术包括“冷热分层 KV 缓存”:常用缓存驻留内存,溢出部分转储至 SSD 并支持重启后复用,极大提升了 Claude Code 等工具处理长上下文的响应速度。提供原生 macOS 菜单栏应用与 Web 控制面板,支持多模型并发调度、LRU 自动显存管理及 MCP 协议。
MoneyPrinterTurbo 是一款全自动短视频生成工具,用户只需提供主题或关键词,即可实现从视频文案编写、素材搜集、语音合成、字幕渲染到背景音乐合成的全流程自动化。它基于 MVC 架构开发,支持 Web 界面与 API 调用,内置对 OpenAI、DeepSeek 等主流大模型的支持。系统能生成 9:16 及 16:9 的高清视频,素材来源于无版权库,支持本地部署与 Docker 镜像,极大提升了短视频内容的生产效率。
Awesome Harness Engineering 是由 ai-boost 维护的精选资源与模式库,专注于 AI Agent 的外围支架(Harness)工程。它汇集了上下文管理、工具接口设计、MCP机制、沙盒隔离、记忆系统及验证循环等核心领域的最佳实践与模板。该项目帮助开发者系统性地构建高可靠的 Agent 运行环境,弥补大模型自身的局限性,确保智能体在复杂真实任务中的成功率。
Agent-Reach 是 Panniantong 为 OpenClaw 等 AI Agent 开发的互联网能力增强脚手架。它通过一键安装和配置底层 CLI 工具与 MCP 服务,为模型解锁网页访问、全网搜索及读取多平台(如推特、Reddit、小红书、B站、YouTube等)数据的能力。特点是完全开源免费、即插即用、本地运行保障隐私安全,并通过写入 SKILL.md 指导 Agent 自动调用底层指令。
CDP Bridge MCP 是一个连接 MCP 客户端与真实浏览器会话的桥接服务。通过配合 Chromium 浏览器插件,大模型和 Agent 可直接接管用户正在使用的浏览器页面,实现读取标签、精简抓取DOM、执行JS脚本、截图和导航等操作。它无需重新登录即可复用真实的账号态与 Cookie,且支持单机多 Profile 并发以及跨设备的远端多用户会话隔离,非常适合日常网页协作、自动化操作与 Agent 后端集成。
xiaohu-video-translate 是一款为 OpenClaw 等 AI 编程智能体设计的视频翻译技能包。只需一句自然语言指令,即可自动完成外语视频的下载、语音提取、Whisper 离线转写、大模型翻译润色及字幕烧录。其特点是全程本地运行,转写零 API 费用,且支持词级时间戳精准对齐,能自动生成高质量的纯中文或中英双语字幕视频以及 Markdown 文稿。
RedditVideoMakerBot 是由 elebumm 等开发的开源自动化短视频生成工具,专为 TikTok、YouTube 和 Instagram 等平台打造。它通过纯代码实现了无需人工剪辑的视频制作流程。该工具利用 Playwright 自动抓取 Reddit 帖子,生成 TTS 语音,并将其与跑酷等背景视频及背景音乐进行动态混流。主要特点包括支持自定义子版块和指定帖子、更换 TTS 语音、亮暗主题截图切换及内置 NSFW 内容过滤功能。
seo-audit-skill 是一个针对单页 SEO 审计的可复用 Agent 技能。它采用“脚本+LLM”双层架构:Python 脚本负责处理 HTTP 状态、XML 解析等确定性事实检查,LLM 则负责关键词意图、内容质量等语义判断。只需提供 URL,即可生成包含优先级建议的结构化 HTML 报告。原生兼容 Cursor、Claude Code 及任何支持 SKILL.md 的运行时,兼具执行准确率与深度洞察力。
[待翻译] A collective list of free APIs
Voice-Pro 是一款基于 AI 的综合性音视频处理 Web 应用,旨在成为 ElevenLabs 的强大替代方案。它通过 Gradio 提供界面,集成了视频下载、人声分离、高精度语音识别(基于 Whisper 系列模型)、以及支持百余种语言的翻译功能。其最大特色在于利用 F5-TTS、E2-TTS 和 CosyVoice 等模型实现零样本声音克隆与多语言 TTS 配音。官方近期已将其完全开源免费,适合创作者在桌面端(尤其配备 NVIDIA GPU 的环境)进行本地部署与多媒体内容制作。
这是一个使用纯 PyTorch 从零手写的 Transformer 语言模型训练框架。它不仅复现了《Attention is All You Need》架构,支持在单卡或多卡上从零预训练百万至十亿参数规模的 LLM;最新版本更完整覆盖了现代大模型后训练流水线,纯手工实现了 SFT、Reward Model、PPO、DPO 及 GRPO 等对齐算法,且不依赖任何高级第三方库。它还提供了一个基于 Streamlit 的 Web 可视化界面供训练和交互。
Hello-Agents 是由 Datawhale 社区发起的系统性智能体(Agent)学习教程,旨在引导开发者从零开始构建 AI Native Agent。项目涵盖了从基础理论、经典范式(如 ReAct、规划与反思)到多智能体协作的完整路径。其核心特色在于不仅教授如何使用现有框架,还包含一个基于 OpenAI 原生 API 自研的轻量化框架 HelloAgents。内容深入内存管理、上下文工程、MCP 通信协议及 Agentic RL 训练,通过实战项目助力开发者实现从 LLM 使用者到系统构建者的跃迁。
Odysseus 是一款开源、本地优先的自托管 AI 工作空间,旨在提供类似 ChatGPT 和 Claude 的使用体验。它完全运行在用户本地硬件上以保障隐私,集成了聊天、多步深度研究、盲测对比、多模态文档编辑、AI 邮件管理等功能。此外,它支持多模型接入与代理工具(如 MCP),具备持久化记忆及技能系统,并内置用于快速下载和部署本地大语言模型的 Cookbook 工具。
Vibe-Trading 是由 HKUDS 开发的开源个人交易智能体。它采用连接器优先架构,通过统一接口接入盈透、Robinhood、币安等多种券商,提供数据获取到受限下单的全链路能力。核心亮点包括支持模型上下文协议(MCP)、Swarm 多智能体协同、研究目标运行时与严格回测验证。系统内置文件级熔断、强制授权等安全护栏,并提供 CLI、Web UI 与 REST/MCP 交互接口。
Hermes Agent,由Nous Research匠心打造,是一款革命性的自适应AI智能体。其核心创新在于独特的内置学习循环,使智能体能从实践中自主生成、优化技能,跨会话智能地持久化知识,并持续深化用户理解。该智能体凭借对OpenRouter等200+主流大语言模型的广泛支持,确保了无与伦比的模型选择自由度。它不仅提供强大的终端用户界面,更可无缝接入Telegram、Discord等主流通讯平台,实现多端协同。Hermes Agent还赋能预定自动化任务、子智能体委托,并支持从经济型VPS到弹性无服务器架构的灵活部署。它是一个全面、智能、支持研究的AI伴侣,致力于提供卓越的个性化AI服务。
Open-LLM-VTuber 是一款开源的语音交互AI伴侣,支持实时语音对话、视觉感知与打断机制,并拥有生动的 Live2D 虚拟形象。它具备透明背景的桌面宠物模式,支持全平台本地完全离线运行,极致保护用户隐私。系统兼容 Ollama、OpenAI 等多种主流 LLM,以及丰富的 ASR 与 TTS 引擎,用户可高度自定义AI的性格与外观。
HexStrike AI 是一款基于 MCP 协议的高级渗透测试与网络安全自动化框架。它将 Claude、GPT 等大模型转化为自动化安全专家,内置 150+ 种专业安全工具和 12+ 个自主 AI Agent。工作原理是通过智能决策引擎自主分析目标,动态选择测试策略并执行工具,最终发现攻击链并生成可视化漏洞报告。特点是高度自动化、覆盖面广且无缝对接主流 AI 客户端。
whichllm 是一款能自动检测本地硬件(GPU/CPU/RAM)并推荐最适合运行的开源大语言模型(LLM)的命令行工具。它不仅过滤能塞进显存的模型,还基于真实的基准测试、量化惩罚和预估运行速度进行智能综合评分。此外,它还支持指定显卡模拟、反向硬件规划、一键开启聊天对话以及生成可用的 Python 运行代码片段。
SIA (Self-Improving AI) 是一个开源的自我演进 AI 框架,旨在自主提升模型或智能体在特定任务上的性能。它通过三层架构运作:元智能体(Meta-Agent)生成目标智能体,目标智能体(Target Agent)执行任务并生成日志,反馈智能体(Feedback Agent)基于执行日志持续迭代和优化目标智能体。它内置了实时 Web 可视化仪表盘,支持多平台 LLM(Claude、OpenAI、Gemini等),并允许轻松导入 MLE-Bench 等自定义评估任务。
Horizon 是一款个人专属的 AI 新闻雷达。它能自动抓取 RSS、Hacker News、Reddit、Telegram 等多渠道资讯,利用包括 OpenClaw 在内的主流大模型进行文章去重、内容评分与智能过滤。它不仅能总结新闻,还能自动检索补充背景知识并提取原文的社区评论。最终可生成高质量的中英双语简报,并支持通过 GitHub Pages、邮件、飞书、Slack 甚至 MCP 进行多渠道推送,帮助用户高效过滤噪音并获取高价值资讯。
aisuite 是由吴恩达团队开源的轻量级 Python 库,旨在简化多大语言模型(LLM)的集成与 Agent 构建。它提供双层架构:一是统一的 Chat Completions API,支持无缝切换 OpenAI、Anthropic、Google 及本地 Ollama 等模型;二是功能强大的 Agents API,支持 Python 函数工具化、多轮调用(max_turns)、状态持久化及 MCP 协议。项目还内置了桌面级 Agent 助手 OpenCoworker,可本地运行并执行深度研究与文档自动化任务。