AI 及开发领域动态与资源汇总(2025年7月24日)

AI 项目、工具及动态汇总

项目/产品名称核心功能/简介主要特点/亮点相关链接
Supervision一个流行的计算机视觉工具库,用于加速计算机视觉应用的构建。模型无关,可与多种主流库集成;提供丰富的可定制标注工具;支持多种数据集操作和应用场景。GitHub
SuperDesign集成在 IDE 中的开源设计代理工具,通过自然语言生成 UI。允许开发者通过自然语言提示词生成 UI 模型、组件和线框图,加速设计流程。GitHub
Sparrow结合机器学习和 LLM 的结构化数据提取和指令调用项目。提供交互式 Web 界面,支持拖拽上传和实时处理,输出结构化 JSON,适用于发票、收据等文档。GitHub
MermaidFlow通过安全约束的演化编程,自动生成智能体工作流。在 Mermaid 领域自动生成流程图,并在 Python 领域进行规划和运行,研究已被 ICML 2025 接受。GitHub
openai-agents-pythonOpenAI 官方开源的“轻量级”多智能体框架。拥有 12.9k star,核心概念为 Agent 和 Runner,机制完善,足以覆盖大多数 Agent 应用场景。GitHub
ASI-Arch上海创智学院发布的 AI 超智能系统,可自主发现新神经网络架构。在完全自主条件下发现了106个超越人类设计的神经网络架构,验证了科学突破的工业化量产。GitHub / 网站
Qwen-Agent专为大模型应用开发打造的轻量级 Agent 框架。拥有 10.2k star,轻量级,易于上手。GitHub
Openjourney受 MidJourney 启发的媒体内容生成和编辑工具。界面简洁,支持图片生成(Imagen 4)、动画(Veo 3)以及带声音的视频生成。GitHub
Grok CLI基于 Grok-3 的开源 AI 终端助手。可在终端中通过自然语言交互,自动完成文件操作、命令执行等任务。GitHub
卡卡字幕助手 (VideoCaptioner)全流程一键处理视频字幕的工具。操作简单,无需高配;支持在线/离线识别,利用 LLM 进行智能断句、校正和翻译。GitHub
Paperless-ngx一个将物理文档转换为可搜索在线档案的文档管理系统。减少纸张使用,是 Paperless 和 Paperless-ng 项目的官方后继者,由社区共同维护。GitHub
Deep-Live-Cam实时人脸替换和视频深度伪造工具。操作简单,仅需一张图像即可完成实时人脸替换。GitHub
YouWare只需一段提示词即可生成 AI 驱动应用的新平台。强调社区建设和创意裂变,为创作者提供自由流动的互动环境。官方网站
FreeAudio由清华大学与生数科技开发的 AI 音效生成模型。实现 90 秒长时精准可控音效生成,能按精确时间控制多种音效组合,研究入选 ACM MM 2025。未提供
昆仑万维 Mureka 系列新一代音乐和语音生成模型。Mureka V7 音乐模型良品率和音质大幅提升;Mureka TTS V1 支持文本描述定制音色,质量超越竞品。未提供
腾讯混元 ASR腾讯推出的语音识别大模型。已接入“ima”应用,支持语音直接输入功能,提升了用户交互体验。未提供
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值