统计
  • 建站日期:2021-03-10
  • 文章总数:31 篇
  • 评论总数:7 条
  • 分类总数:9 个
  • 最后更新:5月31日

GitHub 周榜炸了!Redis 之父单枪匹马造了个引擎,WiFi 能当摄像头用?

SSLPHP
首页 逛一逛GitHub 正文
广告

本周 GitHub Trending 彻底疯了——全是"这也能开源?"级别的项目。


GitHub周榜炸了!Redis之父单枪匹马造了个引擎,WiFi能当摄像头用?
-SSLPHP博客
-第1
张图片

这周刷 GitHub Trending,我的感受就四个字:目瞪口呆

AI Agent 生态继续霸榜不意外,但一连冒出来好几个"角度刁钻到离谱"的项目——有人把普通 WiFi 信号变成了能穿墙识人的摄像头,有人把整台电脑做成了断网也能用的离线 AI 救生仓,连 Redis 之父都亲自下场,用 C 语言给 DeepSeek V4 单独特造了一台推理引擎。


GitHub周榜炸了!Redis之父单枪匹马造了个引擎,WiFi能当摄像头用?
-SSLPHP博客
-第2
张图片

按老规矩,每周日一篇,只聊本周真正热门的、实打实有数据的项目。所有 Star 数、版本号、更新日期都来自 GitHub 公开数据,不编不吹。

一、OpenBMB/VoxCPM 2:国产语音模型,听完起鸡皮疙瘩

项目 详情
地址 github.com/OpenBMB/VoxCPM
Star 22,800+(本周日榜第一)
团队 面壁智能 × 清华人机语音交互实验室
协议 Apache 2.0,免费商用

这周最让我震撼的项目。

面壁智能把 VoxCPM 2 开源了——一个 2B 参数的语音基础模型,做到了三件事:

① 30 种语言 + 9 种中国方言。 四川话、粤语、吴语、东北话、河南话、陕西话、山东话、天津话、闽南语,一口气全支持。我试了四川话的 demo,那个"噻"字拖音的处理,四川同事说"比川台主持人还地道"。

② 音色凭空造。 不需要任何参考音频,你在文本框里写"温柔的女播音员,25 岁左右,略带南方口音,语速中等偏慢",它就真的给你生成出这个声音。这种叫"Voice Design",是文本到音色的直接映射,不是拼接。

③ 48kHz 影视级音质 + 零样本声音克隆。 上传 10 秒参考音频,就能复刻一个人的音色,连口音、情绪、节奏都能保留。RTF(实时率)低至 0.17,在 RTX 4090 上跑,生成速度是实时播放速度的 5 倍以上。

![VoxCPM 2 Demo]

GitHub周榜炸了!Redis之父单枪匹马造了个引擎,WiFi能当摄像头用?
-SSLPHP博客
-第2
张图片

(访问 https://huggingface.co/spaces/openbmb/VoxCPM-Demo 在线体验)

为什么这件事重要?因为在此之前,高质量中文语音合成要么是闭源付费的,要么效果差到没法用。VoxCPM 2 直接把天花板拉到"开源免费且可商用"的水平。短视频配音、有声书录制、虚拟主播——这些赛道接下来会迎来一波效率革命。

二、antirez/ds4(DwarfStar 4):Redis 之父的"偏执狂"级作品

项目 详情
地址 github.com/antirez/ds4
Star 9,000+(发布不到一个月)
作者 Salvatore Sanfilippo(Redis 创始人)
语言 C + Metal/CUDA

Antirez 这个人有个特点:他不做"大而全"的东西,他做"小而狠"的。

ds4 就是一个典型的 Antirez 式项目——它是一个专门为 DeepSeek V4 Flash 这一个模型打造的本地推理引擎。没错,不支持 Llama,不支持 Qwen,只支持 DeepSeek V4 Flash。因为只专注一个模型,所以能把每一点性能都榨干:

实测数据(128GB MacBook Pro M3 Max,2-bit 量化):

  • Prefill 速度:58.52 tokens/秒
  • 生成速度:26.68 tokens/秒
  • 整机功耗:约 50W

这意味着什么?一台笔记本电脑,跑着一个 284B 总参数(每次推理激活约 13B)的 MoE 大模型,速度接近人阅读速度,而且不联网、不花钱、不耗电。

![ds4 终端
GitHub周榜炸了!Redis之父单枪匹马造了个引擎,WiFi能当摄像头用?
-SSLPHP博客
-第4
张图片截图]

更绝的是,Antirez 做了一个"磁盘 KV Cache"——把对话上下文的 KV Cache 序列化到硬盘。切换会话或者重启服务后,直接从硬盘恢复,跳过昂贵的 prefill 阶段。这对 Claude Code 这种每次发 25K token 初始 prompt 的 Agent 场景来说,价值巨大。

ds4 还直接兼容 OpenAI 和 Anthropic API 协议,一条环境变量就能让 Claude Code 切换到本地 DeepSeek 上跑。项目标注为 Alpha 阶段,但已经 9000+ Star,模型下载量 26 万+。

三、Crosstalk-Solutions/project-nomad:断网了还能用 AI?能的

项目 详情
地址 github.com/Crosstalk-Solutions/project-nomad
Star 25,000+
协议 Apache 2.0

这个项目的设定像是末世科幻片里的道具——一台完全离线、自带 AI、地图、维基百科、可汗学院全部课程的服务器。

一条命令安装,浏览器访问 localhost:8080 就能用。里面集成了:

  • 🧠 Ollama 本地大模型 + RAG 检索增强
  • 📚 离线维基百科 + 医学参考 + 生存指南
  • 🎓 可汗学院完整课程(Kolibri,支持多用户进度追踪)
  • 🗺️ 离线地图(ProtoMaps,可下载区域,支持搜索导航)
  • 🔐 CyberChef 数据工具箱(加密解密、编码解码几百种操作)
  • 📝 本地笔记系统


GitHub周榜炸了!Redis之父单枪匹马造了个引擎,WiFi能当摄像头用?
-SSLPHP博客
-第5
张图片

目标用户非常明确:灾难应急准备者、偏远地区用户、房车/帆船离网生活者、对隐私有极端需求的用户。最低配置只要 2GHz 双核 + 4GB 内存就能跑(不含 AI),推荐 RTX 3060 + 32GB 内存跑本地大模型。

创始人 Chris Sherwood 说得很实在:"互联网不是永远在线的。但你不应该因此失去获取信息的能力。"

四、ruvnet/RuView:你家 WiFi 现在能"看到"你了

项目 详情
地址 github.com/ruvnet/RuView
Star 56,700+
硬件 ESP32-S3 开发板($9/个)

本周最"黑科技"的项目,没有之一。

RuView 做的事情听起来像科幻:捕捉普通 WiFi 信号的信道状态信息(CSI),用 AI 分析人体对 WiFi 信号的扰动模式,从而检测——

  • 有没有人?几个人?在哪个房间?(穿墙感知)
  • 呼吸频率(6-30 BPM)和心率(40-120 BPM)
  • 走路、坐着、摔倒等动作识别
  • 人体 17 个关键点的姿态估计(v0.7.0 精度达 92.9% PCK@20)
  • 睡眠阶段分类和呼吸暂停筛查


GitHub周榜炸了!Redis之父单枪匹马造了个引擎,WiFi能当摄像头用?
-SSLPHP博客
-第6
张图片

完全不需要摄像头。不需要穿戴设备。不需要云端。 几个 $9 的 ESP32-S3 开发板往房间里一放,组成 Mesh 网络,就能把整个空间变成一个感知场。

当然,项目标注为 Beta 质量,实际部署需要一定的嵌入式开发经验。但这个方向——用现有的无线电信号做空间智能——比摄像头方案隐私友好得多,也更难被物理破坏。老人跌倒检测、婴儿呼吸监测、智能家居无感触发——应用场景极其丰富。

五、dreammis/social-auto-upload:AI 视频的"最后一公里"

项目 详情
地址 github.com/dreammis/social-auto-upload
Star 11,800+
协议 MIT

前面有 MoneyPrinterTurbo 帮你生成视频,后面有 social-auto-upload 帮你把视频发到全网。这套组合拳正在成为 AI 内容工厂的标准配置。

支持的平台覆盖了主流国内+海外:

国内 海外
抖音、B站、小红书、快手、视频号、百家号 TikTok、Instagram、Facebook、YouTube

核心亮点:

统一 CLI sau:一条命令搞定所有平台,格式一致
定时发布:支持 Cron Job,真正做到无人值守
多账号管理:矩阵号运营不用来回切换登录
Agent 原生设计:专门为 Claude Code 等 AI Agent 做了 skill 适配,可以写出"让 AI 自动管理发布流程"的脚本
Docker 一键部署


GitHub周榜炸了!Redis之父单枪匹马造了个引擎,WiFi能当摄像头用?
-SSLPHP博客
-第7
张图片

不过要提醒:浏览器自动化操作各平台,理论上有触发风控的可能。用于生产环境前,建议先在非主力号上充分测试。

六、colbymchenry/codegraph:AI 写代码终于不用"盲人摸象"了

项目 详情
地址 github.com/colbymchenry/codegraph
Star 9,600+
支持语言 19+ 种

这是本周在开发者圈子里讨论度最高的项目之一。

AI 编程工具有一个根本性缺陷:它们一行一行地读代码,却不知道整个项目的"地图"长什么样。 这就好比一个修理工在修发动机,但他只能看到自己手里拿着的那个螺丝,看不到整个发动机舱。

CodeGraph 解决的就是这个问题。它把整个代码库预先索引成一个知识图谱——里面包含了文件关系、函数调用链、类继承结构、URL 路由映射等——然后 AI 编程工具可以直接查图,不用反复扫描文件。

实测数据(7 个真实代码库对比):

指标 改善幅度
Token 消耗 -59%
工具调用次数 -70%
完成任务时间 -49%
API 费用 -35%

在 Tokio(Rust 异步运行时,大型项目)上的表现尤为突出——费用降低 52%,Token 减少 81%。

安装极简,一行命令:

curl -fsSL https://raw.githubusercontent.com/colbymchenry/codegraph/main/install.sh | sh

自动检测并集成 Claude Code、Cursor、Codex、OpenCode 等主流 AI 编程工具。100% 本地运行,SQLite 存储,数据不出本机。


GitHub周榜炸了!Redis之父单枪匹马造了个引擎,WiFi能当摄像头用?
-SSLPHP博客
-第8
张图片

七、bytedance/UI-TARS-desktop:字节把"豆包操控手机"的核心开源了

项目 详情
地址 github.com/bytedance/UI-TARS-desktop
Star 32,300+
团队 字节跳动 AI 研究院
协议 Apache 2.0

字节的"豆包手机助手"背后的核心技术,开源了。

UI-TARS 做的事情就是让 AI 像人一样"看屏幕"然后"操作电脑"——它用视觉语言模型理解屏幕上的按钮、表单、文本框,然后用鼠标键盘模拟真实用户去点击、输入、拖拽。不依赖 API、不依赖 DOM 解析,纯视觉+模拟操作。

这意味着它理论上可以操作任何有 GUI 界面的软件,不管这个软件有没有提供 API。Windows、macOS、浏览器都支持,还接入了 MCP 生态。

这条赛道现在是全球 AI 巨头的兵家必争之地——Anthropic 的 Computer Use、OpenAI 的 Operator、Google 的 Project Mariner——字节用开源直接撕开了一个口子。

🎬 视频演示点击查看 UI-TARS 操作演示


GitHub周榜炸了!Redis之父单枪匹马造了个引擎,WiFi能当摄像头用?
-SSLPHP博客
-第9
张图片

八、两个"小而狠"的彩蛋

这周还有几个体积不大但想法惊艳的项目,值得一提:

hardikpandya/stop-slop(7,400+ Star)

专门去除 AI 写作中的"AI 味陈词滥调"。你写文章时 AI 动不动就塞一个 "In today's rapidly evolving digital landscape..."——stop-slop 就是一套规则库,自动识别和清除这些"AI 八股"。对经常用 AI 写文案的人来说,这个工具约等于"去 AI 味洗涤剂"。

FareedKhan-dev/train-llm-from-scratch(本周教育类黑马)

一个从零训练大模型的完整教程。不是理论课——是真的带你从数据预处理、Tokenizer 训练、Transformer 架构搭建到分布式训练跑起来。作者说教学目标很明确:"让你在自己的机器上训练出一个能正常对话的小模型。"本周教育类排名第一。

本周趋势总结


GitHub周榜炸了!Redis之父单枪匹马造了个引擎,WiFi能当摄像头用?
-SSLPHP博客
-第10
张图片

趋势 具体表现
语音 AI 开源化加速 VoxCPM 2 带头,开源语音模型质量追平闭源
本地 AI 推理爆发 ds4、Project NOMAD、小模型方案纷纷登上热榜,用户要控制权
AI 工具的"补短板"阶段 CodeGraph 补全局视野,stop-slop 补内容质量,social-auto-upload 补发布环节
硬件×AI 的下沉 $9 ESP32 + WiFi CSI 做空间智能,50W 笔记本跑 284B 模型——AI 正在脱离昂贵的云端
Agent 操控 GUI 成共识 字节 UI-TARS、Anthropic Computer Use、OpenAI Operator 三线并进

如果说前两年的开源热榜是"这个 AI 模型更大了",那今年的关键词变成了"开源让 AI 真正可用了"——不是更大,而是更近、更便宜、更可控。

最后的实话

每周写 GitHub 盘点,有一个感受越来越强烈:开源社区正在以令人窒息的速度,把"AI 特权"变成"AI 平权"。

半年前你还得付费订阅才能用的语音合成,现在 VoxCPM 2 直接开源可商用。
一年前你还得租云 GPU 才能跑的推理,现在 Antirez 在笔记本上跑得飞快。
大厂的 GUI Agent 核心技术,字节直接开源。

这对普通开发者来说,是前所未有好的时代。

如果你是做内容的、做开发的、做硬件的、做安全的——这周的 GitHub 上都至少有一个项目能直接帮到你。 花半天时间挑一个感兴趣的部署试试,比刷三小时短视频值。


本周有什么我漏掉的好项目?评论区告诉我,下周日一并聊。

觉得有用的话,点个「在看」转给也在关注开源的朋友。每周日更新,一期不落。


参考链接汇总:

  1. VoxCPM 2:https://github.com/OpenBMB/VoxCPM
  2. DwarfStar 4 (ds4):https://github.com/antirez/ds4
  3. Project NOMAD:https://github.com/Crosstalk-Solutions/project-nomad
  4. RuView:https://github.com/ruvnet/RuView
  5. Social Auto Upload:https://github.com/dreammis/social-auto-upload
  6. CodeGraph:https://github.com/colbymchenry/codegraph
  7. UI-TARS Desktop:https://github.com/bytedance/UI-TARS-desktop
  8. Stop Slop:https://github.com/hardikpandya/stop-slop
  9. Train LLM From Scratch:https://github.com/FareedKhan-dev/train-llm-from-scratch

原文链接https://mp.weixin.qq.com/s/F6WZZr-pnCIWe0xVgdJ8LA

版权说明
文章采用: 《署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)》许可协议授权。
版权声明:未标注转载均为本站原创,转载时请以链接形式注明文章出处。如有侵权、不妥之处,请联系站长删除。敬请谅解!

多语言企业网站系统
« 上一篇
别再按月给 Anthropic 交租了!有人把 Claude Code 的“底裤”扒了,账单从 $100 变成了 ¥0
下一篇 »

发表评论

HI ! 请登录
注册会员,享受下载全站资源特权。

最新评论

提货人防太突然游客
5个月前 (2026-01-05)

GPT-5:人工智能的下一个里程碑 —— 对比与展望

SSLPHP管理员
9个月前 (2025-08-29)

专为emlog打造的高效博客主题

b5DksHUW游客
9个月前 (2025-08-25)

专为emlog打造的高效博客主题

1111游客
10个月前 (2025-08-02)

导航内部广告插件

标签