🔥 WCTC S8 全球交易赛正式开赛!
8,000,000 USDT 超级奖池解锁开启
🏆 团队赛:上半场正式开启,预报名阶段 5,500+ 战队现已集结
交易量收益额双重比拼,解锁上半场 1,800,000 USDT 奖池
🏆 个人赛:现货、合约、TradFi、ETF、闪兑、跟单齐上阵
全场交易量比拼,瓜分 2,000,000 USDT 奖池
🏆 王者 PK 赛:零门槛参与,实时匹配享受战斗快感
收益率即时 PK,瓜分 1,600,000 USDT 奖池
活动时间:2026 年 4月 23 日 16:00:00 -2026 年 5 月 20 日 15:59:59 UTC+8
⬇️ 立即参与:https://www.gate.com/competition/wctc-s8
#WCTCS8
刚看到Simon在Mac上实测了微软新开源的VibeVoice-ASR,这模型有点东西啊。
9B参数,单次处理60分钟连续音频,还能输出谁在说、什么时候说、说了什么。
传统方案要拼Whisper+pyannote,现在一个模型全搞定,支持50多种语言和中英混说。
他用4-bit量化版(5.71GB)在M5 Max上转1小时播客用了8分45秒,内存峰值61.5GB,普通32GB笔记本跑不动。
有趣的是,模型把两人对谈识别成三人,因为Lenny在不同录音环境说话。
本地跑至少要64GB内存,对播客转写、会议纪要来说,多步流程现在能压缩成一次推理了。
你们觉得这模型怎么样?