行业资讯2026年1月7日英伟达 Vera Rubin 芯片进入全面投产阶段,大幅降低 AI 成本英伟达首席执行官黄仁勋宣布,下一代 Vera Rubin 芯片已进入全面投产阶段。该芯片旨在大幅降低 AI 模型训练与推理的成本,进一步巩固英伟达在集成计算平台领域的领先地位。阅读全文 →
AI教程2026年1月5日Mosaic 分布式注意力分片:解决 15 万超长序列显存瓶颈深入探讨 Mosaic 库如何通过分布式注意力分片(Sharding Attention)技术,解决 15 万超长序列在 Transformer 模型中的显存瓶颈问题。阅读全文 →
模型评测2026年1月5日Transformers v5 分词器:模块化设计、性能提升与集成优化深入探讨 Transformers v5 分词器 (Tokenization) 的革命性变化,包括增强的模块化设计、更快的性能以及针对现代大语言模型工作流的简化集成方案。阅读全文 →