本周AI研报|2026.1.26

这一周，国内外AI 世界发生了很多事。有些是新闻，有些是趋势，有些虽然现在看起来不重要，但少则几个月多则一两年就可能对我们普通人产生重大影响。我会每周整理国内外最重要AI 资讯，并在最后根据我的认知和判断进行趋势总结，消息来源包括Morning Brew,Stratechery,Lenny's Newsletter,The Batch,Ben’s Bites,Import AI,Hacker News等，我们不追热点，只筛选对普通人有用的真正重要的变化，关注我，帮你以最小的成本建立硅谷同频信息流，让你在AI时代中能够紧跟浪潮。

帮朋友宣传一下，这个不是打广告，最近朋友做了一个AI 模型聚合平台 537 AI，不用翻墙就能用 Claude、GPT、Gemini 等海外模型，接口方式和 OpenAI 一样，价格大概是官方的 1/10，按量付费，如果你平时写代码、做 Agent 或用 AI 写东西又感觉用国外的模型太麻烦，可以了解下，网址是https://537-ai.net

1.马斯克达沃斯谈AI：算力约束转向电力，技术乐观伴风险警示

马斯克在达沃斯论坛上表示，AI有望2026年前后超越单个人类智能，2030年左右整体智能超越全人类。他指出，AI与人形机器人将推动“可持续物质富足”，特斯拉Optimus机器人正从工厂简单任务向复杂工作及公众销售迈进，自动驾驶与Robotaxi问题基本已解决。当前AI发展的核心约束将从算力转向电力供应，整体对技术持乐观态度，但强调需提前正视基础设施配套与社会影响问题。

消息来源：达沃斯论坛官方披露

2.扣子（Coze）2.0重磅升级，推出全球首个普通用户AI技能商店

字节跳动旗下智能体平台「扣子（Coze）」发布2.0版本，同步推出全球首个面向普通用户的AI技能商店。此次升级围绕四大核心能力展开，推动AI从被动回答工具进化为自主执行的职场伙伴。核心亮点AI技能商店打破专业门槛，普通用户无需编程，按@键即可调用现成技能，还能通过“口喷式开发”等极简方式创建技能并上架共享。此外，其任务规划、办公自动化、全栈开发能力，分别解决了连续性任务处理、办公效率提升、多场景部署等痛点，构建起完整生态。

消息来源：扣子（Coze）官方发布

3.百度文心大模型5.0正式版上线，全模态与推理效率双突破

百度在文心Moment大会上官宣文心大模型5.0正式版上线，该模型参数规模达2.4万亿，采用原生全模态统一建模技术，全面支持文本、图像等多模态输入输出，40余项权威基准测试跻身国际第一梯队。其采用超大规模混合专家结构，激活参数比低于3%，实现了核心能力与推理效率的平衡，同时升级智能体与工具调用能力，适配复杂场景需求。目前该模型已在百度千帆平台上线，平台整合全链路开发资源，覆盖超150个优质模型，为企业与开发者提供一站式支持。

消息来源：百度文心Moment大会官方披露

4.OpenAI启动ChatGPT定向广告测试，计划对免费和Go层级用户测试广告，Plus、Pro、Business和Enterprise用户不受影响。

OpenAI宣布将在美国地区对免费及Go层级用户测试ChatGPT定向广告，Plus、Pro、Business和Enterprise等付费层级用户不受影响。广告将以“赞助推荐”形式展示在回复下方，基于对话内容定向推送，但排除健康、政治领域及未成年用户。此次测试同步配合全球8美元/月的ChatGPT Go层级服务上线，广告收入用于抵消低价运营成本。OpenAI承诺不售卖用户数据，且广告不会影响模型回复公正性。

消息来源：The Rundown

5.马斯克与OpenAI在庭审前再次公开交锋，埃隆·马斯克寻求OpenAI和微软的巨额赔偿，声称OpenAI背离了其非营利创始理念。

埃隆·马斯克向OpenAI和微软提起诉讼，寻求790亿至1340亿美元赔偿，声称两者背离OpenAI非营利创始理念，存在欺诈行为。法庭文件显示，马斯克2015年参与创立OpenAI时捐赠3800万美元种子资金，有权获得该公司当前5000亿美元估值中的相应份额。此外，马斯克还计划追讨惩罚性赔偿，并可能申请禁令。对此，OpenAI回应称该诉讼毫无根据，本质是骚扰行为

消息来源：Morning Brew

6.Qwen3-TTS系列语音生成模型开源，支持多语言语音克隆、设计和生成。

阿里通义千问团队宣布Qwen3-TTS系列语音生成模型全面开源。该系列支持语音克隆、语音设计与高质量自然语音生成，并可通过自然语言指令控制语音风格与情绪表达。模型覆盖中、英、日、韩等10种主流语言及部分方言，在语境理解、语调节奏与情感表达方面表现突出。此次开源进一步降低了高质量语音生成技术的使用门槛，为多语言交互、虚拟角色及智能助理等应用场景提供了基础能力支持。

消息来源：Qwen官方开源公告

7.Google DeepMind 聘请 Hume AI 的 CEO 及其工程师团队，将情感智能语音技术整合到 Gemini 中

Google DeepMind通过一项新的授权协议，聘请了Hume AI的CEO艾伦·考恩及约七名工程师团队。此次人才吸纳旨在将Hume AI的情感智能语音技术整合到Gemini模型中，提升其语音交互的情感感知与表达能力。Hume AI将在新任CEO安德鲁·埃廷格领导下继续运营，持续为其他对话式AI研发机构提供语音训练数据和工具。此前，Google曾通过收购Character AI等动作强化AI生态布局，反映出大型模型厂商正加速补齐语音与情感理解能力短板。

消息来源：The Rundown

8.Humans&完成超大规模种子轮融资，押注“以人为中心”的AI

AI初创公司Humans&宣布完成4.8亿美元种子轮融资，估值约45亿美元，投资方包括英伟达、杰夫·贝索斯及Google Ventures。公司团队成员来自Anthropic、xAI、Google DeepMind等前沿机构，目标是打造以协作与沟通为核心的人本AI系统，而非完全自动化或替代人类。其产品形态被描述为具备上下文理解、长期记忆与团队协调能力的智能协作系统。该融资规模显示资本市场对顶级AI团队与差异化叙事的高度关注。

消息来源：The Rundown

9.TikTok美国业务完成重组,原TikTok高管Adam Presser出任新公司CEO

TikTok美国业务已由美国投资者以约140亿美元完成收购，并成立新的合资公司以继续在美运营。原TikTok高管Adam Presser出任新公司CEO，此前曾担任华纳兄弟高管,TikTok现任CEO周受资将担任董事。该合资公司将在明确的安全与治理框架下运作，以回应美国监管层对数据与国家安全的关切。此次重组标志着TikTok在美国市场进入新的运营阶段，也为跨国互联网平台在地化治理提供了新的参考模式。

消息来源：TLDR

10.Runway研究：90%以上参与者无法区分AI生成与真实视频

Runway发布的研究显示，超过90%的参与者无法区分其Gen-4.5模型生成的视频与真实视频。研究中，参与者观看20段5秒视频，仅有极少数能够保持较高识别准确率，其中自然景观与建筑类视频最难辨别。该模型目前位居主流视频生成模型评测榜首，并已上线新的图像生成视频功能。研究结果表明，AI视频的逼真程度正在突破公众感知边界，也对内容验证与信任机制提出新的挑战。

消息来源：Runway官方研究报告

本周AI行业趋势总结

综合本周动态可以看到，AI产业正同时向能力极限、商业化落地与社会影响三条主线推进。技术层面，生成式AI（视频、语音）逼真度持续提升，情感智能、多语言交互等能力成为优化重点，文心大模型、扣子2.0等升级凸显全模态、低门槛、高效率三大方向。商业层面，头部企业加速变现与生态整合，OpenAI推进广告模式，百度、字节跳动强化场景落地，初创公司获资本热捧。同时，行业争议凸显，AI伦理、创始理念分歧等问题进入法律视野。整体来看，AI正在从技术爆发期迈向系统性重构阶段。

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

ZBlogIt

Nice to meet you, too!

本周AI研报|2026.1.26

wang 发表于2026-01-26 14:00:55 浏览1 评论0

1.马斯克达沃斯谈AI：算力约束转向电力，技术乐观伴风险警示

2.扣子（Coze）2.0重磅升级，推出全球首个普通用户AI技能商店

3.百度文心大模型5.0正式版上线，全模态与推理效率双突破

4.OpenAI启动ChatGPT定向广告测试，计划对免费和Go层级用户测试广告，Plus、Pro、Business和Enterprise用户不受影响。

5.马斯克与OpenAI在庭审前再次公开交锋，埃隆·马斯克寻求OpenAI和微软的巨额赔偿，声称OpenAI背离了其非营利创始理念。

6.Qwen3-TTS系列语音生成模型开源，支持多语言语音克隆、设计和生成。

7.Google DeepMind 聘请 Hume AI 的 CEO 及其工程师团队，将情感智能语音技术整合到 Gemini 中

8.Humans&完成超大规模种子轮融资，押注“以人为中心”的AI

9.TikTok美国业务完成重组,原TikTok高管Adam Presser出任新公司CEO

10.Runway研究：90%以上参与者无法区分AI生成与真实视频

本周AI行业趋势总结

少长咸集