×

本周AI研报|2026.1.26

wang wang 发表于2026-01-26 14:00:55 浏览1 评论0

抢沙发发表评论

本周AI研报|2026.1.26

这一周,国内外AI 世界发生了很多事。有些是新闻,有些是趋势,有些虽然现在看起来不重要,但少则几个月多则一两年就可能对我们普通人产生重大影响。我会每周整理国内外最重要AI 资讯,并在最后根据我的认知和判断进行趋势总结,消息来源包括Morning Brew,Stratechery,Lenny's Newsletter,The Batch,Ben’s Bites,Import AI,Hacker News等,我们不追热点,只筛选对普通人有用的真正重要的变化,关注我,帮你以最小的成本建立硅谷同频信息流,让你在AI时代中能够紧跟浪潮。

帮朋友宣传一下,这个不是打广告,最近朋友做了一个AI 模型聚合平台 537 AI,不用翻墙就能用 Claude、GPT、Gemini 等海外模型,接口方式和 OpenAI 一样,价格大概是官方的 1/10,按量付费,如果你平时写代码、做 Agent 或用 AI 写东西又感觉用国外的模型太麻烦,可以了解下,网址是https://537-ai.net

1.马斯克达沃斯谈AI:算力约束转向电力,技术乐观伴风险警示

马斯克在达沃斯论坛上表示,AI有望2026年前后超越单个人类智能,2030年左右整体智能超越全人类。他指出,AI与人形机器人将推动“可持续物质富足”,特斯拉Optimus机器人正从工厂简单任务向复杂工作及公众销售迈进,自动驾驶与Robotaxi问题基本已解决。当前AI发展的核心约束将从算力转向电力供应,整体对技术持乐观态度,但强调需提前正视基础设施配套与社会影响问题。

消息来源:达沃斯论坛官方披露

2.扣子(Coze)2.0重磅升级,推出全球首个普通用户AI技能商店

字节跳动旗下智能体平台「扣子(Coze)」发布2.0版本,同步推出全球首个面向普通用户的AI技能商店。此次升级围绕四大核心能力展开,推动AI从被动回答工具进化为自主执行的职场伙伴。核心亮点AI技能商店打破专业门槛,普通用户无需编程,按@键即可调用现成技能,还能通过“口喷式开发”等极简方式创建技能并上架共享。此外,其任务规划、办公自动化、全栈开发能力,分别解决了连续性任务处理、办公效率提升、多场景部署等痛点,构建起完整生态。

消息来源:扣子(Coze)官方发布

3.百度文心大模型5.0正式版上线,全模态与推理效率双突破

百度在文心Moment大会上官宣文心大模型5.0正式版上线,该模型参数规模达2.4万亿,采用原生全模态统一建模技术,全面支持文本、图像等多模态输入输出,40余项权威基准测试跻身国际第一梯队。其采用超大规模混合专家结构,激活参数比低于3%,实现了核心能力与推理效率的平衡,同时升级智能体与工具调用能力,适配复杂场景需求。目前该模型已在百度千帆平台上线,平台整合全链路开发资源,覆盖超150个优质模型,为企业与开发者提供一站式支持。

消息来源:百度文心Moment大会官方披露

4.OpenAI启动ChatGPT定向广告测试,计划对免费和Go层级用户测试广告,Plus、Pro、Business和Enterprise用户不受影响。

OpenAI宣布将在美国地区对免费及Go层级用户测试ChatGPT定向广告,Plus、Pro、Business和Enterprise等付费层级用户不受影响。广告将以“赞助推荐”形式展示在回复下方,基于对话内容定向推送,但排除健康、政治领域及未成年用户。此次测试同步配合全球8美元/月的ChatGPT Go层级服务上线,广告收入用于抵消低价运营成本。OpenAI承诺不售卖用户数据,且广告不会影响模型回复公正性。

消息来源:The Rundown

5.马斯克与OpenAI在庭审前再次公开交锋,埃隆·马斯克寻求OpenAI和微软的巨额赔偿,声称OpenAI背离了其非营利创始理念。

埃隆·马斯克向OpenAI和微软提起诉讼,寻求790亿至1340亿美元赔偿,声称两者背离OpenAI非营利创始理念存在欺诈行为。法庭文件显示,马斯克2015年参与创立OpenAI时捐赠3800万美元种子资金,有权获得该公司当前5000亿美元估值中的相应份额。此外,马斯克还计划追讨惩罚性赔偿,并可能申请禁令。对此,OpenAI回应称该诉讼毫无根据,本质是骚扰行为

消息来源:Morning Brew

6.Qwen3-TTS系列语音生成模型开源,支持多语言语音克隆、设计和生成。

阿里通义千问团队宣布Qwen3-TTS系列语音生成模型全面开源。该系列支持语音克隆、语音设计与高质量自然语音生成,并可通过自然语言指令控制语音风格与情绪表达。模型覆盖中、英、日、韩等10种主流语言及部分方言,在语境理解、语调节奏与情感表达方面表现突出。此次开源进一步降低了高质量语音生成技术的使用门槛,为多语言交互、虚拟角色及智能助理等应用场景提供了基础能力支持。

消息来源:Qwen官方开源公告

7.Google DeepMind 聘请 Hume AI 的 CEO 及其工程师团队,将情感智能语音技术整合到 Gemini 中

Google DeepMind通过一项新的授权协议,聘请了Hume AI的CEO艾伦·考恩及约七名工程师团队。此次人才吸纳旨在将Hume AI的情感智能语音技术整合到Gemini模型中,提升其语音交互的情感感知与表达能力。Hume AI将在新任CEO安德鲁·埃廷格领导下继续运营,持续为其他对话式AI研发机构提供语音训练数据和工具。此前,Google曾通过收购Character AI等动作强化AI生态布局,反映出大型模型厂商正加速补齐语音与情感理解能力短板。

消息来源:The Rundown

8.Humans&完成超大规模种子轮融资,押注“以人为中心”的AI

AI初创公司Humans&宣布完成4.8亿美元种子轮融资,估值约45亿美元,投资方包括英伟达、杰夫·贝索斯及Google Ventures。公司团队成员来自Anthropic、xAI、Google DeepMind等前沿机构,目标是打造以协作与沟通为核心的人本AI系统,而非完全自动化或替代人类。其产品形态被描述为具备上下文理解、长期记忆与团队协调能力的智能协作系统。该融资规模显示资本市场对顶级AI团队与差异化叙事的高度关注。

消息来源:The Rundown

9.TikTok美国业务完成重组,原TikTok高管Adam Presser出任新公司CEO

TikTok美国业务已由美国投资者以约140亿美元完成收购,并成立新的合资公司以继续在美运营。原TikTok高管Adam Presser出任新公司CEO,此前曾担任华纳兄弟高管,TikTok现任CEO周受资将担任董事。该合资公司将在明确的安全与治理框架下运作,以回应美国监管层对数据与国家安全的关切。此次重组标志着TikTok在美国市场进入新的运营阶段,也为跨国互联网平台在地化治理提供了新的参考模式。

消息来源:TLDR

10.Runway研究:90%以上参与者无法区分AI生成与真实视频

Runway发布的研究显示,超过90%的参与者无法区分其Gen-4.5模型生成的视频与真实视频。研究中,参与者观看20段5秒视频,仅有极少数能够保持较高识别准确率,其中自然景观与建筑类视频最难辨别。该模型目前位居主流视频生成模型评测榜首,并已上线新的图像生成视频功能。研究结果表明,AI视频的逼真程度正在突破公众感知边界,也对内容验证与信任机制提出新的挑战。

消息来源:Runway官方研究报告

本周AI行业趋势总结

综合本周动态可以看到,AI产业正同时向能力极限、商业化落地与社会影响三条主线推进。技术层面,生成式AI(视频、语音)逼真度持续提升,情感智能、多语言交互等能力成为优化重点,文心大模型、扣子2.0等升级凸显全模态、低门槛、高效率三大方向。商业层面,头部企业加速变现与生态整合,OpenAI推进广告模式,百度、字节跳动强化场景落地,初创公司获资本热捧。同时,行业争议凸显,AI伦理、创始理念分歧等问题进入法律视野。整体来看,AI正在从技术爆发期迈向系统性重构阶段。