新闻动态

详细内容

【筠岚研究院】AI速递 20250207

生成式AI

一、谷歌Gemini 2.0系列集体上新，全员跻身大模型竞技场前10

1. Gemini 2.0系列全新发布三款模型：Flash、Pro和Flash-Lite，全部进入大模型竞技场前十;

2. Gemini 2.0 Pro成为谷歌最强模型，具备200万tokens上下文窗口，在13项评测中获11项第一;

3. Gemini 2.0 Flash-Lite针对成本优化，具备100万tokens长文本能力，提供极高性价比。

https://mp.weixin.qq.com/s/zx-mY4MoCZgBWG9byh2wnA

二、终结谷歌搜索？OpenAI免费开放ChatGPT搜索，无需注册

1. OpenAI向所有用户开放ChatGPT搜索功能，无需注册即可使用，突破原有限制;

2. ChatGPT搜索能实现分钟级网络信息抓取，适合快速获取新闻内容，并提供源地址;

3. 可根据提问语言自动匹配对应语种信息源，中英文搜索结果分别来自不同区域网站。

https://mp.weixin.qq.com/s/3bUpEV2a_98dnEoT95qNKw

三、 16张H100训26分钟，成本不足50美元的推理模型s1？

1. 李飞飞团队仅用1000个样本、16张H100训练26分钟，通过预算强制技术使模型超越OpenAI o1-preview;

2. 预算强制技术通过控制思维持续时间，可强制结束或延长模型思考过程，提升推理能力;

3. s1-32B成为最具样本效率的推理模型，验证少量高质量数据比大量数据更有效。

https://mp.weixin.qq.com/s/iGi20QGI8KFn-WPtBL5JCw

四、首个自研万卡集群点亮，上架DeepSeek官网价格3折！

1. 百度点亮首个自研万卡昆仑芯集群，并计划扩大至3万卡规模，推动国产AI算力升级;

2. 百舸4.0称实现多芯混训95%效能，突破硬件扩展性瓶颈，支持高性能网络和自动容错;

3. DeepSeek R1和V3在百度云价格分别降至五折和三折，降低AI开发门槛。

https://mp.weixin.qq.com/s/r6DOD2-QOwanIMNwJice8w

五、北大港科的多模态版DeepSeek-R1，评测表现超GPT-4o？

1. 北大港科大联合研发多模态版DeepSeek-R1(Align-DS-V)，部分视觉理解评测超越GPT-4o;

2. 团队发现多模态训练后的模态穿透效应，显著提升文本推理能力，如ARC-Challenge提升近一倍;

3. 基于自研Align-Anything框架，实现全模态对齐，支持文本、图片、视频、音频间任意模态转换。

https://mp.weixin.qq.com/s/_S4tovrggFZdPIqFuos2Nw

六、刚加入Anthropic的OpenAI联创John Schulman，又离职了

1. OpenAI联创John Schulman继加入Anthropic半年后再次离职，这是他一年内的第二次离职;

2. Schulman在Anthropic期间主要从事大语言模型对齐研究，包括可扩展监督和模型行为规划;

3. 他是OpenAI多位离职高管之一，包括CTO Mira Murato、首席科学家Ilya Sutskever等人。

https://mp.weixin.qq.com/s/Ntb8W4lVDrkQ9EVMZGaEkQ

前沿科技

七、 Nature：研究人员如何使用 AI？科学领域利弊调查分析

1. 全球4946名研究者调查显示，81%使用过ChatGPT，超半数认为AI在文献审查、研究总结等任务上超越人类;

2. 72%研究者计划两年内使用AI准备论文手稿，早期研究者对AI辅助申请资助更感兴趣;

3. 64%研究者对AI处理复杂任务持谨慎态度，81%担忧AI准确性和透明度，呼吁出版商提供使用指南。

https://mp.weixin.qq.com/s/gYt959efPEh3Mn5dZQU6Fw

报告观点

八、 Karpathy 3 小时深度揭秘生成式AI“大脑”，盛赞DeepSeek

1. Karpathy详解ChatGPT训练分为三阶段：预训练获得Base Model、监督微调成为助手、强化学习提升推理;

2. Karpathy特别盛赞DeepSeek-R1的强化学习能力，它能通过试错发展出超越简单模仿的深度推理;

3. 他指出LLM是无状态的token生成器，呈现"参差不齐的智能"，应作为工具使用而非完全依赖。

https://mp.weixin.qq.com/s/Dca3r8uWsnZPNNESwtzRFg

九、 a16z发布2025 AI语音图谱：语音将成为与AI交互的主要模式

1. a16z预测语音将成为AI交互主要模式，2024已从语音基础设施层过渡到应用层发展;

2. 语音智能体市场2024年下半年爆发，全球掀起融资热潮，企业切入点主要包括非工作时间呼叫、外呼电话和后台电话;

3. B2B和医疗保健成为语音智能体主要应用领域，a16z看好那些通话受限可控、能显著降低成本的商业场景。

https://mp.weixin.qq.com/s/Ra7mtxvf2cJna_yuPuf_ew

上一篇【筠岚研究院】一周AI（2025.02.03-02.08）下一篇【筠岚研究院】AI速递 20250208

关于我们

服务项目

新闻动态

服务项目

厦门火炬高新区软件园一期曾厝垵北路1号元汇楼318-417

849667331@qq.com

137-9977-2089

关于我们

产品介绍

新闻动态

官方微信

灯塔工厂解决方案

AIPS人工智能计划与排程

照明制造行业

卫浴行业

发动机制造行业

公司简介

联系我们