详细内容

【筠岚研究院】AI速递 20250207

image.png

生成式AI

一、  谷歌Gemini 2.0系列集体上新,全员跻身大模型竞技场前10

1. Gemini 2.0系列全新发布三款模型:Flash、Pro和Flash-Lite,全部进入大模型竞技场前十;

2. Gemini 2.0 Pro成为谷歌最强模型,具备200万tokens上下文窗口,在13项评测中获11项第一;

3. Gemini 2.0 Flash-Lite针对成本优化,具备100万tokens长文本能力,提供极高性价比。

https://mp.weixin.qq.com/s/zx-mY4MoCZgBWG9byh2wnA

二、  终结谷歌搜索?OpenAI免费开放ChatGPT搜索,无需注册

1. OpenAI向所有用户开放ChatGPT搜索功能,无需注册即可使用,突破原有限制;

2. ChatGPT搜索能实现分钟级网络信息抓取,适合快速获取新闻内容,并提供源地址;

3. 可根据提问语言自动匹配对应语种信息源,中英文搜索结果分别来自不同区域网站。

https://mp.weixin.qq.com/s/3bUpEV2a_98dnEoT95qNKw

三、  16张H100训26分钟,成本不足50美元的推理模型s1?

1. 李飞飞团队仅用1000个样本、16张H100训练26分钟,通过预算强制技术使模型超越OpenAI o1-preview;

2. 预算强制技术通过控制思维持续时间,可强制结束或延长模型思考过程,提升推理能力;

3. s1-32B成为最具样本效率的推理模型,验证少量高质量数据比大量数据更有效。

https://mp.weixin.qq.com/s/iGi20QGI8KFn-WPtBL5JCw

四、  首个自研万卡集群点亮,上架DeepSeek官网价格3折!

1. 百度点亮首个自研万卡昆仑芯集群,并计划扩大至3万卡规模,推动国产AI算力升级;

2. 百舸4.0称实现多芯混训95%效能,突破硬件扩展性瓶颈,支持高性能网络和自动容错;

3. DeepSeek R1和V3在百度云价格分别降至五折和三折,降低AI开发门槛。

https://mp.weixin.qq.com/s/r6DOD2-QOwanIMNwJice8w

五、  北大港科的多模态版DeepSeek-R1,评测表现超GPT-4o?

1. 北大港科大联合研发多模态版DeepSeek-R1(Align-DS-V),部分视觉理解评测超越GPT-4o;

2. 团队发现多模态训练后的模态穿透效应,显著提升文本推理能力,如ARC-Challenge提升近一倍;

3. 基于自研Align-Anything框架,实现全模态对齐,支持文本、图片、视频、音频间任意模态转换。

https://mp.weixin.qq.com/s/_S4tovrggFZdPIqFuos2Nw

六、  刚加入Anthropic的OpenAI联创John Schulman,又离职了

1. OpenAI联创John Schulman继加入Anthropic半年后再次离职,这是他一年内的第二次离职;

2. Schulman在Anthropic期间主要从事大语言模型对齐研究,包括可扩展监督和模型行为规划;

3. 他是OpenAI多位离职高管之一,包括CTO Mira Murato、首席科学家Ilya Sutskever等人。

https://mp.weixin.qq.com/s/Ntb8W4lVDrkQ9EVMZGaEkQ

前沿科技

七、  Nature:研究人员如何使用 AI?科学领域利弊调查分析

1. 全球4946名研究者调查显示,81%使用过ChatGPT,超半数认为AI在文献审查、研究总结等任务上超越人类;

2. 72%研究者计划两年内使用AI准备论文手稿,早期研究者对AI辅助申请资助更感兴趣;

3. 64%研究者对AI处理复杂任务持谨慎态度,81%担忧AI准确性和透明度,呼吁出版商提供使用指南。

https://mp.weixin.qq.com/s/gYt959efPEh3Mn5dZQU6Fw

报告观点

八、  Karpathy 3 小时深度揭秘生成式AI“大脑”,盛赞DeepSeek

1. Karpathy详解ChatGPT训练分为三阶段:预训练获得Base Model、监督微调成为助手、强化学习提升推理;

2. Karpathy特别盛赞DeepSeek-R1的强化学习能力,它能通过试错发展出超越简单模仿的深度推理;

3. 他指出LLM是无状态的token生成器,呈现"参差不齐的智能",应作为工具使用而非完全依赖。

https://mp.weixin.qq.com/s/Dca3r8uWsnZPNNESwtzRFg

九、  a16z发布2025 AI语音图谱:语音将成为与AI交互的主要模式

1. a16z预测语音将成为AI交互主要模式,2024已从语音基础设施层过渡到应用层发展;

2. 语音智能体市场2024年下半年爆发,全球掀起融资热潮,企业切入点主要包括非工作时间呼叫、外呼电话和后台电话;

3. B2B和医疗保健成为语音智能体主要应用领域,a16z看好那些通话受限可控、能显著降低成本的商业场景。

https://mp.weixin.qq.com/s/Ra7mtxvf2cJna_yuPuf_ew


1
更多

Copyright © 2025 JUNLAN 版权所有 Xiamen JUNLAN Information Technology Co., Ltd.All rights reserved.号-1闽ICP备2025088459号

厦门火炬高新区软件园一期曾厝垵北路1号元汇楼318-417
849667331@qq.com
137-9977-2089

关于我们

产品介绍

新闻动态

官方微信

解决方案

seo seo