|
【筠岚研究院】AI速递 20250207生成式AI 一、 谷歌Gemini 2.0系列集体上新,全员跻身大模型竞技场前10 1. Gemini 2.0系列全新发布三款模型:Flash、Pro和Flash-Lite,全部进入大模型竞技场前十; 2. Gemini 2.0 Pro成为谷歌最强模型,具备200万tokens上下文窗口,在13项评测中获11项第一; 3. Gemini 2.0 Flash-Lite针对成本优化,具备100万tokens长文本能力,提供极高性价比。 https://mp.weixin.qq.com/s/zx-mY4MoCZgBWG9byh2wnA 二、 终结谷歌搜索?OpenAI免费开放ChatGPT搜索,无需注册 1. OpenAI向所有用户开放ChatGPT搜索功能,无需注册即可使用,突破原有限制; 2. ChatGPT搜索能实现分钟级网络信息抓取,适合快速获取新闻内容,并提供源地址; 3. 可根据提问语言自动匹配对应语种信息源,中英文搜索结果分别来自不同区域网站。 https://mp.weixin.qq.com/s/3bUpEV2a_98dnEoT95qNKw 三、 16张H100训26分钟,成本不足50美元的推理模型s1? 1. 李飞飞团队仅用1000个样本、16张H100训练26分钟,通过预算强制技术使模型超越OpenAI o1-preview; 2. 预算强制技术通过控制思维持续时间,可强制结束或延长模型思考过程,提升推理能力; 3. s1-32B成为最具样本效率的推理模型,验证少量高质量数据比大量数据更有效。 https://mp.weixin.qq.com/s/iGi20QGI8KFn-WPtBL5JCw 四、 首个自研万卡集群点亮,上架DeepSeek官网价格3折! 1. 百度点亮首个自研万卡昆仑芯集群,并计划扩大至3万卡规模,推动国产AI算力升级; 2. 百舸4.0称实现多芯混训95%效能,突破硬件扩展性瓶颈,支持高性能网络和自动容错; 3. DeepSeek R1和V3在百度云价格分别降至五折和三折,降低AI开发门槛。 https://mp.weixin.qq.com/s/r6DOD2-QOwanIMNwJice8w 五、 北大港科的多模态版DeepSeek-R1,评测表现超GPT-4o? 1. 北大港科大联合研发多模态版DeepSeek-R1(Align-DS-V),部分视觉理解评测超越GPT-4o; 2. 团队发现多模态训练后的模态穿透效应,显著提升文本推理能力,如ARC-Challenge提升近一倍; 3. 基于自研Align-Anything框架,实现全模态对齐,支持文本、图片、视频、音频间任意模态转换。 https://mp.weixin.qq.com/s/_S4tovrggFZdPIqFuos2Nw 六、 刚加入Anthropic的OpenAI联创John Schulman,又离职了 1. OpenAI联创John Schulman继加入Anthropic半年后再次离职,这是他一年内的第二次离职; 2. Schulman在Anthropic期间主要从事大语言模型对齐研究,包括可扩展监督和模型行为规划; 3. 他是OpenAI多位离职高管之一,包括CTO Mira Murato、首席科学家Ilya Sutskever等人。 https://mp.weixin.qq.com/s/Ntb8W4lVDrkQ9EVMZGaEkQ 前沿科技 七、 Nature:研究人员如何使用 AI?科学领域利弊调查分析 1. 全球4946名研究者调查显示,81%使用过ChatGPT,超半数认为AI在文献审查、研究总结等任务上超越人类; 2. 72%研究者计划两年内使用AI准备论文手稿,早期研究者对AI辅助申请资助更感兴趣; 3. 64%研究者对AI处理复杂任务持谨慎态度,81%担忧AI准确性和透明度,呼吁出版商提供使用指南。 https://mp.weixin.qq.com/s/gYt959efPEh3Mn5dZQU6Fw 报告观点 八、 Karpathy 3 小时深度揭秘生成式AI“大脑”,盛赞DeepSeek 1. Karpathy详解ChatGPT训练分为三阶段:预训练获得Base Model、监督微调成为助手、强化学习提升推理; 2. Karpathy特别盛赞DeepSeek-R1的强化学习能力,它能通过试错发展出超越简单模仿的深度推理; 3. 他指出LLM是无状态的token生成器,呈现"参差不齐的智能",应作为工具使用而非完全依赖。 https://mp.weixin.qq.com/s/Dca3r8uWsnZPNNESwtzRFg 九、 a16z发布2025 AI语音图谱:语音将成为与AI交互的主要模式 1. a16z预测语音将成为AI交互主要模式,2024已从语音基础设施层过渡到应用层发展; 2. 语音智能体市场2024年下半年爆发,全球掀起融资热潮,企业切入点主要包括非工作时间呼叫、外呼电话和后台电话; 3. B2B和医疗保健成为语音智能体主要应用领域,a16z看好那些通话受限可控、能显著降低成本的商业场景。 https://mp.weixin.qq.com/s/Ra7mtxvf2cJna_yuPuf_ew |