详细内容

【筠岚研究院】一周AI(2025.01.20-01.26)

image.png

要闻列表

AI万象

Meta首席科学家LeCun:新一代AI架构3到5年内问世,机器人技术是核心


5000亿美元投资,特朗普宣布建设“星际之门”AI基础设施


全球手机用户为AI应用支出达12.7亿美元,ChatGPT领跑市场

大平台动作

微软解绑:允许OpenAI使用竞争对手计算资源


三星宣布与谷歌联手研发AR眼镜


美图影像研究院与北交大联合研发自然图像抠图新技术,入选AAAI 2025


字节启动AGI长期研究计划,代号Seed Edge


蔚来布局具身智能:组建20人团队研发机器狗

新力量崛起

国产大模型再突破!DeepSeek R1开源

投融资风向

AI文本编码初创公司StackBlitz洽谈新一轮融资,估值7亿美元





01

Meta首席科学家LeCun:新一代AI架构3到5年内问世,机器人技术是核心




AI万象

image.png


Meta首席AI科学家Yann LeCun周四表示,在未来3到5年内,“全新的AI架构范式”将会出现,其能力将远远超越现有AI系统。他还预测,未来几年可能成为“机器人技术的十年”,届时AI和机器人技术的进步将结合在一起,解锁新一代智能应用程序。


媒体报道,在达沃斯论坛上的一场名为“技术辩论”的会议上,LeCun指出,目前的“AI形式”,即生成式AI和大型语言模型(LLMs),并没有那么强大。他认为,虽然这种模型是有用的,但在很多方面仍存在不足。


他表示,当下AI模式的“限制”阻碍了机器实现真正的智能行为,这主要归结为四个关键原因:缺乏对物理世界的理解、缺乏持久记忆、缺乏推理能力以及缺乏复杂规划能力。

尽管生成式AI令人印象深刻,能够通过律师资格考试或发现新药物,但LeCun认为,机器人技术可能成为下一波AI应用的核心,特别是在实际场景中。


目前,Meta正在机器人领域开展一些研究,而当前备受关注的AI明星企业ChatGPT的开发者OpenAI也在机器人领域进行探索。本月早些时候,有消息称OpenAI成立了一个新的机器人团队,专注于“通用”、“自适应”和“多功能”机器人,目标是实现人类般智能并适应现实世界。


新闻拓展:

https://baijiahao.baidu.com/s?id=1822058314172797099&wfr=spider&for=pc




02

5000亿美元投资,特朗普宣布建设“星际之门”AI基础设施




AI万象

image.png


国总统特朗普1月21日在白宫宣布,由三家公司组成的联合企业将投资5000亿美元,在美建设名为“星际之门”(Stargate)的AI基础设施。


该项目将由美国甲骨文公司、OpenAI(美国开放人工智能研究中心)和日本软银集团共同出资投建,计划在美国建设数据中心,以支持人工智能技术发展。


特朗普当天与上述三家公司的负责人在白宫举行发布会,宣布了这一消息。特朗普说,“星际之门”将建设支持新一代人工智能发展的物理和虚拟基础设施,包括建设大型数据中心,并有望创造10万个就业岗位。


甲骨文公司联合创始人拉里·埃里森透露,三家公司实际上已经合作了一段时间,第一批数据中心正在得克萨斯州建设,“目前正在建设10栋建筑,未来将扩展到20栋”。


据美国媒体报道,“星际之门”的初始投资为1000亿美元,并计划在未来4年内扩展至5000亿美元。


新闻拓展:

https://mp.weixin.qq.com/s/LIDXcAt2IoVqHtDE_D_ZRg




03

全球手机用户为AI应用支出达12.7亿美元,ChatGPT领跑市场




AI万象

image.png


当地时间周三,根据移动应用分析机构Sensor Tower的最新数据,2024年全球手机用户在AI聊天机器人和AI艺术生成工具上的支出达到12.7亿美元。其中,聊天机器人应用占据了10.7亿美元,较2022年的3000万美元和2023年的4.55亿美元大幅增长。


在聊天机器人平台中,ChatGPT依然占据主导地位,占AIGC应用下载量的23%和AI应用消费的40%。谷歌Gemini和字节跳动的豆包分别位列下载量第二和第三。


此外,去年全球手机用户使用AI聊天机器人的时长达到70亿小时,同比增长347%。在苹果App Store和谷歌Play商店中,带有“AI”字样的应用下载量达到170亿次。


新闻拓展:

https://www.prnewswire.com/news-releases/sensor-tower-consumer-spending-on-apps-soared-in-2024-and-mobile-rode-the-wave-of-ai-enthusiasm-302356449.html




04

微软解绑:允许OpenAI使用竞争对手计算资源




大平台动作

image.png


1月21日,微软公司发布公告,宣布调整和OpenAI公司的合作关系,允许OpenAI使用竞争对手的计算资源。此次调整旨在满足OpenAI日益增长的算力需求,并缓解双方因算力供应问题产生的摩擦。


此前,OpenAI的算力需求完全依赖于微软的Azure云基础设施。由于OpenAI的模型训练和用户规模扩张需要巨额算力投入,微软的供应速度曾引起一些OpenAI股东的不满,这也促使OpenAI在6月与甲骨文合作(获得了微软的许可)。


根据双方调整的协议内容,主要调整了算力排他性,微软拥有优先购买权(ROFR),这意味着OpenAI可以从其他供应商处获取算力,而微软则保留了优先满足其需求的权利。


微软已批准OpenAI自主构建额外的算力,主要用于模型的研究和训练,这将进一步增强OpenAI的研发能力。


双方合作的基础(持续到2030年)基本保持不变。微软保留对OpenAI技术用于Copilot等产品的独家权利,OpenAI的API仍将Azure独占,双方也将维持现有的收益分成模式(据报道,微软获得OpenAI收入的20%)。


此次协议调整恰逢OpenAI、软银集团和甲骨文宣布成立一个5000亿美元的合资企业,将在美国建立云计算数据中心“星际之门”(Stargate),微软表示将为该合资企业提供技术支持,但不会投入资金。


新闻拓展:

https://blogs.microsoft.com/blog/2025/01/21/microsoft-and-openai-evolve-partnership-to-drive-the-next-phase-of-ai/




05

三星宣布与谷歌联手研发AR眼镜




大平台动作

image.png


当地时间1月22日,三星电子在美国加州圣何塞举办的“Galaxy Unpacked”发布会上,三星电子移动体验(MX)事业部长(社长)卢泰文接受媒体采访透露,公司正与谷歌合作,寻求进军增强现实(AR)眼镜市场。


卢泰文称,两家公司去年12月宣布合作开发Project Moohan后,就已开始携手研发AR眼镜,此外并未透露更多细节。被问及这款眼镜何时上市,卢泰文表示,两家公司“将尽快达到我们想要的质量和准备程度”。


研发真正的AR眼镜一直是科技行业难以实现的目标。谷歌、苹果和Meta都在寻求打造一款轻型眼镜,可以在现实世界的视图上覆盖数据和图形,但与成本和工程相关的挑战使进展缓慢。


作为韩国最大的公司,三星也是全球最多产的智能手机制造商之一。该公司正在为其消费者业务寻找新的增长引擎。该公司去年推出了Galaxy Ring,扩大了其可穿戴和健康相关电子产品的范围,该产品可以跟踪用户一天中的睡眠、压力和运动情况。三星电子和谷歌作为“一个团队”共同开发的Android XR,旨在为所有类型的可穿戴式头戴设备提供统一的操作系统。


这两家公司推出的AR眼镜将与Meta即将推出的产品竞争,可能还会与苹果竞争,苹果对自己的计划更为谨慎。据媒体周二报道,Meta计划在2027年推出名为Artemis的AR眼镜。


新闻拓展:

‍https://mp.weixin.qq.com/s/9EYhiURU4nwPInU_-Pi0jA




06

美图影像研究院与北交大联合研发自然图像抠图新技术,入选AAAI 2025




大平台动作

image.png


近日,美图影像研究院(MT Lab)与北京交通大学联合提出了一种名为MEMatte(Memory Efficient Matting)的超高分辨率抠图技术,并成功入选人工智能领域的顶级会议AAAI 2025。


MEMatte技术的最大亮点在于它是一种显存友好的自然图像抠图框架,能够有效降低模型的计算开销。这一创新使得在显存受限的环境中,例如商用显卡和边缘设备上进行高清图像的精细抠图成为可能。


随着图像处理技术的不断发展,抠图技术已广泛应用于多个领域,如视频制作、虚拟现实和增强现实等。然而,传统的抠图方法通常需要大量的计算资源,这使得它们在一些资源有限的场景中难以实现。MEMatte正是针对这一问题而研发的,它不仅提高了处理效率,还保持了高分辨率图像的质量。


此外,研究团队还开源了一个名为UHR-395(Ultra High Resolution dataset)的超高分辨率自然图像抠图数据集。该数据集的推出将为高分辨率模型的训练与评估提供宝贵的资源,推动相关技术的进一步发展。通过开源,研究团队希望能够吸引更多的研究者和开发者参与到这一领域,共同推动技术进步。


新闻拓展:

‍https://mp.weixin.qq.com/s/QAuAiR7QsyMJdgGGgXSDQQ




07

字节启动AGI长期研究计划,代号Seed Edge




大平台动作

image.png


1月23日,据晚点LatePost报道,字节跳动于1月下旬正式设立了代号为“Seed Edge”的研究项目,旨在开展比预训练和大模型迭代更为长期、基础的AGI(通用人工智能)研究。该项目已拟定五大研究方向,涵盖下一代推理、感知、软硬一体的模型设计、范式创新及Scaling方向。


下一代推理:探索更高效且更通用、提升模型推理能力的方法。

下一代感知:找到统一生成和理解表示的方法,表示和压缩真实世界,构建 “世界模型”。

软硬一体的模型设计:从软硬一体出发,探索 Transformer+GPU 之外的模型设计,发挥下一代硬件的能力。

下一代范式:在反向传播、Transformer 架构、预训练 + 对齐的模式之外,探索更高效的模型结构和学习方法。

下一代Scaling方向:在预训练和推理阶段的 Scaling Laws 之外,探索 Multi-Agent(多智能体)和 Test-Time Training(测试时间训练,动态调整模型参数)等方向。


具体而言,“Seed Edge”将探索更高效且通用的模型推理方法,以及统一生成和理解表示的方法,构建“世界模型”。此外,项目还将从软硬件结合的角度出发,探索超越Transformer+GPU的模型设计,并在反向传播等传统模式之外,寻找更高效的模型结构和学习方法。多智能体和测试时间训练等新方向也纳入了研究范畴。


据悉,Seed Edge会以虚拟项目组的形式运行,致力于探索这些不确定性更强的研究方向。与此同时,字节跳动近期还推出了豆包大模型1.5 Pro,该模型在知识、代码、推理等多个方面表现出色,综合得分优于多个知名模型。


新闻拓展:

https://mp.weixin.qq.com/s/6Epg3iRvzEczGuSSQdBzEA




08

蔚来布局具身智能:组建20人团队研发机器狗




大平台动作

image.png


1月21日,据《21汽车》报道,蔚来汽车已组建了一支约20人的团队,专门调研机器狗项目,并由前Momenta算法专家徐抗担任负责人。徐抗于2020年加入蔚来自动驾驶团队,此次转向机器狗项目,标志着蔚来在具身智能(Embodied AI)领域的进一步探索。


具身智能作为 AI 落地的重要方向,近年来备受关注。相比于两足机器人,四足机器狗因其稳定性、灵活性和承载力强等特点,更适用于复杂地形,且控制系统相对简单,无需复杂的双手操作。四足机器狗在电力巡检、流程工业、消防救援、国防军事等场景中具有广泛的应用前景,潜在市场规模预计达数千亿元。


汽车行业对具身智能的布局正在加速。2022年,特斯拉在AI DAY上展示了首款人形机器人“擎天柱”,其与特斯拉汽车共享全自动驾驶系统FSD,具备相同的视觉感知和计算能力。小鹏汽车紧随其后,于2020年收购机器人创业公司Dogotix,成立“鹏行智能”,并在2024年推出了能够执行生产任务的AI机器人Iron。理想汽车CEO李想则表示,将在解决L4级自动驾驶难题后进军人形机器人领域。此外,广汽集团、比亚迪、奇瑞、赛力斯等传统车企也在积极布局。


尽管机器狗的开发成本低于具身机器人,但具身智能的发展仍处于初期阶段。业内人士指出,智能汽车作为限定场景的机器人,其自动驾驶技术的发展尚需时日,而具身智能的应用场景更为广泛,技术难度也更高。蔚来此次涉足机器狗项目,显得尤为审慎。


新闻拓展:

‍https://mp.weixin.qq.com/s/sV5GuT_4K1wvoJAXnUkiOg




09

国产大模型再突破!DeepSeek R1开源




新力量崛起

图片


1月20日,DeepSeek发布了全新的开源推理大模型DeepSeek-R1,在数学、编程和推理等多个任务上达到了与OpenAI o1相当的表现水平,同时将应用程序编程接口(API,Application Programming Interface)调用成本降低了90-95%,定价为每百万输入tokens 1元(缓存命中)/ 4元(缓存未命中),每百万输出tokens 16元。


更重要的是,这一模型的实验性版本DeepSeek-R1-Zero证明了仅通过强化学习(RL,Reinforcement Learning),无监督式微调(SFT,Supervised Fine-Tun-ing),大模型也可以有强大的推理能力。


凭借其独特的强化学习训练方法,DeepSeek-R1首次展现出类人的“顿悟时刻”——在解决复杂问题时,模型会突然停下思考,自主修正推理路径,甚至用自然语言标注“等等,这一步可能有误”。


值得一提的是,DeepSeek-R1是DeepSeek旗下首款以MIT协议开源(包含权重)的模型,不限制商用,也无需申请,还明确允许通过模型蒸馏等方式将DeepSeek-R1用于训练其他模型。这意味着DeepSeek-R1有望在全球AI领域产生广泛影响,也能从全球开源社区中获得正向反馈,不断改进模型。


新闻拓展:

‍https://mp.weixin.qq.com/s/MssR1cfg8twTdXW11qkm3g




10

AI文本编码初创公司StackBlitz洽谈新一轮融资,估值7亿美元




投融资风向

image.png


1月22日,据彭博社消息,人工智能文本编码初创公司StackBlitz Inc.正在与投资者进行最后谈判,以7亿美元的估值进行融资。此次融资由Emergence Capital和GV(前谷歌风投)领投,StackBlitz预计筹集约8350万美元的资金,并将吸引Madrona Ventures、Conviction、Mantis等多家知名投资机构的参与。


根据Menlo Ventures 2024年的调查显示,在所有主流AI应用场景中,AI编程工具的采用率高达51%,居于首位。这一数据表明,相比于生成式AI在图像创作、文本创作等领域的应用,代码生成已经成为最容易落地且最受欢迎的场景。


成立于2017年的StackBlitz,最初专注于网页开发工具,但近年来,其推出的AI产品Bolt.new为公司带来了新的增长动力。Bolt.new作为一款基于人工智能的网站构建平台,自2024年10月上线以来,每月吸引近百万用户,并为公司带来了数千万美元的年经常性收入。该平台最大的亮点在于,即便用户没有编程经验,也能通过语音指令快速创建网页应用,大大降低了开发门槛。


根据PitchBook数据,StackBlitz的投资者还包括Flex Capital、Greylock Partners和Tribe Capital等知名风投机构,这些投资的注入将进一步巩固StackBlitz在AI编程工具市场的领先地位。


新闻拓展:

‍https://mp.weixin.qq.com/s/rivUB903KbfG2eboggbG2w


1
更多

Copyright © 2025 JUNLAN 版权所有 Xiamen JUNLAN Information Technology Co., Ltd.All rights reserved.号-1闽ICP备2025088459号

厦门火炬高新区软件园一期曾厝垵北路1号元汇楼318-417
849667331@qq.com
137-9977-2089

关于我们

产品介绍

新闻动态

官方微信

解决方案

seo seo