|
【筠岚研究院】一周AI(2025.02.03-02.08)AI万象 宇树科技人形机器人亮相央视春晚,表演节目《秧Bot》 韩国政府加码人工智能战略:将成立国家AI委员会 大平台动作 OpenAI向所有用户开放ChatGPT搜索,无需注册 谷歌内部开始测试新搜索“AI模式” 亚马逊计划2025年投资超1000亿美元加速人工智能发展 英伟达与卡内基梅隆大学推出新框架ASAP,提升机器人训练精准度 AMD提前推出下一代GPU MI350 百度智能云成功点亮昆仑芯三代万卡集群,大幅降低单位算力成本 新力量崛起 进军文生图,DeepSeek发布多模态模型Janus-Pro 投融资风向 2024年近60家AI初创公司成立一年内获投,创始人不乏大厂背景 01 宇树科技人形机器人亮相央视春晚,表演节目《秧Bot》 AI万象 1月28日,中央广播电视总台《2025年春节联欢晚会》在多个电视频道直播。杭州宇树科技携旗下人形机器人登上春晚舞台,带来了一场别开生面的表演节目《秧Bot》。 据了解,春晚舞台上展示的是宇树旗下的人形机器人产品Unitree H1。最新款产品G1在2024年推出,身高约127厘米,体重约35公斤,拥有23至43个关节电机,能够完成单腿跳跃、原地360度转身等复杂动作。G1的头部搭载了Intel Real SenseD435深度相机和LIVOX-MID3603D激光雷达,实现360度全方位探测感知。此外,G1配备了先进的三指灵巧手Dex3-1,能够进行精细且灵敏的物体操作。 值得注意的是,宇树科技并非第一次出圈。去年年底,因发布了能越野“跑酷”、会“划水”过河,还可以负重载人的好性能机器狗产品B2-W,在全球范围内引发轰动。 宇树科技是一家来自杭州的具身智能创业公司,成立于2016年,创始人为王兴兴。目前,宇树科技有四足机器狗和通用人形机器人两大系列产品。数据显示,宇树科技占据着全球四足机器人市场近70%的份额。 新闻拓展: https://mp.weixin.qq.com/s/-jaugxWPos00zeN-n5IF1Q 02 韩国政府加码人工智能战略:将成立国家AI委员会 AI万象 2月5日,彭博社报道,韩国代理总统崔相穆周三表示,DeepSeek的最新人工智能模型有可能重塑产业格局,并预测说,“这是一个新的冲击”。韩国政府将尽快成立一个“国家人工智能委员会”,以使韩国成为全球三大人工智能领先国家之一。 据韩国市调查机构“WISEAPP·RETAIL”4日公布的统计数据,韩国民众上月第四周使用最多的生成型AI应用程序为ChatGPT,用户数量为493万人。中国的DeepSeek排名第二,在韩用户多达121万人。 韩国财政部周三发表声明称,政府将在国营的韩国开发银行下设一只新基金,为高科技产业提供低息贷款并购买其股份。韩国计划至少投资34万亿韩元(约合1700亿人民币),以支持高科技产业的发展。声明并未具体说明投资的开始日期或完成时间,也未提及融资细节。 就在该声明发布的前一天,OpenAI首席执行官山姆・奥特曼访问了首尔,与芯片制造商三星电子、SK集团以及互联网公司Kakao的高管会面。 韩国财政部将于3月在议会讨论相关法律的修订事宜。 新闻拓展: https://mp.weixin.qq.com/s/BIjKNFoCI_v7KXc_7TJJgQ 03 OpenAI向所有用户开放ChatGPT搜索,无需注册 大平台动作 2月6日凌晨,OpenAI宣布向所有用户开放ChatGPT搜索功能,无需注册。 ChatGPT搜索最初于去年10月推出,仅限付费用户使用。随后在去年12月,OpenAI将这一功能推广至所有用户。如今,取消登录限制后,ChatGPT的搜索服务将直接与Google和Bing等传统搜索引擎展开竞争,用户不再需要创建账号即可体验这一便捷服务。 与谷歌等传统收录模式的搜索引擎相比,ChatGPT搜索可以更快抓取网络信息,能实现分钟级别的解析,这对于股票、体育、财经等,需要第一时间快速获取新闻内容的行业帮助较大。同时借助大模型的能力,可以更好地解读用户的搜索想法,并且可以提供搜索结果的源地址,增强了信息的透明度。此外,ChatGPT搜索还支持语音输入模式,用户可以通过语音直接输入问题,大大提高了搜索的便捷性。 OpenAI此次免费开放ChatGPT搜索功能,无疑对搜索引擎市场产生了深远的影响。有网友甚至表示,谷歌时代可能已经结束,谷歌搜索的市场份额可能会大幅下降。 新闻拓展: https://mp.weixin.qq.com/s/3bUpEV2a_98dnEoT95qNKw 04 谷歌内部开始测试新搜索“AI模式” 大平台动作 太平洋时间2月5日,据9to5Google报道,谷歌搜索正在开发一种被称为“AI模式”的产品,并已在内部员工中开始进行测试。 根据内部邮件的描述,“AI模式”将智能搜索能力提升到一个新的水平,帮助用户整理信息,以便轻松消化,并提供链接以探索网络上的相关内容。该模式特别针对那些当前搜索结果无法很好满足的开放式和探索性问题。例如,用户可以询问一些需要建议和比较的问题,或者与系统进行后续对话。 “AI模式”由定制版Gemini 2.0模型提供支持,具备高级推理和深度思考功能。虽然用户界面尚未最终确定,但员工已经可以看到这一功能的 “早期发布”桌面体验,移动端也同样适用。 目前,“AI模式”正与美国的谷歌员工进行测试,谷歌首席执行官桑达尔・皮查伊表示,2025年将是搜索创新的一个重要年份,预计这一功能将在今年推出。 新闻拓展: https://9to5google.com/2025/02/05/google-search-ai-mode-testing/ 05 亚马逊计划2025年投资超1000亿美元加速人工智能发展 大平台动作 美东时间2月6日,据CNBC报道,亚马逊宣布将在2025年投入约1000亿美元用于其人工智能项目的研发,这一举措显示了这家电商巨头对AI技术的坚定信心和大力投入。 亚马逊首席执行官安迪·贾西在当地时间周四的投资者会议上表示,公司去年最后三个月的260亿美元支出“相当具有代表性”。这笔巨额投资将主要用于亚马逊网络服务(AWS),该部门负责运营数据中心并为客户提供软件工具。 亚马逊一直在加紧投资数据中心、网络设备和硬件,以满足对生成式AI的巨大需求。自2022年底OpenAI发布其ChatGPT助手以来,生成式AI的受欢迎程度激增。亚马逊推出了一系列AI产品,包括其自己的Nova系列模型、Trainium芯片、购物聊天机器人和名为Bedrock的第三方模型市场。 贾西指出,他看到了对AI服务和产品的“显著需求信号”,并认为更便宜、更高效的工具将促使客户增加支出。他表示:“企业在每单位基础设施上的支出将大大减少,这对他们的业务非常有用。但随后,他们会开始思考还能构建什么,最终他们的总支出通常会增加很多。” 外媒指出,亚马逊的年度投资计划将超过Alphabet和微软,这两家公司分别承诺投资750亿美元和800亿美元。 新闻拓展: https://baijiahao.baidu.com/s?id=1823363962043596480&wfr=spider&for=pc 06 英伟达与卡内基梅隆大学推出新框架ASAP,提升机器人训练精准度 大平台动作 近日,卡耐基梅隆大学与英伟达的研究团队联合发布了ASAP框架(Aligning Simulation and Real Physics,模拟与真实物理对齐),并将其应用于宇树科技G1人形机器人。 已披露的视频显示,G1能够像体坛巨星C罗、科比、詹姆斯一样,完成投篮、胯下运球等复杂动作。目前,该项目的论文和代码已开源。 英伟达高级研究科学家Jim Fan称:“网上看到的大多数机器人演示都会加速视频。我们实际上放慢了速度,这样你就可以观测人形机器人流畅的运动。” 论文指出,人形机器人可以实现类似人类的全身技能,但由于模拟和现实世界之间的动力学不匹配,实现敏捷和协调的全身运动仍然是一个重大挑战。现有的方法,如系统识别(SysID)和域随机化(DR)方法,通常依赖于劳动密集型的参数调整,或者要牺牲敏捷性,策略过于保守。 因此,研究团队提出了ASAP,这是一个两阶段框架,旨在解决动力学失配问题,并实现敏捷的人形全身技能。第一阶段,预训练一个基于相位的动作跟踪策略,以在仿真中模仿人类动作;第二阶段,在现实世界中推出该策略以收集数据,学习一个残差动作模型来补偿动力学不匹配,最后用学习到的残差模型对预训练策略进行微调。 新闻拓展: https://mp.weixin.qq.com/s/Y0dHqWBKoRlPzlOWLOj5oA 07 AMD提前推出下一代GPU MI350 大平台动作 美东时间周二,在四季度财报电话会上,AMD首席执行官苏姿丰宣布,计划将下一代GPU MI350系列的推出时间提前至2025年年中,早于此前预计的2025年下半年。 首款产品MI355X工艺升级台积电3nm,架构升级CDNA 4,引入FP6、FP4数据类型,搭配288GB HBM3E。2026年,AMD将继续推出全新的Instinct MI400系列,再次升级架构,但细节暂未公开。 苏姿丰表示:“我们的产品进展好于预期,客户需求强劲,因此我们决定加速生产进度,这将提高我们的相对竞争力。” 尽管AMD数据中心业务收入同比大幅增长,但与其主要竞争对手英伟达相比仍有较大差距。当前AMD数据中心业务营收超过50亿美元,而英伟达的销售额则超过了1000亿美元。 不过,AMD在过去一年中成功获得了包括Meta、微软和IBM在内的重要客户,进一步拓展其市场份额。 苏姿丰在电话会上预计,2024年旗下Instinct芯片的销售额超过50亿美元,预计2025年数据中心业务将实现“两位数”增长。 新闻拓展: https://baijiahao.baidu.com/s?id=1823176104407643937&wfr=spider&for=pc 08 百度智能云成功点亮昆仑芯三代万卡集群,大幅降低单位算力成本 大平台动作 2月5日,百度智能云在官方公号发文称,近日成功点亮昆仑芯三代万卡集群,这也是国内首个正式点亮的自研万卡集群。此外,百度智能云还将进一步点亮3万卡集群,百度通过自研芯片和大规模集群的建设,除了解决自身算力供应的问题外,还能为整个行业提供新的思路和方向。 从算力上看,超大规模并行计算能力可实现训练效率跃升,万卡集群可将千亿参数模型的训练周期大幅降低,满足AI原生应用快速迭代的需求。同时它也能支持万亿参数模型、复杂任务和多模态数据,支撑Sora类应用的开发。此外,万卡集群能够支持多任务并发能力,通过动态资源切分,单集群可同时训练多个轻量化模型,通过通信优化与容错机制减少算力浪费,实现训练成本指数级下降。 过去,多芯混训和激增的故障率等难题是万卡集群部署过程中的巨大挑战。对此,在2024年9月升级的百度百舸AI异构计算平台4.0,在万卡集群的建设中发挥了重要作用。此外,百度智能云千帆平台还在2月3日正式上架了DeepSeek-R1和DeepSeek-V3模型,此次接入的模型已全面融合千帆推理链路。 新闻拓展: https://mp.weixin.qq.com/s/QzVkXx-rhqA-GPARwNqBPg 09 进军文生图,DeepSeek发布多模态模型Janus-Pro 新力量崛起 1月28日凌晨,近期爆红的国产大模型DeepSeek在GitHub平台发布了Janus-Pro 7B和1.5B多模态大模型,进军文生图领域。 15亿和70亿的参数量,意味着这两个模型具备在消费级电脑上本地运行的潜力。与R1一样,Janus Pro采用MIT许可证,在商用方面没有限制。 DeepSeek方面表示,该款大模型是2024年11月13日发布的JanusFlow大模型的高级版本。相比前一代模型,Janus-Pro是一个新颖的自回归框架,统一了多模态理解和生成。通过将视觉编码分离为“理解”和“生成”两条路径,同时仍采用单一的Transformer架构进行处理,解决了以往方法的局限性。这种分离不仅缓解了视觉编码器在理解和生成中的角色冲突,还提升了框架的灵活性。 作为多模态模型,Janus-Pro不仅能生成图像,还能对图片进行描述,识别地标景点,识别图像中的文字,并对图片中的知识进行介绍。 尽管Janus-Pro目前只能处理384x384分辨率的图像,但考虑到其紧凑的模型规模,能达到如此水准已经令人惊艳。 目前,Janus系列的4款模型已经开源。 新闻拓展: https://mp.weixin.qq.com/s/6_6W0t9QeK0kVQrueWMW2A 10 2024年近60家AI初创公司成立一年内获投,创始人不乏大厂背景 投融资风向 2月7日,IT桔子在其公众号发布,2024年创立的中国人工智能公司有114家,较2023年同比减少了50%;2024年新创立的AI公司中有58家已经被资本投过,整体获投率非常高,可见AI赛道颇受投资人青睐。 成立一年内的AI公司普遍公布了一轮天使轮或种子轮融资,而有些AI初创公司在一年内连续获得了两三轮的融资,比如“深度原理”公司和“新言意码”公司。 此外,筑梦岛、云梧智能、新言意码、氦川科技、鼎深智能、谦合益邦、云锦微等7家AI公司在2025年初就已经披露了新的A轮/天使轮融资。 从创业者背景来看,100多家AI初创公司至少有30家企业高管来自大厂和名企,主要来自于字节、微软、盛大、华为和商汤、第四范式等知名互联网公司。 据IT桔子数据,有70家投资机构参与了一众AI初创公司的早期投资。在这些投资方名单中,不乏明星机构和知名投资方的身影,其中最活跃的当属AI早期投资机构奇绩创坛。 新闻拓展: |