详细内容

【筠岚研究院】一周AI(2024.12.23-12.29)

要闻列表

AI万象

AI首次自主发现人工生命


最高法:完善涉网络侵权、人工智能、算法和涉数据不正当竞争等新类型案件的裁判规则

大平台动作

OpenAI或将重启人形机器人项目


英伟达的圣诞礼物:GB300和B300


阿里通义千问开源视觉推理模型QVQ-72B-Preview

新力量崛起

超大开源AI模型DeepSeek-V3发布,训练成本仅600万美元


阶跃星辰发布Step-1X-Medium模型:支持“图生图”,一键风格迁移


百川智能发布金融大模型Baichuan4-Finance


小鹏汽车2025年将推类无人驾驶:全系采用纯视觉方案

投融资风向

报告:微软和OpenAI根据财务利润定义AGI





01

AI首次自主发现人工生命




AI万象

图片


近日,Sakana AI联合MIT、OpenAI等机构提出了一种全新算法,实现了自动搜索人工生命的重大突破。


这一算法无需繁琐的手工设计,只需通过描述,AI就能发现全新的人造生命体。研究团队利用视觉-语言基础模型,成功在多种经典人工生命模拟中发现了新的生命形式,包括Boids、Particle Life、生命游戏(Game of Life)、Lenia和神经元胞自动机(Neural Cellular Automata)。


人工生命(ALife)是一门跨学科研究,旨在通过模拟生命的行为、特性和演化过程来理解生命的本质。传统的ALife研究依赖于研究人员的手工设计和直觉,难以预测复杂系统中的涌现行为。而此次提出的自动搜索人工生命(ASAL)框架,利用基础模型的广泛通用性,能够系统性地搜索所有可能的模拟配置,从而克服手动设计的局限性。


ASAL框架通过定义一组感兴趣的模拟(称为“基质”),然后使用基础模型自动发现最有趣、具有开放式的人造生命体。这一方法不仅提高了发现效率,还大大扩展了探索范围,为人工生命研究带来了新的活力。


研究者认为,这一新范式有望重新激发人工生命研究的热情,突破人类创造力的极限,为下一代AI系统提供灵感。


新闻拓展:

https://mp.weixin.qq.com/s/ERlCvGuqkYlSQuYB3Yx32g




02

最高法:完善涉网络侵权、人工智能、算法和涉数据不正当竞争等新类型案件的裁判规则




AI万象

image.png


12月26日,最高人民法院发布《人民法院第六个五年改革纲要(2024—2028年)》(以下简称《纲要》)。其中提到,完善发展新质生产力司法保障机制。主要包括:


加强对关键核心技术、重点领域、新兴产业等方面的知识产权司法保护。


建立完善涉重大科技创新案件的审理和监督指导机制。


健全知识产权行政执法和司法审判衔接机制。


完善数据权益司法保护制度,健全数据产权归属认定、市场交易、权益分配、利益保护的裁判规则。


完善涉网络侵权、人工智能、算法和涉数据不正当竞争等新类型案件的裁判规则,促进健全网络综合治理体系。


纲要还提出了完善数字技术智能应用机制。深入拓展数字技术司法应用场景,加强审判领域技术自主创新,强化智能算法、大语言模型、数字模型等技术应用,充分发挥人工智能技术辅助办案、集约事务、防控风险、方便诉讼等作用,打造安全可靠、协同高效、普惠便捷的数字技术司法应用体系,以数字化、智能化驱动审判流程、诉讼规则和司法模式变革。依托信息化手段和算法模型,建立办案数据抽查核验机制。加强对人工智能司法应用的审查监管和风险评估,建立具有规则引领和示范效应的技术应用伦理规则。


新闻拓展:

‍https://mp.weixin.qq.com/s/3u8ha4X5NHzJ8iBHP006DA




03

OpenAI或将重启人形机器人项目




大平台动作

image.png


12月25日,据科技媒体The Information报道,OpenAI正在探索开发自己的人形机器人。


OpenAI对于人形机器人其实并不陌生,此前还专门设有为机器人开发人工智能模型的部门,但此后在2021年悄然关闭。


关闭前,该部门也发布了多项研究成果。例如2017年发布模拟工具集合Roboschool,可用于训练机器人,其中一些模拟工具专门用于开发人形机器人,并进行了开源;2019年发布机械臂解魔方的训练成果。


在过去的一年里,OpenAI多次暗示自己对机器人项目重燃热情:投资于开发机器人硬件和软件的初创公司,如Figure和Physical Intelligence,并重启了四年前解散的内部机器人软件团队。


现在,OpenAI可能会将这种兴趣提升到一个新层次。根据两名直接了解讨论的人士的说法,该公司最近考虑开发一种类人机器人(humanoid robot)。据前述知情人士透露,目前关于OpenAI机器人项目的细节还很少,尚不清楚计划何时推出,以及将针对哪些领域。


新闻拓展:

https://mp.weixin.qq.com/s/0yYTqu3y9Udt1ZFnvxbTfQ




04

英伟达的圣诞礼物:GB300和B300




大平台动作

image.png


12月25日,据外媒SemiAnalysis爆料,英伟达在GB200和B200发布仅6个月后,再次推出全新GPU——GB300和B300。


新GPU的算力提升主要有三部分:


工艺节点,与B200使用同样的台积电4NP,但是全新流片


增加功率,GB300和B300 HGX的TDP分别达到1.4KW、1.2KW,相比之下B200系列分别提高0.2KW。


架构微创新,例如在CPU和GPU之间动态分配功率除了更高FLOPS之外,B300系列的显存也做了升级,从8层堆叠的HBM3E升级到12层(12-Hi HBM3E),显存容量从192GB升级到288GB,显存带宽保持不变,仍为8TB/s。


此外产品交付层面还有一个大变化,GB200系列提供整个Bianca Board,也就包括两颗GPU、一颗CPU、CPU的内存等所有组件都集成在一块PCB版上。


新闻拓展:

https://semianalysis.com/2024/12/25/nvidias-christmas-present-gb300-b300-reasoning-inference-amazon-memory-supply-chain/




05

阿里通义千问开源视觉推理模型QVQ-72B-Preview




大平台动作

image.png


阿里通义千问团队于12月25日宣布推出开源视觉推理模型QVQ-72B-Preview,该模型基于Qwen2-VL-72B构建,旨在增强视觉推理能力。QVQ-72B-Preview在多个数据集上进行了评估,包括MMMU、MathVista、MathVision和OlympiadBench。


在MMMU基准测试中,QVQ-72B-Preview取得了70.3的分数,显著超越了Qwen2-VL-72B-Instruct。此外,在MathVista、MathVision和OlympiadBench等专注于数学和科学问题的基准测试中,该模型也表现出色,有效缩小了与领先的最先进的模型之间的差距。


尽管QVQ-72B-Preview在视觉推理方面表现优异,但团队也指出了该模型的一些限制,包括语言混合与切换、递归推理、安全和伦理考虑以及性能和基准限制。用户在部署时应保持谨慎,并注意这些潜在问题。


阿里通义千问团队表示,QVQ-72B-Preview是一个实验性研究模型,专注于增强视觉推理能力,未来将继续优化和改进该模型,以提升其在复杂问题上的表现。


新闻拓展:

https://mp.weixin.qq.com/s/dsm1wmUqHaUVCbUteUb-mg




06

超大开源AI模型DeepSeek-V3发布,训练成本仅600万美元




新力量崛起

image.png


12月26日,中国人工智能初创公司DeepSeek发布了其最新的超大模型DeepSeek-V3,这一模型以其开放源代码技术和创新挑战领先AI供应商而闻名。


DeepSeek-V3拥有671B个参数,并采用专家混合架构(mixture-of-experts architecture)来激活特定参数,以准确高效地处理给定任务。根据DeepSeek提供的基准测试,这一新模型已经超越了一些领先开源模型,并且与封闭模型性能相近。


DeepSeek-V3的主要特点包括:


与前身DeepSeek-V2一样,新模型基于多头潜在注意力(MLA)和DeepSeekMoE的基本架构,确保了高效的训练和推理。


公司还推出了两项创新:辅助无损失负载平衡策略和多令牌预测(MTP),后者允许模型同时预测多个未来令牌,提高了训练效率,并使模型运行速度提高三倍,每秒生成60个令牌。


在预训练阶段,DeepSeek-V3训练了14.8T高质量和多样化的令牌,并进行了两阶段的上下文长度扩展,最终进行了监督式微调(SFT)和强化学习(RL)的后训练,以使模型与人类偏好对齐并进一步释放其潜力。


在训练阶段,DeepSeek采用了多种硬件和算法优化,包括FP8混合精度训练框架和DualPipe算法进行流水线并行,降低了训练成本。DeepSeek-V3的整个训练过程声称在2788K H800GPU小时或大约557万美元内完成,远低于通常用于预训练大型语言模型的数亿美元。


新闻拓展:

‍https://mp.weixin.qq.com/s/tJujsOtWnEbcRKu-bDbKNQ




07

阶跃星辰发布Step-1X-Medium模型:支持“图生图”,一键风格迁移




新力量崛起

image.png


“阶跃星辰”官方公众号12月25日发布博文,宣布推出Step-1X-Medium增强AI模型,显著提升生成速度、理解能力、细节质感以及创作功能,目标成为创作者的得力助手。


升级后的模型能够更精准地理解用户指令,生成更契合需求的图像作品,并新增了“图生图”的垫图、风格迁移等更丰富的创作玩法,进一步降低创作门槛。


阶跃星辰曾于今年7月推出图像生成模型Step-1X系列,而本次推出的Step-1X-Medium的全新升级版本,改进如下:


基于MMDit 架构,Step-1X-Medium的生成速度提升了30%以上;

经过针对性训练,Step-1X-Medium更懂创作者的需求,拥有更强的理解能力和图文一致性,且生成画面能够呈现出更加自然的细节质感;

为了满足更多元的创作需求,推出了支持「图生图」的垫图玩法:只需要上传图片并给到简单的Prompt指令,就可以对原图进行细节增强、一键风格迁移转换或小范围局部修改;

Step-1X-Medium进一步升级了「中国风」内容的创作能力,能更好地捕捉东方面孔的神韵,呈现更加高级、细腻的画面质感;

Step-1X-Medium支持在Prompt中添加英文,在图上呈现英文文案。


新闻拓展:

https://mp.weixin.qq.com/s/pCHWF4Cqo7nYZuVZtwaWWQ




08

百川智能发布金融大模型Baichuan4-Finance




新力量崛起

image.png


12月23日,百川智能发布了全新的全链路领域增强金融大模型Baichuan4-Finance。不同于行业常见的大语言模型,Baichuan4-Finance主要面向金融领域,但并未放弃通用能力。


在主要面向模型专业金融能力的评测FLAME-Cer中,Baichuan4-Finance在银行、保险、基金、证券等多个资格认证领域的准确率均突破了95%,整体准确率达到93.62%。


而在侧重模型的场景应用能力的FLAME-Sce 评测中,Baichuan4-Finance一级核心金融业务场景的整体可用率达84.15%,金融数据计算、金融知识理论等场景的可用率超过90%。


据百川智能介绍,为实现模型在提升专业能力的同时,不损失通用能力,百川智能专门打造了一套全链路领域增强方案,行业首创领域自约束训练技术,涵盖高质量数据集构建、模型预训练、微调、强化学习等流程。Baichuan4-Finance正是该方案的最新成果,其高质量金融数据集全面严谨,包含核心专业金融知识数据及实践应用类数据,为提升金融能力提供良好支撑。


此外,百川智能还在领域自约束训练中引入高精通用数据混合训练,以确保通用能力能够稳步增长。后训练环节,百川智能通过合成数据、指令数据进行有监督微调,针对金融领域特定场景进行样本增强,进一步提升了大模型的性能表现。


新闻拓展:

‍https://mp.weixin.qq.com/s/LE_IWcul9kNkKbo0mMmfpw




09

小鹏汽车2025年将推类无人驾驶:全系采用纯视觉方案




新力量崛起

image.png


12月26日,据36氪报道,小鹏汽车正处于“无人化(驾驶)前夜”,预计明年在智能驾驶能力上将实现更大突破。小鹏智驾可能先在Max车型上逐步提供类似无人驾驶的能力。


小鹏汽车基于AI鹰眼的纯视觉方案,能够实现比人眼视觉更好的效果,特别是在大光差、逆光场景下的表现。


端到端的技术趋势被视为智能驾驶领域的一场“工业革命”,但能实现转型升级的企业并不多,因为这一过程会使迭代链条变得更长、更加不可控,需要投入更多的资源,包括更大的算力和更精英的AI研究人员。车企而非供应商更有可能率先从辅助驾驶突破到无人驾驶。


此外,小鹏汽车智能驾驶负责人李力耘表示,从P7+车型开始,小鹏将不再区分Max和Pro版本,而是全系标配Max,即小鹏AI图灵智驾(NGP),并采用纯视觉方案。


新闻拓展:

https://mp.weixin.qq.com/s/hlNPhND9C3sHrIzS7VcA8w




10

报告:微软和OpenAI根据财务利润定义AGI




投融资风向

image.png


近日,根据The Information的最新报告,微软和OpenAI对人工通用智能(AGI)有一个非常具体且内部的定义,这个定义基于初创公司的利润。根据这一定义,OpenAI距离实现AGI还有好几年的时间。


据报道,这两家公司去年签署了一项协议,规定只有当OpenAI开发的AI系统能够产生至少1000亿美元的利润时,才算实现了AGI。这与许多人期待的严格技术和哲学上的AGI定义相去甚远。


今年,OpenAI预计将损失数十亿美元,该公司告诉投资者,直到2029年之前都不会盈利。


这个细节很重要,因为当OpenAI达到AGI时,微软将失去对OpenAI技术的访问权。AGI是一个模糊的术语,对每个人来说意义不同。一些人推测OpenAI会尽快宣布实现AGI,以排除微软的竞争,但这项协议意味着微软可能在未来十年或更长时间里都能访问OpenAI的模型。


新闻拓展:

‍https://mp.weixin.qq.com/s/rk6TW89FTxSC9sjL2mLH1w


1
更多

Copyright © 2025 JUNLAN 版权所有 Xiamen JUNLAN Information Technology Co., Ltd.All rights reserved.号-1闽ICP备2025088459号

厦门火炬高新区软件园一期曾厝垵北路1号元汇楼318-417
849667331@qq.com
137-9977-2089

关于我们

产品介绍

新闻动态

官方微信

解决方案

seo seo