详细内容

【筠岚研究院】一周AI(2025.01.13-01.19)

image.png

要闻列表

AI万象

Snowflake推出 “百万思想与一个平台”计划,投资2000万美元助力AI技能提升

大平台动作

苹果、阿里云、新思加入UALink联盟


谷歌、OpenAI被曝购买创作者未发布视频素材,以训练AI模型


Gemini AI实现视觉处理新突破:实时视频与静态图像同步分析


同传达到人类专家译员水平!科大讯飞行业首发端到端语音同传大模型


天猫精灵与夸克融合,将探索AI眼镜等硬件

新力量崛起

Luma发布视频模型Ray2:逼真到难以分辨,算力扩大10倍


Transformer²要做“活”的AI模型,动态调整权重,像章鱼一样适应环境

投融资风向

英国AI视频平台Synthesia获得1.8亿美元融资


AI语音厂商思必驰完成5亿元融资





01

Snowflake推出 “百万思想与一个平台”计划,投资2000万美元助力AI技能提升




AI万象

image.png


1月13日,Snowflake推出“百万思想与一个平台(One Million Minds + One Platform)” 计划。目标是在2027年前为超过10万人提供免费的Snowflake AI数据云培训与认证,并计划到2029年提升100万人的数据和AI技能。


Snowflake将为此投资2000万美元,用于提供培训和认证课程等。主要内容包括:


面向学术界——为学生提供免费访问Snowflake软件、培训材料以及行业领先的数据课程,为教育工作者提供认证课程和教学课程材料。Snowflake计划在未来一年内,将在Snowflake平台上授课、培训并最终认证学生的教育工作者和学术机构的总注册人数增加一倍以上。


面向高增长和新兴市场——为在使用Snowflake方面经验有限的个人提供新的Snowflake平台培训,加速他们对AI数据云的了解。培训由Snowflake认证讲师授课,涵盖AI数据云架构,包括数据仓库、数据湖、数据工程、AI/ML、数据应用和数据共享等内容。学生完成培训后,可通过成功完成SnowPro平台助理认证来验证新获得的技能。


新闻拓展:

https://www.snowflake.com/en/news/press-releases/snowflake-launches-one-million-minds-one-platform-program-investing-20-million-toward-ai-upskilling/




02

苹果、阿里云、新思加入UALink联盟




大平台动作

image.png


1月14日,UALink联盟发布公告,宣布阿里云、苹果和新思科技(Synopsys)三大巨头加入董事会,共同推进下一代AI集群互连技术发展。


UALink联盟于2024年10月正式成立,由AMD、亚马逊云科技、Astera Labs、思科、谷歌、慧与(HPE)、英特尔、Meta和微软9家企业发起,是当前全球最重要的AI纵向互连(Scale Up)国际组织。不同于目前英伟达主导的NVLink技术,UALink由AI产业链上下游公司共同参与研发,制定统一的开放互连标准,进而壮大相互兼容的AI硬件生态,为更大规模和更复杂的AI应用提供更高效的AI Infra。


UALink联盟主席Kurtis Bowman对新成员的加入表示欢迎,并指出,联盟成员已超过65家,涵盖云服务商、芯片和IP提供商、软件公司、系统OEM厂商等。


UALink 1.0规范预计将于2025年第一季度发布,届时将支持每通道高达200Gbps的扩展连接,最多可在AI Pod内连接1024个加速器。


新闻拓展:

https://baijiahao.baidu.com/s?id=1821272615374706996&wfr=spider&for=pc




03

谷歌、OpenAI被曝购买创作者未发布视频素材,以训练AI模型




大平台动作

image.png


据彭博社1月11日报道,目前有许多YouTuber和其他数字内容创作者正在将未发布的视频素材出售给人工智能公司,以帮助它们训练AI算法,这些创作者每笔交易往往能赚取数千美元。


根据知情人士透露,OpenAI、谷歌、AI媒体公司Moonvalley等正在向数百名内容创作者支付费用,以获取他们未发布的视频素材。由于这些素材没有在网上公开发布,因此它们对训练人工智能算法具有很高的价值,因为它们具有唯一性。


目前,人工智能公司为每分钟视频支付的价格在1至4美元之间,具体价格会根据视频的质量和格式有所不同。比如,4K视频和无人机拍摄或3D动画等特殊格式的视频通常售价更高。而大多数普通视频,如为YouTube、Instagram和TikTok制作的未使用素材,每分钟的价格大约在1到2美元之间。


许多内容创作者每年会拍摄大量视频素材用于制作社媒视频,但其中很多素材并没有最终发布,创作者因此无法从中获利。通过将这些未发布的素材出售给AI公司,创作者不仅可以多元化收入来源,还能跳出仅依赖广告的收入模式。


当前,AI公司因未经授权使用互联网公开发布的文本、视频和图片而受到批评,创作者未能从中获得应得的补偿。去年,新闻出版商、演员和内容创作者向OpenAI、Meta、英伟达等公司提起诉讼,指控它们未经授权使用其知识产权来构建AI模型,并且侵犯了版权。


新闻拓展:

https://mp.weixin.qq.com/s/3_lit9Ta44qVQZdMReITkw




04

Gemini AI实现视觉处理新突破:实时视频与静态图像同步分析




大平台动作

image.png


谷歌的Gemini AI近期实现了一个令人瞩目的技术突破,能够同时处理多个视觉信息流,这在人工智能领域具有里程碑式的意义。


这一功能的亮相并不是通过谷歌的主流平台,而是通过一个名为“AnyChat”的实验性应用得以展示。


Gemini AI的这项创新能力使其不仅能够实时观看视频内容,还能同步分析静态图像,打破了以往AI只能处理单一视觉输入的局限性。Gradio机器学习负责人Ahsen Khaliq在接受采访时指出:“现在,用户在与AI进行对话的同时,可以实时分享视频,并同时上传任何所需的图像供AI分析。”


AnyChat成功展示了多流AI视觉处理的实际潜力,这得益于Gemini AI先进的神经网络架构。虽然这种能力在Gemini的API中已经存在,但尚未在谷歌的官方应用中向普通用户开放。许多AI平台,包括ChatGPT,目前只能处理单一流的输入,当上传图像时会禁用实时视频流。


这项技术的潜在应用非常广泛。学生可以实时展示数学问题,并向Gemini展示教科书,获得逐步指导。艺术家可以分享正在创作的作品和参考图像,从而获得关于构图和技巧的实时反馈。


新闻拓展:

https://venturebeat.com/ai/google-gemini-ai-just-shattered-the-rules-of-visual-processing-heres-what-that-means-for-you/




05

同传达到人类专家译员水平!科大讯飞行业首发端到端语音同传大模型




大平台动作

image.png


1月15日,科大讯飞发布国内首个具备端到端语音同传能力的大模型——星火语音同传大模型,最快实现5秒以内的同传时延,达到人类专家译员的水平。


该模型通过模仿人类同传译员的思维链路进行训练,具备实时意群理解和切分、上下文语境精准选词以及碎片化信息重组的能力,这一特性使得星火语音同传大模型在处理复杂句式和语境时表现出色,能够迅速准确地传达原意。


在讯飞演示中,搭载了星火同传语音大模型的讯飞翻译机在英译中语音同传方面几乎实现了无延迟,非常适合出国旅游、国际展会等场景使用。这一优化不仅显著提升了翻译字幕的呈现速度,还保证了中英互译的准确性。


据了解,星火同传语音大模型支持译文长度反向调控,语音到文本的端到端翻译过程中,能够流式地进行意群切分、语境理解和信息重组。同时,流式语音合成技术还能够支持意群韵律衔接和自适应语速调节,进一步提升了翻译的自然度和流畅度。


在国际交流场景中,无论是日常对话、商务交流还是行业翻译等高难度同传翻译需求,星火同传语音大模型都展现出了卓越的性能。其内容完整度、信息准确度以及语言质量均处于行业领先水平。


新闻拓展:

https://mp.weixin.qq.com/s/WL1EpxSBw8pjIHis8qBkbQ




06

天猫精灵与夸克融合,将探索AI眼镜等硬件




大平台动作

image.png


1月16日,据《智能涌现》援引多个信源消息称,近期阿里旗下的智能互联事业群正式由智能信息事业群总裁吴嘉统管。


目前,天猫精灵的硬件团队已与夸克产品团队融合工作,其工作重点包括新一代AI产品的规划定义及与夸克AI能力的融合,融合后的新团队将探索包括AI眼镜在内的新硬件方向。


“智能互联”为阿里在2022年成立的一级业务部门,其核心品牌为“天猫精灵”,也是阿里内部为数不多的To C硬件业务。智能互联未来将依旧保持独立运作状态,天猫精灵业务中心负责人宋刚将向吴嘉汇报。


这一调整紧随去年12月通义业务的架构变动。当时,通义的To C产品及工程团队从阿里云分拆,并入智能信息事业群,与夸克形成平级关系,而通义实验室则留在阿里云体系内。


值得关注的是,融合后的团队将探索包括AI眼镜在内的新硬件方向。这一动向与近期AI眼镜市场的火热态势相呼应。在刚结束的CES2025展会上,各类智能眼镜产品密集亮相,展现出"百镜大战"之势。今年年初,阿里云已与AR品牌雷鸟创新RayNeo达成合作,将为其AI眼镜提供独家定制的通义大模型支持。


新闻拓展:

https://mp.weixin.qq.com/s/-SDCbIFrBHwX4_QjBQ0Ocg




07

Luma发布视频模型Ray2:逼真到难以分辨,算力扩大10倍




新力量崛起

image.png


1月16日,Luma AI在其Dream Machine生成AI视频创作平台上推出了最新的视频生成模型Ray2。与第一代相比,Ray2在文本语义还原、自然连贯动作、运镜、光影效果、物理模拟、色彩等方面更出色,同时算力扩大了10倍生成效率更高。


自去年夏天Dream Machine发布以来,短短七个月内,AI视频领域发生了迅速的变化,许多新模型相继问世,包括Runway、Kling、OpenAI的Sora和Google 的Veo2等。


Luma AI联合创始人兼首席执行官阿米特・简(Amit Jain)表示,Ray2经过十倍于前代模型 Ray1的计算训练,具备 “快速、自然、一致的运动和物理特性”。这一进步显著提高了生成可用于生产的视频的成功率,使更多人能够轻松进行视频创作。


目前,Ray2主要支持文本生成视频功能,用户可以输入描述,生成5到10秒的短视频。尽管由于需求激增,生成视频的时间有时会达到几分钟,但模型本身的生成速度相当快。


新闻拓展:

https://lumalabs.ai/ray




08

Transformer²要做“活”的AI模型,动态调整权重,像章鱼一样适应环境




新力量崛起

图片


1月15日,日本AI初创公司Sakana AI提出了一种可以根据不同任务动态调整模型权重的机器学习系统Transformer² ,致力于打造具有自适应能力的“活”AI。


传统的大型语言模型(LLM)微调方法通常计算密集,且在处理多样化任务时显得静态。为了解决这些挑战,Sakana AI研发出了奇异值微调(SVF)这一新颖的参数高效微调方法,它通过仅提取和调整模型权重矩阵中的奇异值来工作。这种方法降低了过拟合的风险,减少了计算需求,并允许固有的组合性。通过在狭窄的数据集上使用强化学习训练,可以获得一组有效的特定领域“专家”向量,从而直接优化各个主题的任务表现。


Transformer² 的核心在于两阶段机制:


第一阶段,模型分析传入的任务以了解其要求,然后应用特定于任务的调整来生成最佳结果。


第二阶段,通过有选择地调整模型权重的关键组成部分,该框架允许LLM实时动态地适应新任务。


Transformer²在多种任务(如数学、编码、推理和视觉理解)中表现出了显著的进步,在效率和特定任务的表现上超越了传统静态方法如LoRA,同时所需的参数大大减少。


新闻拓展:

‍https://mp.weixin.qq.com/s/_vdA_KygkFWqFE5Xm6CDRg




09

英国AI视频平台Synthesia获得 1.8 亿美元融资




投融资风向

image.png


英国AI视频平台Synthesia周三宣布完成一轮1.8亿美元的融资,公司估值达到21亿美元。这一数字较该公司2023年上一次融资时获得的10亿美元估值增加了一倍多。


这家总部位于伦敦的初创公司表示,本轮融资由风险投资公司NEA领投,Atlassian Ventures、World Innovation Lab和PSP Growth参投。


获得这笔资金后,Synthesia计划进一步开发新功能,将AI虚拟头像与大型语言模型结合,推出全新的视频播放器。公司表示,这些升级将使客户能够制作更加互动和个性化的视频内容,以满足日益增长的市场需求。


Synthesia还得到了芯片巨头英伟达的支持。该公司首席执行官Victor Riparbelli表示,由于其专注于“实用性”,投资者对其业务的评估与该领域的其他公司不同。


“当然,炒作周期对我们是有利的,”Riparbelli在接受采访时说,“对我们来说,重要的是建立一个真正优秀的企业。”


她补充说,与OpenAI、Anthropic和Mistral等公司不同,Synthesia并不“依赖”风险资本。


新闻拓展:

‍https://mp.weixin.qq.com/s/-z5OoFAmm1ynAnNO2J3UyA




10

AI语音厂商思必驰完成5亿元融资




投融资风向

image.png


1月14日,AI语音厂商思必驰发布消息,公司已完成5亿元融资。本轮融资由知名产业基金、国资平台、私募基金共同参与。


思必驰成立于2007年,是中国最早一批专注于AI领域的企业之一,其以AI语音起家,目前业务主要是提供软硬一体化的解决方案和AI硬件产品。


这轮融资后,思必驰将持续加速垂域大模型(DFM-2)与全链路对话技术在汽车、IoT等智能终端领域及会议办公、金融等行业场景的规模化落地。


据了解,在智能汽车领域,思必驰近五年的复合增长率接近80%。截至目前已与梅赛德斯-奔驰、奥迪、捷豹路虎、比亚迪、上汽通用五菱等全球60多家知名汽车品牌合作,推出200多款量产车型,累计“上车”超1500万辆。


在智能IoT领域,近五年复合增长率接近40%。截至目前已经与近200家客户合作,覆盖黑白电、厨电、小家电及消费电子等细分领域。


在芯片方面,思必驰连续两年自研AI芯片年均出货量均超过2000万颗,2024年,新增IoT类设备为1.6亿台。


新闻拓展:

‍https://mp.weixin.qq.com/s/WG8p_JMYj0TUQOLmnSP-CQ


1
更多

Copyright © 2025 JUNLAN 版权所有 Xiamen JUNLAN Information Technology Co., Ltd.All rights reserved.号-1闽ICP备2025088459号

厦门火炬高新区软件园一期曾厝垵北路1号元汇楼318-417
849667331@qq.com
137-9977-2089

关于我们

产品介绍

新闻动态

官方微信

解决方案

seo seo