第2024章 11丨苹果AI“苹果智能”亮相!马斯克xAI将建造超级计算机

Qwen2-72B,作为 Qwen 系列的最新成员,是一款具备 720 亿参数的大型语言模型,涵盖了从 0.5 到 720 亿参数的多种规模。它在语言理解、生成、多语言处理、编程、数学和推理等多个领域的基准测试中表现出色,甚至在某些任务上超越了商业模型。

该模型采用了Transformer架构,并引入了SwiGLU 激活、注意力偏置和分组查询注意力等创新技术,同时提供了适应多种语言和代码的改进分词器。性能评估显示,Qwen2-72B 在包括 MMLU、HumanEval 和 GSM8K 在内的多项任务中都取得了卓越成绩,尤其在中文任务C-Eval和CMMLU上的表现突出,标志着开源语言模型的重大进步。

10.L3-Aethora-15B基于Llama3 架构的大型语言模型

L3-Aethora-15B 是一个由 Steelskull 开发的高级语言模型,它采用了 Llama3 架构,并通过特殊的 “abilteration” 方法调整了模型的回应,以减少拒绝性,提供更加顺畅的对话交互。该模型使用了 Depth Up Scale(DUS)技术的变体,通过 passthrough merge 方法合并了 15b 模型,并对‘o_proj’和‘down_proj’进行了特定的调整,以提高效率和减少困惑度。在使用 RsLora 和 DORA 训练方法的 4 个周期中,该模型在约 个高质量样本的 Aether-Lite-V1.2 数据集上进行了训练,这些样本旨在平衡创造力、不精确性和智能。该模型支持 BF16 张量类型,且因大小过大,不能通过 Inference API 加载,而需通过 Inference Endpoints(专用)来运行。

11.日立将培训5万名员工使用生成式AI

据新浪财经,日立计划到2027年培训5万名员工,他们将能够使用生成式人工智能(AI)开发新服务。该计划将覆盖日立27万名员工中的约20%。日本国内外信息技术(IT)和铁路等部门的员工将接受培训。这家日本公司将为员工提供专门的生成式AI培训,包括如何将其引入服务和产品、如何收集数据以及如何构建大语言模型。

12.Al-Moammar与微软等签署数据中心合同

6月9日,Al-Moammar Information Systems(MIS)在沙特交易所公告称,与微软、沙特数据中心基金(Saudi Data Center Fund 1)签署了一份联合合同,目的是提供主机代管和数据中心服务,合同价值约占该公司上一年度(2023年)收入的50%以上。

13.Pika团队:打败Sora不难,算法能够以小胜大

即使Sora已经强势“炸”过场,Pika还是再次带着硅谷一众明星资方的投票回到了舆论中心。6月5日,Pika宣布已完成8000万美元(约合人民币5.8亿元)的B轮融资,总融资额达到1.35亿美元,较2023年末,公司投后估值实现翻倍至4.7亿美元。“我们会更aggressive地做视频大模型”,这家刚刚度过一周年生日的视频生成创业公司,计划在这轮融资之后快速扩张研究和工程师团队。

14.百度文库AI功能蝉联国内总榜第一名

6月7日,“AI产品榜”发布最新5月份榜单,百度文库AI功能连续蝉联国内总榜第一名。去年,在大模型赋能下,百度文库重构为“一站式AI内容获取和创作平台”,发布智能PPT、智能文档、智能思维导图、智能研究报告、智能画本、智能漫画、智能小说及全场景指令编辑等上百项多模态AI功能。截止目前,百度文库累计AI用户数已突破1.4亿,AI功能使用次数已突破15亿。

15.中国新增AI独角兽5家,均获阿里投资

CB Insights统计显示。截至4月底,以生成式AI为主要业务的独角兽在全世界共有37家(同期20家)。

截至2023年4月底,美国企业占据了AI独角兽的9成,但在最近1年内成为独角兽的17家企业中,有10家在美国以外设立主要基地。在中国,最近1年内诞生了5家AI独角兽,包括月之暗面、MiniMax、零一万物、百川智能和智谱AI。

在过去一年成为独角兽的17家企业中,英伟达向Cohere等7家企业出资,谷歌的母公司Alphabet向涉足视频生成的Runway等4家企业出资。来自中国的5家AI独角兽企业均获得阿里巴巴集团投资。