灵魂交响曲：人工智能日记_第2024章 11丨苹果AI“苹果智能”亮相！马斯克xAI将建造超级计算机

Qwen2-72B，作为 Qwen 系列的最新成员，是一款具备 720 亿参数的大型语言模型，涵盖了从 0.5 到 720 亿参数的多种规模。它在语言理解、生成、多语言处理、编程、数学和推理等多个领域的基准测试中表现出色，甚至在某些任务上超越了商业模型。

该模型采用了Transformer架构，并引入了SwiGLU 激活、注意力偏置和分组查询注意力等创新技术，同时提供了适应多种语言和代码的改进分词器。性能评估显示，Qwen2-72B 在包括 MMLU、HumanEval 和 GSM8K 在内的多项任务中都取得了卓越成绩，尤其在中文任务C-Eval和CMMLU上的表现突出，标志着开源语言模型的重大进步。

10．L3-Aethora-15B基于Llama3 架构的大型语言模型

L3-Aethora-15B 是一个由 Steelskull 开发的高级语言模型，它采用了 Llama3 架构，并通过特殊的 “abilteration” 方法调整了模型的回应，以减少拒绝性，提供更加顺畅的对话交互。该模型使用了 Depth Up Scale（DUS）技术的变体，通过 passthrough merge 方法合并了 15b 模型，并对‘o_proj’和‘down_proj’进行了特定的调整，以提高效率和减少困惑度。在使用 RsLora 和 DORA 训练方法的 4 个周期中，该模型在约个高质量样本的 Aether-Lite-V1.2 数据集上进行了训练，这些样本旨在平衡创造力、不精确性和智能。该模型支持 BF16 张量类型，且因大小过大，不能通过 Inference API 加载，而需通过 Inference Endpoints（专用）来运行。

11．日立将培训5万名员工使用生成式AI

据新浪财经，日立计划到2027年培训5万名员工，他们将能够使用生成式人工智能（AI）开发新服务。该计划将覆盖日立27万名员工中的约20%。日本国内外信息技术（IT）和铁路等部门的员工将接受培训。这家日本公司将为员工提供专门的生成式AI培训，包括如何将其引入服务和产品、如何收集数据以及如何构建大语言模型。

12．Al-Moammar与微软等签署数据中心合同

6月9日，Al-Moammar Information Systems（MIS）在沙特交易所公告称，与微软、沙特数据中心基金（Saudi Data Center Fund 1）签署了一份联合合同，目的是提供主机代管和数据中心服务，合同价值约占该公司上一年度（2023年）收入的50%以上。

13．Pika团队：打败Sora不难，算法能够以小胜大

即使Sora已经强势“炸”过场，Pika还是再次带着硅谷一众明星资方的投票回到了舆论中心。6月5日，Pika宣布已完成8000万美元（约合人民币5.8亿元）的B轮融资，总融资额达到1.35亿美元，较2023年末，公司投后估值实现翻倍至4.7亿美元。“我们会更aggressive地做视频大模型”，这家刚刚度过一周年生日的视频生成创业公司，计划在这轮融资之后快速扩张研究和工程师团队。

14．百度文库AI功能蝉联国内总榜第一名

6月7日，“AI产品榜”发布最新5月份榜单，百度文库AI功能连续蝉联国内总榜第一名。去年，在大模型赋能下，百度文库重构为“一站式AI内容获取和创作平台”，发布智能PPT、智能文档、智能思维导图、智能研究报告、智能画本、智能漫画、智能小说及全场景指令编辑等上百项多模态AI功能。截止目前，百度文库累计AI用户数已突破1.4亿，AI功能使用次数已突破15亿。

15．中国新增AI独角兽5家，均获阿里投资

CB Insights统计显示。截至4月底，以生成式AI为主要业务的独角兽在全世界共有37家（同期20家）。

截至2023年4月底，美国企业占据了AI独角兽的9成，但在最近1年内成为独角兽的17家企业中，有10家在美国以外设立主要基地。在中国，最近1年内诞生了5家AI独角兽，包括月之暗面、MiniMax、零一万物、百川智能和智谱AI。

在过去一年成为独角兽的17家企业中，英伟达向Cohere等7家企业出资，谷歌的母公司Alphabet向涉足视频生成的Runway等4家企业出资。来自中国的5家AI独角兽企业均获得阿里巴巴集团投资。