Apple Intelligence研究团队发布了两个新的高性能语言模型

苹果的Apple Intelligence研究团队发布了两个新的小型但高性能语言模型,用于训练人工智能生成器。

image

苹果的机器学习团队正在与业内其他团队一起参与一个开源的语言模型数据包项目。苹果最近生产的两款模型被认为可以与其他领先的训练模型相媲美,例如Llama 3和Gemma。

通过提供标准框架,此类语言模型用于训练ChatGPT等人工智能引擎。这包括架构、参数和数据集过滤,以便为人工智能引擎提供更高质量的数据。

苹果向该项目提交的文件包括两种模型:一种较大的模型,具有70亿个参数,另一种较小的模型,具有14亿个参数。

苹果团队表示,在基准测试中,较大模型的表现比之前的顶级模型MAP-Neo高出6.6%。更值得注意的是,苹果团队的DataComp-LM模型使用的计算能力减少了40%。

苹果团队发布的这些模型无意用于未来的任何苹果产品。它们是社区研究项目,旨在展示在策划用于训练人工智能模型的小型或大型数据集方面提高的有效性。

上一篇

苹果金融合作伙伴Green Dot Bank被美联储罚款4400万美元

下一篇

苹果在原创节目上投资超过200亿美元 但收效甚微
相关推荐
苹果官宣:WWDC 2024主题发布会将于6月11日举行
TrollStore|巨魔2卸载软件,导致App Store商店版软件无法安装?
iQOO Neo 9 Pro现身跑分平台 搭载联发科天玑9300
爆料:iPhone 16 Pro Max有类似于“古铜色调”的配色
新的机模图片流出 展示iPhone 16 Pro的3个配色
四款iPhone 17都将配备升级后的2400万像素前置摄像头
评论(0)
游客的头像
表情
全部评论 只看作者
最新热门
  1. 暂时还没有评论哦