Meta 推出 AI 语言模型 LLaMA,一个有着 650 亿参数的大语言模型 世界百事通
【资料图】
IT之家 2 月 25 日消息,Meta 在当地时间周五宣布,它将推出一种针对研究社区的基于人工智能 (AI) 的新型大型语言模型,与微软、谷歌等一众受到 ChatGPT 刺激的公司一同加入人工智能竞赛。
Meta 的 LLaMA 是“大型语言模型 Meta AI” (Large Language Model Meta AI)的缩写,它可以在非商业许可下提供给政府、社区和学术界的研究人员和实体工作者。
该公司将提供底层代码供用户使用,因此用户可以自行调整模型,并将其用于与研究相关的用例。Meta 表示,该模型对算力的要求“低得多”。
据介绍,该公司正在开发多种参数(7B、13B、33B 和 65B)的 LLaMA。其中,LLaMA 65B 和 LLaMA 33B 在 1.4 万亿个 tokens 上训练,而最小的模型 LLaMA 7B 也经过了 1 万亿个 tokens 的训练。
与其他大型语言模型一样,LLaMA 的工作原理是将一系列单词作为“输入”并预测下一个单词以递归生成文本。为了这套模型,Meta 从使用人数最多的 20 种语言中选择文本进行训练,重点是拉丁语和西里尔字母。
当然,与其他模型一样,LLaMA 也面临着偏见、有毒评论和幻觉的挑战,Meta 还需要做更多的研究来解决这类语言模型中的不足。
Meta 表示,LLaMA 作为一个基础模型被设计成多功能的,可以应用于许多不同的用例,而不是为特定任务设计的微调模型。通过开源 LLaMA 的代码,其他研究人员可以更轻松地找到限制或消除这些问题的新方法。Meta 还在本文中提供了一组评估模型偏差和毒性的基准评估标准,以显示模型的局限性并支持研究人员在这一关键领域的进一步研究。
值得一提的是,Meta 在去年 5 月也曾推出过大型语言模型 OPT-175B。该项目同样也是针对研究人员的,这构成了其聊天机器人 blenterbot 新迭代的基础。
后来,该公司还推出了一款名为“卡拉狄加”(Galactica) 的模型,据称它可以撰写科学文章和解决数学问题,但其演示版本后来被下架,因为它反复生成“听起来很权威”的内容。
IT之家附官方链接:
-
Meta 推出 AI 语言模型 LLaMA,一个有着 650 亿参数的大语言模型 世界百事通
IT之家 2023-02-25
-
乏燃料贮存水池冷却和净化系统 环球头条
互联网 2023-02-25
-
提拉米苏的含义9个字_提拉米苏的含义 全球热文
互联网 2023-02-25
-
脑积水后遗症智力退化_脑积水后遗症
互联网 2023-02-24
-
中兴通讯董事长李自学:践行绿色可持续发展战略_环球最资讯
和讯 2023-02-24
-
顿的拼音
互联网 2023-02-24
-
天天新消息丨新时代 新征程 新伟业 | 2022年云南省综合交通投资达3314亿元
云南发布 2023-02-24
-
每日观点:珠海冠宇去年净利降9成 IPO募22.5亿招商证券赚1.2亿
中国经济网 2023-02-24
-
全球即时看!东数西算概念午后拉升 美利云盘中涨停
证券时报网 2023-02-24
-
国际机构看好中国经济发展前景 环球新消息
人民日报 2023-02-24
-
Meta 推出 AI 语言模型 LLaMA,一个有着 650 亿参数的大语言模型 世界百事通
IT之家 2023-02-25
-
乏燃料贮存水池冷却和净化系统 环球头条
互联网 2023-02-25
-
提拉米苏的含义9个字_提拉米苏的含义 全球热文
互联网 2023-02-25
-
脑积水后遗症智力退化_脑积水后遗症
互联网 2023-02-24
-
中兴通讯董事长李自学:践行绿色可持续发展战略_环球最资讯
和讯 2023-02-24
-
顿的拼音
互联网 2023-02-24
-
天天新消息丨新时代 新征程 新伟业 | 2022年云南省综合交通投资达3314亿元
云南发布 2023-02-24
-
每日观点:珠海冠宇去年净利降9成 IPO募22.5亿招商证券赚1.2亿
中国经济网 2023-02-24
-
全球即时看!东数西算概念午后拉升 美利云盘中涨停
证券时报网 2023-02-24
-
国际机构看好中国经济发展前景 环球新消息
人民日报 2023-02-24
-
女子避雨时随手拍下人生的轮回:你养我小,我养你老!_天天百事通
北京青年报官网 2023-02-24
-
环球热消息:连续追踪9小时 找回走失老人
今晚报 2023-02-24
-
【天天快播报】金麒麟花园_金麒麟花
互联网 2023-02-24
-
世界最高的塔排名_世界最高的塔 全球动态
互联网 2023-02-23
-
简短唯美祝福语句_简短唯美祝福语句精选
互联网 2023-02-23
-
霸王别姬最早出自哪部史书_霸王别姬最早
互联网 2023-02-23
-
今日部分锂电材料报价下跌 工业级碳酸锂跌10000元/吨 世界今亮点
财经电报快讯 2023-02-23
-
面包车是什么
互联网 2023-02-23
-
瑞昱网卡驱动,Realtek RTL8139810x Fast Ethernet Adapter PCI网卡驱动
互联网 2023-02-23
-
当前聚焦:2023年广东怎么干?省政府工作报告工作任务分工方案来了!
南方网 2023-02-23
-
山东财政助力实体经济融资降本增效|全球微速讯
央广网 2023-02-23
-
杭州“粉发女孩”离世 揪出网暴幕后黑手到底有多难?
湖南日报 2023-02-23
-
冯巩再喊“想死你们了” 一句话引来一波回忆杀!!
互联网 2023-02-23
-
效力湖人正负值-255!威少真能帮助快船?队记:三大优势完胜沃尔
罗说篮球 2023-02-22
-
百名“工匠”同台比拼安全技能 湖北省第一届“宜荆荆恩”安全技能竞赛在宜昌成功举办
湖北省应急管理厅 2023-02-22
-
宁德时代对“锂矿返利”缄默不言 变相促销还是看空锂价?_环球快看
证券日报 2023-02-22
-
《金爸银爸不换我爸》开播,范明林永健主演,徐冬冬青涩出演-今日热搜
马庆云 2023-02-22
-
环球热头条丨金乡税务:便民春风常吹 “非常满意”长在
闪电新闻 2023-02-22
-
千教网官网感恩教育_千教网官网
互联网 2023-02-22
-
买车的再等等,五菱新车将上市,大四座设计,车内自带双人床|环球速讯
侃车客栈 2023-02-22