93读书

手机浏览器扫描二维码访问

本站广告仅展示一次,尽可能不去影响用户体验,为了生存请广大读者理解

通用大模型的技术迭代与竞争格局(第2页)

小主,这个章节后面还有哦,请点击下一页继续阅读,后面更精彩!

- 语言理解:比如中文能力测评集CLUE,考的是模型能不能读懂中文文章、理解成语、分析句子逻辑;

- 逻辑推理:比如数学推理测评集GSM8K,考的是模型能不能解数学题、做逻辑判断;

- 多模态交互:比如文本生成图像测评集MS-COCO,考的是模型能不能根据文字描述生成对应的图像。

“场景化测试”就像“职业技能考试”,考的是大模型在具体场景里的“专业能力”,比如:

- 代码生成:用测评集HumanEval评估模型能不能写代码、找bug;

- 文案创作:评估模型生成的营销文案、广告脚本,能不能提高产品转化率。

从测评结果来看,不同模型各有胜负,没有“全能冠军”:

- GPT-4:在多模态交互和复杂逻辑推理上领先,比如在GSM8K数学推理测评中,准确率超过92%,能解很多高中甚至大学的数学题;根据文字生成图像时,也能更精准地还原描述(比如“一只穿着红色外套的兔子在雪地里堆雪人”,生成的图像细节更到位);

- 文心一言:在中文文本生成和知识问答上表现优异,在CLUE测评中,中文理解准确率超过88%,比如写中文古诗、解读中文历史文献,比国外模型更准确;

- 通义千问:在商业场景应用中更有优势,比如生成电商营销文案时,转化率比其他模型高15%-20%——同样是写“连衣裙”的文案,它写的文案能让更多用户下单。

所以,选通用大模型不能只看“排名”,还要看“场景匹配度”:做数学推理、多模态创作,选GPT-4可能更好;做中文内容、知识问答,选文心一言更合适;做电商、商业文案,通义千问可能是更优解。

二、核心优化方向:效率、多模态、轻量化,让大模型“好用又便宜”

现在的通用大模型虽然能力强,但有两个大问题:一是“太贵”,训练一次要花几千万甚至几亿美元,普通企业用不起;二是“太笨重”,只能在云端的超级计算机上运行,手机、工业设备这些终端用不了。为了解决这些问题,行业把“效率提升”“多模态融合”“轻量化”定为三大核心优化方向——目标就是让大模型“成本更低、能力更强、应用更广”,从“高成本研发”走向“低成本落地”。

1. 效率提升:“又快又省”,训练和推理双管齐下

效率提升主要针对两个环节:“训练效率”和“推理效率”。“训练效率”是指“怎么用更少的时间、更少的算力,把大模型训练出来”;“推理效率”是指“怎么让训练好的模型,更快地响应用户需求”。

先看“训练效率”,现在主要靠两种技术优化:

- 并行计算:比如“模型并行”“数据并行”——简单说就是把大模型拆成多个部分,让多台计算机一起训练;或者把训练数据分成多份,让多台计算机同时处理。比如某团队通过优化训练框架,把千亿参数模型的训练时间从30天缩短到15天,直接省了一半时间;

- 混合精度训练:以前训练模型用的是FP32精度(32位浮点数),数据存储和计算量都很大。现在改用FP16、BF16精度(16位浮点数),在不影响模型性能的前提下,把算力消耗减少一半,训练成本也跟着降下来。

再看“推理效率”,核心是让模型“响应更快”——比如用户输入“写一篇关于春天的散文”,模型能更快地生成内容,而不是让用户等半天。现在主要靠两种技术:

热门小说推荐
穿越长姐持家

穿越长姐持家

《穿越长姐持家》作者:天麻虫草花文案:人家一二三四五,上山打老虎,养家糊口有钱赚,我家一二三四五,嗷嗷待哺没饭吃,面黄肌瘦瘦巴巴。柳义雨一朝穿越,穿越到战火年代,一路逃到山沟村,爷爷、小叔饿死,他奶疯癫,爹爹战死,小婶子病死,自家亲娘体弱,柳义雨望着这一大家子的老弱妇孺,排排站张口吃饭,无语望天,且看柳义雨在这贫穷时代,混的风生水起,弄...

退下,让朕来

退下,让朕来

沈棠在发配路上醒来,发现这个世界很不科学。天降神石,百国相争。文凝文心,出口成真。武聚武胆,劈山断海。她以为的小白脸,一句“横枪跃马”,下一秒甲胄附身,长枪在手,一人成军,千军万马能杀个七进七出!她眼里的痨病鬼,口念“星罗棋布”,苍天如圆盖,陆地似棋局,排兵布阵,信手拈来!这TM都不能算不科学了!分明是科学的棺材板......

海贼之最强剑豪

海贼之最强剑豪

穿越海贼王世界,别人都去做海贼、七武海甚至海军大将了,为毛我却变成了一个鱼人!还好我有最强剑豪系统。它能为我提供大千世界的名刀名剑。雪走、秋水、大黑刀夜、铁碎牙、流刃若火……它还能...

狼窝(NPH)

狼窝(NPH)

n剧情甜宠炖肥肉大概就是一朵柔嫩鲜美的小花花在一个个狼窝里滚来滚去的无节操故事。我们的口号是:摧残蹂躏,吃干抹净!??????作者微博:麻圆红豆饼(点击名字可直接进入)每天两更珍珠每满100加一更求收藏求多多留言求给蠢作者投喂珍珠(星星眼)?...

热吻小玫瑰

热吻小玫瑰

【1】 江家和季家是世交,传统世家首提门当户对。接了媒妁之言的两个人,猝不及防地被安排了同居。 相处了一段时日,江母忧心忡忡拉过江寂,问他到底怎么想的。江寂冷眸微垂,淡淡道:“不来电。” 听了江寂的表态,季明珠四处放话:“江寂这么无趣,谁要跟他来电。” 可后来—— 江寂单手扯开领带,反剪住她纤细白嫩的手腕,顺势拍了拍她的脸蛋儿,挑眉道,“还无趣吗?” 季明珠欲哭无泪:“有趣有趣有趣!您最有趣!” 【2】 强扭的瓜终究是不甜,双方长辈看两人实在没有感觉,特意登门通知。 然而刚踏入玄关,就看到季明珠穿着宽大及膝的衬衫,揉着眼睛打呵欠。而那个冰冰冷冷的少爷,正从她的房间里走出来。 长辈:......... 这是不来电? 神特么不来电:) 【3】 微博知名vlog博主Pearl以百变风格和清奇剪辑走红于网络,视频播放量日常稳居榜首。 为了回馈粉丝的支持,她在家中开了直播,“我风格一直很多样,之后还会尝试更多~” 话音刚落,直播画面里出现一位清冷矜贵的男人,手里拿着小猫耳朵的发箍。 “多样?那怎么不愿意戴这个。” 弹幕:等等......这人好特么眼熟! 随后,热搜炸了—— 【江氏集团:介绍一下,这是我的掌上明珠@Pearl】 ◎江寂清冷似玉,冰颜如霜。全身上下唯一捂热的那处心窝,满满的都是她。 /带我亲爱的小玫瑰,沉溺在这无边热吻里/ /也最爱你,如莺歌啼/ 【风情万种娇娇女X善于隐藏占有欲极强冰山男】 【食葱指南】:双c双初/千苏万苏杰克苏/勿细揪~ 推荐松松的绝世好文,搜索去看哇!《穿成反派的病美人妹妹》by雾下菘~...

从废柴到武尊

从废柴到武尊

从废柴到武尊情节跌宕起伏、扣人心弦,是一本情节与文笔俱佳的玄幻魔法小说,从废柴到武尊-小俊爱汤圆-小说旗免费提供从废柴到武尊最新清爽干净的文字章节在线阅读和TXT下载。...