发布日期:2025-01-02 01:55 点击次数:144
作家:AI畴昔指北av 国产
封面图:豆包
“我别传o2在GPQA上得到了105%。(i have o2 gets 105% on GPQA)”几天前,山姆·奥特曼在X平台上倏得发了这样一句话,但速即又写谈,“见鬼!账号空幻!”
GPQA(通用问答)测试模子的问答才调。这个测试包含了各式类型的问题,从事实性问题到逻辑推理问题,旨在评估模子的常识储备、交融才调以及推理和生成准确回应的才调。GPQA的发达不错自大出模子在处理各式问答任务时的准确性和可靠性。
要知谈,博士级东谈主类在GPQA的准确率平均唯有65%,非群众级的平常东谈主仅有34%。而OpenAI在9月发布的o1模子的测试数据也唯有78%。
如若o2真能达到105%照实异常恐怖,也曾恐怖的多出了5%
张开剩余81%就好像,你要能在满分100的试卷中考出105分,敦朴见你齐得鞠一躬然后走到了杂物间~~
这位掌控OpenAI公司的CEO,就这样以如斯戏剧性的打趣容颜裸露了OpenAI o2的进展。
一、要不要抄功课?
摆在国内大模子创业者眼前的选拔题就是,要不要抄功课?
前段时分,零一万物独创东谈主兼CEO李开复去了一回硅谷,带回不少OpenAI的“清新八卦”,还在直播间进行请问,据他所述,外界期待已久的GPT-5磨练得不太告成,问题出在怎样贬责一个“十万卡集群”上。征象面世的OpenAI o1只是被临时祭出的产物,这套步调本来没缠绵这样早公开。OpenAI的里面东谈主员对李开复说,“其实咱们还有好多好东西,只是莫得发布,因为咱们一发布你们就会学。”
9月13日,OpenAI发布o1大模子,到刻下只是当年2个月,国内大模子畛域还莫得复刻出o1一星半点,刻下又被一句“戏言”打的毫无还手之力。
智谱AI、百川智能、月之暗面、Minimax、零一万物、阶跃星辰这六家中国大模子初创公司,被业界冠以“六小虎”之称。在当年的一年中,他们齐拿到了数十亿乃至百亿东谈主民币级别的融资,齐在烧钱抢算力、抢东谈主才,齐但愿成为中国的“OpenAI”。
大模子“六小虎”的称呼,让笔者念念起昔日的“AI四小龙”,分辨是商汤、旷视、云从与依图科技。缺憾的是,道尽途穷。
遥念念当年,顶着AI四小龙称呼,吸睛大宗,融资一轮高过一轮。时于本日,仍然难以已毕盈利,握续性的耗损依然是最大的争议点之一,也自大出AI营业落地举步维艰。
二、谁又能跟住脚步?
非论是科技巨头照旧初创企业,发展AI大模子齐离不开英伟达的高性能芯片。不错说,谁家AI大模子实力强,背后比拼的其实是领有些许张英伟达的卡。科技巨头们如谷歌、meta等不吝参加数百亿好意思元购买并囤积英伟达芯片,以擢升其AI才调。
以零一万物为例,10月16日上昼,零一万物独创东谈主李开复,告示推出新的旗舰预磨练模子Yi-Lightning“闪电模子”。并暗示,这次预磨练零一万物用了2000张GPU,磨练了一个半月,耗尽了300多万好意思元,但成本约为Grok的1%-2%。
9月初,马斯克倏得告示在短短122天内建成10万张英伟达H100显卡的Colossus集群,意味着其算力可能也曾进步OpenAI。
9 月 6 日音书,在 2024 REAL科技大会上,商汤数字娱乐行状部总司理栾青先容称,刻下商汤投建的东谈主工智能算力集群已领有 5.4 万张 GPU,最高算力达 2 万 P。
由显卡限度撑起的算力水平,是决定大模子性能的最紧迫主意之一。一般觉得,1万枚英伟达A100芯片,是作念好AI大模子的算力门槛,一张英伟达H100显卡单价约在25万东谈主民币把握,单是GPU的采购成本就高达几十亿,还不算上运维、时代、网罗传输等其他成本,其“烧钱”进度可念念而知。
三、怎样赢利,仍是难题
2018年,中国AI畛域共融资2373亿元,2021年共融资3996亿元,2022年共融资1579亿元,同比下滑64%,2023年不绝下滑至1101亿元。
泰国人妖和融资热度下滑同期出现的,还有外部环境的变化。在此之前,AI畛域的融资以好意思元投资机构为主,外部成本垂青前沿时代,也慷慨为初创公司早期的高额研发买单。但2021年,好意思国加大对中国科技公司的制裁力度,好意思元机构络续退出。
行为上市公司的商汤科技,和全球大部分AI公司一样,齐还处于耗损阶段,现如今商汤濒临营业化落地和保握时代率先的双重进修,念念要扭亏,需要一边扩大收入,一边缩小成本。这亦然统统国内AI公司要濒临的问题。
在AI大模子的营业化谈路上,To B或To C的不不异子,照实事关居品的闹热或靡烂,刻下AI公司营业模式,刻下相比流行的有几种:
一、ToB模式:软件销售、时代就业、智能居品、行业解决决策等
每个企业齐已毕欢欣独到的、定制化的需求,而不是单向给与程序化的居品。也就是需要深度学习行业才调,定制意味着更高的成本参加,不仅如斯,数据金钱的明锐性也组成了企业和模子厂商的隔膜。
B端商场更多是定制化的请托技俩,短期内很难成绩限度化效益,
二、ToC模式:程序化居品
To C最彰着的上风就是,12亿互联网用户,后劲庞杂,变现困难。智普清言、百小应、kimi、通义千问等C端对话大模子齐是免费使用,企业一方面在烧钱投流找用户,另一方面磨练模子的成本还在不断攀升。
不外,据「AI畴昔指北」了解到,在AI业内有一个共鸣,创业公司在C端更容易找到契机,而互联网大厂则更能通过B端得到限度上风。
通盘AI大模子初创公司的的营业化旅途很顺利,是以公共会连忙进入赤裸裸的拼刺刀的阶段。
投资方或者商场对这些公司期待,就是每季度或者半年内,必须拿出新的居品或令东谈主服气的成绩,比如时代立异、用户增长、营收、行业影响力等。这亦然开阔大模子独角兽握续活跃的一个主因。
转头:
在AI大模子这条赛谈上,理念念丰润,施行泼辣,其诳骗落地是中枢,大致塌实肃肃促进大模子发展与营业化后果逶迤av 国产,才是AI大模子的前程。
发布于:北京市