白酒一线销售的一年:有“黄牛”退场,有代理商破局 830.26M2024-01-23
巴彦淖尔市临河区一平房发生爆炸倒塌,4人受伤 753.89M2024-01-24
和流感相似?人偏肺病毒感染逐渐增多,普遍易感 198.59M2024-01-25
AI大模型时代:多元算力如何打破碎片化困局? 623.83M2024-02-01
OpenAI官宣计划成立更传统营利性公司 76M2024-02-21
虎牙女王盐抢先试玩《大圣归来》,受邀专访制作人揭秘好料 193.54M2024-04-07
☘️人心挺好☘️pg网赌软件下载APP下载【首存送彩金☘️💰】🔥支持:64/128bit🔥系统类型:pg网赌软件下载官方网站-App下载(2024全站)最新版本IOS/安卓通用版V.5.5.9.5支持winall/win7/win10/win11🎁☘️安全平台☘️【下载次数937756】APP,现在下载,新用户还送新人礼包是一款提供保险缴费、理赔等服务的掌上保险app应用。可以在线办理各项保险业务,咨询保险相关事宜,在家自助完成保险续保等业务操作。是您贴心的私人保险管家!
⚡️☘️⚡️①通过浏览器下载
打开“pg网赌软件下载”手机浏览器(例如百度浏览器)。在搜索框中输入您想要下载的应用的全名,点击下载链接【mobile.xzczwl.cn】网址,下载完成后点击“允许安装”。
⚡️☘️⚡️②使用自带的软件商店
打开“pg网赌软件下载”的手机自带的“软件商店”(也叫应用商店)。在推荐中选择您想要下载的软件,或者使用搜索功能找到您需要的应用。点击“安装”即可开始下载和安装。
⚡️☘️⚡️③使用下载资源
有时您可以从“pg网赌软件下载”其他人那里获取已经下载好的应用资源。使用类似百度网盘的工具下载资源。下载完成后,进行安全扫描以确保没有携带不安全病毒,然后点击安装。
💿【恭喜发财大哥们】🥇💿【pg网赌软件下载】⚡️☁️️⚡️支持:32/64bit⚡️系统类型:pg网赌软件下载(官方)官方网站IOS/Android通用版/手机APP(2024APP下载)《pg网赌软件下载》是一款非常优质好用的小说阅读app,里面的小说资源十分丰富哦。
🥡[科普盘点]🥡【pg网赌软件下载】⚡️🚡⚡️支持:32/64bit⚡️系统类型:pg网赌软件下载(官方)官方网站IOS/Android通用版/手机APP(2024APP下载)《pg网赌软件下载》是一款功能齐全的手机视频软件,超多视频随你观看。
🗑爱拼才会赢🎁🗑【pg网赌软件下载】⚡️☀️️⚡️支持:32/64bit⚡️系统类型:pg网赌软件下载(官方)官方网站IOS/Android通用版/手机APP(2024APP下载)《pg网赌软件下载》是一款专注于商务沟通的免费邮箱,可以为个人和团队办公提供专业、多场景的商务沟通服务,满足您的日常沟通和各种办公需求,是您和团队的百宝箱,我们致力于构建集高效办公和日常通信于一体的邮箱,将工匠精神融入产品中,无论是日常沟通还是团队合作,都会给您最好的通信体验。
🚕🔥欢迎使用🚕【pg网赌软件下载】⚡️🗺️⚡️支持:32/64bit⚡️系统类型:pg网赌软件下载(官方)官方网站IOS/Android通用版/手机APP(2024APP下载)《pg网赌软件下载》是一款非常实用的手机垃圾清理软件应用程序。得益于360强大的后台引擎,它具有超清洁能力。同时,它还可以手动清洁、分类、qq和微信软件,使您的手机不再卡住,解放大量空间。
💻简介:💻【pg网赌软件下载】⚡️♌️️️⚡️支持:32/64bit⚡️系统类型:pg网赌软件下载(官方)官方网站IOS/Android通用版/手机APP(2024APP下载)《pg网赌软件下载》是一款非常好用的手机垃圾清理软件,用户可以在手机上清理非常好用的手机垃圾,让你的手机在这里更加流畅易用。有很多垃圾清理功能,可以帮你全面扫描手机。
🆕解答一下🆕【pg网赌软件下载】⚡️🎋️⚡️支持:32/64bit⚡️系统类型:pg网赌软件下载(官方)官方网站IOS/Android通用版/手机APP(2024APP下载)《pg网赌软件下载》是一款可以完全实现无纸化、网络化、自动化的在线学习考试系统,学生可以通过客户端领取和提交作业,也可以进行题库练习、视频学习,从而提高学生学习的自主性;是取代传统作业、考试的应用型软件,可以完全实现电脑自动化,对学校的信息化建设具有深远的现实意义和实用价值。
🌁🥇爱拼才会赢🥇🌁【pg网赌软件下载】⚡️🍶⚡️支持:32/64bit⚡️系统类型:pg网赌软件下载(官方)官方网站IOS/Android通用版/手机APP(2024APP下载)《pg网赌软件下载》是一款手机加速和空间清洁软件,使手机运行更加顺畅,一键清洁可以快速解决空间不足的问题。领先的毫秒加速技术,清洁效果超过50%的同行。超强的垃圾清理,让手机最大可扩容10,000张照片空间;贴心清理,聊陌陌、发密照,轻松清理。
🎿重大通报🎿【pg网赌软件下载】⚡️🥎⚡️支持:32/64bit⚡️系统类型:pg网赌软件下载(官方)官方网站IOS/Android通用版/手机APP(2024APP下载)《pg网赌软件下载》是是一款为学生和教育工作者设计的学习辅助工具,集成了课程管理、作业辅导和学习进度跟踪等功能。我们致力于提升学习效率和质量,通过个性化学习计划和实时反馈,帮助每一位用户实现学术和职业目标。
🥞首充即送!返利不限🥞【pg网赌软件下载】⚡️🛴️⚡️支持:32/64bit⚡️系统类型:pg网赌软件下载(官方)官方网站IOS/Android通用版/手机APP(2024APP下载)《pg网赌软件下载》是一款专业的金融客户端,可以在这里进行优秀的资本周转,其中贷款产品借花,快速下载体验携程金融,让您的旅行与众不同。
1.🈴了解游戏规则:在登录pg网赌软件下载应用程序之前,务必熟稔各类棋牌游戏之规则,例如斗地主、麻将以及德州扑克等。各款游戏皆具备其特定的玩法及策略,仅用深度理解规则方可在游戏中展现出色表现。可通过查阅专业文献、观看教学视频或与高手展开互动以提升自身的游戏素养。掌控规则乃迈向棋牌大师之路的关键步骤。
2.🈴选择适合自己的游戏:pg网赌软件下载囊括众多棋牌种类,诸如斗地主、德州扑克以及象棋等等,每款游戏独具特色且具备挑战性。在选择游戏中,需根据个人喜好与实际水平做出决策,避免盲目追随热门项目。新手上路不妨先从简易游戏着手锻炼,待技术日臻完善后,逐步挑战更高级别游戏,以适应各类复杂挑战。
3.🍾合理利用道具:在pg网赌软件下载应用平台上,各类道具频繁现身,例如,记牌仪、加倍卡及换牌符号等。这些装备能助玩家于游戏中获胜,然而,若使用失当,反而可能引发不利因素。故而,对待道具的使用须审慎思考,根据实际情况选择合适的使用时机与情境。适时运用恰当的道具,有助于提高效率,使玩家赢得更迅速。
4.🕋与他人交流互动:除自行训练外,在pg网赌软件下载上,用户有机会参与互动交流,进社区、邀好友,甚至参与线上赛,认识更多棋艺爱好者分享经验,从中汲取新知识补足自身不足。因此,与他人的沟通互动在提高棋艺方面发挥着不可忽视的作用。
【刚送完房产,逆水寒又花45万打造痛车******
说起游戏圈最豪横的游戏官方,那不少玩家的第一反应肯定都是古风武侠网游《逆水寒》,该官方频频靠着杭州拆迁户的名头,不断给玩家撒金送福利。
比如前段时间,逆水寒迎来四周年新资料片“雷霆觉醒”上线,就直接给玩家送出一套房。
这种骚操作在游戏圈内可谓是第一人,还公然表示如果中奖玩家选择折现,这套房下次还将继续抽!
这不,刚送完房产,逆水寒在周末又闲不住开始捣鼓起新活,竟然花了45万,打造了一款二次元痛车。
只见这款痛车上手绘了巨型的荒羽画像,各种对比度极高的颜色绘制在车身上,看起来十分亮眼。
不仅手绘了如此酷炫的车身,还制作了一期小视频,视频中的小哥手持油漆准备去画画,不料被人一撞把颜料泼在了车身上。于是一不做二不休,直接在车身上手绘出了超大篇幅的荒羽手绘图,让车主小姐姐都忍不住直呼画的好,加个微信吧!
虽然视频看起来有些“土味”,但是从正面看起来黑色的车身上荒羽的图案一出,黑皮与闪电共舞,着实是有些令人感到惊艳不已。
没想到为了逆水寒的新职业宣传,竟然花了如此大价钱整出这样极具冲击力的视觉震撼。
说起来近些年二次元痛车还真不少,虚拟的游戏角色搭配绮丽的色彩,让不少喜欢二次元的玩家有一种自己游走在现实世界和虚拟世界之中,自由切换平行宇宙的错觉,因此受到不少玩家的喜爱。
逆水寒大概就是抓住了大家的这一感受,推出了这款荒羽痛车。
而面对如此炫酷的荒羽痛车,不少玩家也是纷纷表示“太帅了”,有玩家表示“我油漆都准备好了,要去哪里泼呢?”。
还有不少玩家希望官方能够平衡一点,也给其他职业来一点这一的痛车系列。
除了整活新流派之外,逆水寒官方还决定对游戏的整体画质进行大幅升级。
最近它就公布了画质再升级的资讯,引起了很多人的关注。特别是其中一张屋顶的图片,片片砖瓦纹理分明,从中长出来的杂草活灵活现。
如果不是有逆水寒的LOGO在,是不是很多人都要以为,这是现实中哪座经历了多年风雨的老房子照片。
这也意味着,逆水寒实际真正较劲的对象变成了“黑神话:悟空”等世界范围内的3A大作。
不过市面上大部分的3A水准的游戏之所以都是单机,还是因为游戏体量有限,在箱庭式的游戏场景内更容易把画面做的精致。
而逆水寒中,却明显有着场景大小和复杂度都远超过单机很多倍的大地图。可见逆水寒要做出这样的表现力,是研发难度和工作量,都相当庞大的。程序员们在面对这样的挑战时,不知道又要掉多少根头发呢?
但是从逆水寒发布的几张实机截图来看,这样不惜人力财力去研发出来的场景,显然是非常有吸引力的。
鹅卵石上清晰可见的纹理,木质房梁的侵蚀感,无一不表明着,逆水寒的未来,是一款可能画质超越单机的网游。
江湖中的一切,看上去都是动态有生命力,会呼吸的江湖将越来越真实。
逆水寒也如它宣传的口号一样,将要一步步完成当年的初心。
【刷屏的DeepSeek******
每经记者 郑雨航 每经编辑 高涵 兰素英
“DeepSeek-V3超越了迄今为止所有开源模型。”这是国外独立评测机构Artificial Analysis测试了DeepSeek-V3后得出的结论。
12月26日,深度求索官方微信公众号推文称,旗下全新系列模型DeepSeek-V3首个版本上线并同步开源。
公众号推文是这样描述的:DeepSeek-V3为自研MoE模型,671B参数,激活37B,在14.8T token上进行了预训练。DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。
不过,广发证券发布的测试结果显示,DeepSeek-V3总体能力与其他大模型相当,但在逻辑推理和代码生成领域具有自身特点。
更重要的是,深度求索使用英伟达H800 GPU在短短两个月内就训练出了DeepSeek-V3,仅花费了约558万美元。其训练费用相比GPT-4等大模型要少得多,据外媒估计,Meta的大模型Llama-3.1的训练投资超过了5亿美元。
消息一出,引发了海外AI圈热议。OpenAI创始成员Karpathy甚至对此称赞道:“DeepSeek-V3让在有限算力预算上进行模型预训练这件事变得容易。DeepSeek-V3看起来比Llama-3-405B更强,训练消耗的算力却仅为后者的1/11。”
然而,在使用过程中,《每日经济新闻》记者发现,DeepSeek-V3竟然声称自己是ChatGPT。一时间,“DeepSeek-V3是否在使用ChatGPT输出内容进行训练”的质疑声四起。
对此,《每日经济新闻》记者采访了机器学习奠基人之一、美国人工智能促进会前主席Thomas G. Dietterich,他表示对全新的DeepSeek模型的细节还了解不够,无法给出确切的答案。“但从普遍情况来说,几乎所有的大模型都主要基于公开数据进行训练,因此没有特别需要合成的数据。这些模型都是通过仔细选择和清理训练数据(例如,专注于高质量来源的数据)来取得改进。”
每经记者向深度求索公司发出采访请求,截至发稿,尚未收到回复。
针对DeepSeek-V3,独立评测网站Artificial Anlaysis就关键指标——包括质量、价格、性能(每秒生成的Token数以及首个Token生成时间)、上下文窗口等多方面——与其他人工智能模型进行对比,最终得出以下结论。
质量:DeepSeek-V3质量高于平均水平,各项评估得出的质量指数为80。
价格:DeepSeek-V3比平均价格更便宜,每100万个Token的价格为0.48美元。其中,输入Token价格为每100万个Token 0.27美元,输出Token价格为每100万个Token1.10 美元。
速度:DeepSeek-V3比平均速度慢,其输出速度为每秒87.5个Token。
延迟:DeepSeek-V3与平均水平相比延迟更高,接收首个Token(即首字响应时间)需要1.14秒。
上下文窗口:DeepSeek-V3的上下文窗口比平均水平小,其上下文窗口为13万个Token。
最终Artificial Anlaysis得出结论:
“DeepSeek-V3模型超越了迄今为止发布的所有开放权重模型,并且击败了OpenAI的GPT-4o(8月),并接近Anthropic的Claude 3.5 Sonnet(10月)。
DeepSeek-V3的人工智能分析质量指数得分为80,领先于OpenAI的GPT-4o和Meta的Llama 3.3 70B等模型。目前唯一仍然领先于DeepSeek的模型是谷歌的Gemini 2.0 Flash和OpenAI的o1系列模型。领先于阿里巴巴的Qwen2.5 72B,DeepSeek现在是中国的AI领先者。”
12月29日广发证券计算机行业分析师发布研报称:“为了深入探索DeepSeek-V3的能力,我们采用了覆盖逻辑、数学、代码、文本等领域的多个问题对模型进行测试,将其生成结果与豆包、Kimi以及通义千问大模型生成的结果进行比较。”
测试结果显示,DeepSeek-V3总体能力与其他大模型相当,但在逻辑推理和代码生成领域具有自身特点。例如,在密文解码任务中,DeepSeek-V3是唯一给出正确答案的大模型;而在代码生成的任务中,DeepSeek-V3给出的代码注释、算法原理解释以及开发流程的指引是最为全面的。在文本生成和数学计算能力方面,DeepSeek-V3并未展现出明显优于其他大模型之处。
除了能力,DeepSeek-V3最让业内惊讶的是它的低价格和低成本。
《每日经济新闻》记者注意到,亚马逊Claude 3.5 Sonnet模型的API价格为每百万输入tokens 3美元、输出15美元。也就是说,即便是不按照优惠价格,DeepSeek-V3的使用费用也几乎是Claude 3.5 Sonnet的五十三分之一。
相对低廉的价格,得益于DeepSeek-V3的训练成本控制,深度求索在短短两个月内使用英伟达H800 GPU数据中心就训练出了DeepSeek-V3模型,花费了约558万美元。其训练费用相比OpenAI的GPT-4等目前全球主流的大模型要少得多,据外媒估计,Meta的大模型Llama-3.1的训练投资超过了5亿美元。
DeepSeek“AI界拼多多”也由此得名。
DeepSeek-V3通过数据与算法层面的优化,大幅提升算力利用效率,实现了协同效应。在大规模MoE模型的训练中,DeepSeek-V3采用了高效的负载均衡策略、FP8混合精度训练框架以及通信优化等一系列优化措施,显著降低了训练成本,以及通过优化MoE专家调度、引入冗余专家策略、以及通过长上下文蒸馏提升推理性能。这证明,模型效果不仅依赖于算力投入,即使在硬件资源有限的情况下,依托数据与算法层面的优化创新,仍然可以高效利用算力,实现较好的模型效果。
广发证券分析称,DeepSeek-V3算力成本降低的原因有两点。
第一,DeepSeek-V3采用的DeepSeekMoE是通过参考了各类训练方法后优化得到的,避开了行业内AI大模型训练过程中的各类问题。
第二,DeepSeek-V3采用的MLA架构可以降低推理过程中的kv缓存开销,其训练方法在特定方向的选择也使得其算力成本有所降低。
科技媒体Maginative的创始人兼主编Chris McKay对此评论称,对于人工智能行业来说,DeepSeek-V3代表了一种潜在的范式转变,即大型语言模型的开发方式。这一成就表明,通过巧妙的工程和高效的训练方法,可能无需以前认为必需的庞大计算资源,就能实现人工智能的前沿能力。
他还表示,DeepSeek-V3的成功可能会促使人们重新评估人工智能模型开发的既定方法。随着开源模型与闭源模型之间的差距不断缩小,公司可能需要在一个竞争日益激烈的市场中重新评估他们的策略和价值主张。
不过,广发证券分析师认为,算力依然是推动大模型发展的核心驱动力。DeepSeek-V3的技术路线得到充分验证后,有望驱动相关AI应用的快速发展,应用推理驱动算力需求增长的因素也有望得到增强。尤其在实际应用中,推理过程涉及到对大量实时数据的快速处理和决策,仍然需要强大的算力支持。
在DeepSeek-V3刷屏之际,有一个bug也引发热议。
在试用DeepSeek-V3过程中,《每日经济新闻》记者在对话框中询问“你是什么模型”时,它给出了一个令人诧异的回答:“我是一个名为ChatGPT的AI语言模型,由OpenAl开发。”此外,它还补充说明,该模型是“基于GPT-4架构”。
国内外很多用户也都反映了这一现象。而且,12月27日,Sam Altman发了一个帖文,外媒指出,Altman这篇推文意在暗讽其竞争对手对OpenAI数据的挖掘。
于是,有人就开始质疑:DeepSeek-V3是否是在ChatGPT的输出基础上训练的?为此,《每日经济新闻》向深度求索发出采访请求。截至发稿,尚未收到回复。
针对这种情况产生的原因,每经记者采访了机器学习奠基人之一、美国人工智能促进会前主席Thomas G. Dietterich,他表示,他对全新的DeepSeek模型的细节还了解不够,无法给出确切的答案。“但从普遍情况来说,几乎所有的大模型都主要基于公开数据进行训练,因此没有特别需要合成的数据。这些模型都是通过仔细选择和清理训练数据(例如,专注于高质量来源的数据)来取得了改进。”
TechCrunch则猜测称,深度求索可能用了包含GPT-4通过ChatGPT生成的文本的公共数据集。“如果DeepSeek-V3是用这些数据进行训练的,那么该模型可能已经记住了GPT-4的一些输出,现在正在逐字反刍它们。”
“显然,该模型(DeepSeek-V3)可能在某些时候看到了ChatGPT的原始反应,但目前尚不清楚从哪里看到的,”伦敦国王学院专门研究人工智能的研究员Mike Cook也指出,“这也可能是个‘意外’。”他进一步解释称,根据竞争对手AI系统输出训练模型的做法可能对模型质量产生“非常糟糕”的影响,因为它可能导致幻觉和误导性答案。
不过,DeepSeek-V3也并非是第一个错误识别自己的模型,谷歌的Gemini等有时也会声称是竞争模型。例如,Gemini在普通话提示下称自己是百度的文心一言聊天机器人。
造成这种情况的原因可能在于,AI公司在互联网上获取大量训练数据,但是,现如今的互联网本就充斥着各种各样用AI生产出来的数据。据外媒估计,到2026年,90%的互联网数据将由AI生成。这种 “污染” 使得从训练数据集中彻底过滤AI输出变得相当困难。
“互联网数据现在充斥着AI输出,”非营利组织AI Now Institute的首席AI科学家Khlaaf表示,基于此,如果DeepSeek部分使用了OpenAI模型进行提炼数据,也不足为奇。
】【刷屏的DeepSeek******
每经记者 郑雨航 每经编辑 高涵 兰素英
“DeepSeek-V3超越了迄今为止所有开源模型。”这是国外独立评测机构Artificial Analysis测试了DeepSeek-V3后得出的结论。
12月26日,深度求索官方微信公众号推文称,旗下全新系列模型DeepSeek-V3首个版本上线并同步开源。
公众号推文是这样描述的:DeepSeek-V3为自研MoE模型,671B参数,激活37B,在14.8T token上进行了预训练。DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。
不过,广发证券发布的测试结果显示,DeepSeek-V3总体能力与其他大模型相当,但在逻辑推理和代码生成领域具有自身特点。
更重要的是,深度求索使用英伟达H800 GPU在短短两个月内就训练出了DeepSeek-V3,仅花费了约558万美元。其训练费用相比GPT-4等大模型要少得多,据外媒估计,Meta的大模型Llama-3.1的训练投资超过了5亿美元。
消息一出,引发了海外AI圈热议。OpenAI创始成员Karpathy甚至对此称赞道:“DeepSeek-V3让在有限算力预算上进行模型预训练这件事变得容易。DeepSeek-V3看起来比Llama-3-405B更强,训练消耗的算力却仅为后者的1/11。”
然而,在使用过程中,《每日经济新闻》记者发现,DeepSeek-V3竟然声称自己是ChatGPT。一时间,“DeepSeek-V3是否在使用ChatGPT输出内容进行训练”的质疑声四起。
对此,《每日经济新闻》记者采访了机器学习奠基人之一、美国人工智能促进会前主席Thomas G. Dietterich,他表示对全新的DeepSeek模型的细节还了解不够,无法给出确切的答案。“但从普遍情况来说,几乎所有的大模型都主要基于公开数据进行训练,因此没有特别需要合成的数据。这些模型都是通过仔细选择和清理训练数据(例如,专注于高质量来源的数据)来取得改进。”
每经记者向深度求索公司发出采访请求,截至发稿,尚未收到回复。
针对DeepSeek-V3,独立评测网站Artificial Anlaysis就关键指标——包括质量、价格、性能(每秒生成的Token数以及首个Token生成时间)、上下文窗口等多方面——与其他人工智能模型进行对比,最终得出以下结论。
质量:DeepSeek-V3质量高于平均水平,各项评估得出的质量指数为80。
价格:DeepSeek-V3比平均价格更便宜,每100万个Token的价格为0.48美元。其中,输入Token价格为每100万个Token 0.27美元,输出Token价格为每100万个Token1.10 美元。
速度:DeepSeek-V3比平均速度慢,其输出速度为每秒87.5个Token。
延迟:DeepSeek-V3与平均水平相比延迟更高,接收首个Token(即首字响应时间)需要1.14秒。
上下文窗口:DeepSeek-V3的上下文窗口比平均水平小,其上下文窗口为13万个Token。
最终Artificial Anlaysis得出结论:
“DeepSeek-V3模型超越了迄今为止发布的所有开放权重模型,并且击败了OpenAI的GPT-4o(8月),并接近Anthropic的Claude 3.5 Sonnet(10月)。
DeepSeek-V3的人工智能分析质量指数得分为80,领先于OpenAI的GPT-4o和Meta的Llama 3.3 70B等模型。目前唯一仍然领先于DeepSeek的模型是谷歌的Gemini 2.0 Flash和OpenAI的o1系列模型。领先于阿里巴巴的Qwen2.5 72B,DeepSeek现在是中国的AI领先者。”
12月29日广发证券计算机行业分析师发布研报称:“为了深入探索DeepSeek-V3的能力,我们采用了覆盖逻辑、数学、代码、文本等领域的多个问题对模型进行测试,将其生成结果与豆包、Kimi以及通义千问大模型生成的结果进行比较。”
测试结果显示,DeepSeek-V3总体能力与其他大模型相当,但在逻辑推理和代码生成领域具有自身特点。例如,在密文解码任务中,DeepSeek-V3是唯一给出正确答案的大模型;而在代码生成的任务中,DeepSeek-V3给出的代码注释、算法原理解释以及开发流程的指引是最为全面的。在文本生成和数学计算能力方面,DeepSeek-V3并未展现出明显优于其他大模型之处。
除了能力,DeepSeek-V3最让业内惊讶的是它的低价格和低成本。
《每日经济新闻》记者注意到,亚马逊Claude 3.5 Sonnet模型的API价格为每百万输入tokens 3美元、输出15美元。也就是说,即便是不按照优惠价格,DeepSeek-V3的使用费用也几乎是Claude 3.5 Sonnet的五十三分之一。
相对低廉的价格,得益于DeepSeek-V3的训练成本控制,深度求索在短短两个月内使用英伟达H800 GPU数据中心就训练出了DeepSeek-V3模型,花费了约558万美元。其训练费用相比OpenAI的GPT-4等目前全球主流的大模型要少得多,据外媒估计,Meta的大模型Llama-3.1的训练投资超过了5亿美元。
DeepSeek“AI界拼多多”也由此得名。
DeepSeek-V3通过数据与算法层面的优化,大幅提升算力利用效率,实现了协同效应。在大规模MoE模型的训练中,DeepSeek-V3采用了高效的负载均衡策略、FP8混合精度训练框架以及通信优化等一系列优化措施,显著降低了训练成本,以及通过优化MoE专家调度、引入冗余专家策略、以及通过长上下文蒸馏提升推理性能。这证明,模型效果不仅依赖于算力投入,即使在硬件资源有限的情况下,依托数据与算法层面的优化创新,仍然可以高效利用算力,实现较好的模型效果。
广发证券分析称,DeepSeek-V3算力成本降低的原因有两点。
第一,DeepSeek-V3采用的DeepSeekMoE是通过参考了各类训练方法后优化得到的,避开了行业内AI大模型训练过程中的各类问题。
第二,DeepSeek-V3采用的MLA架构可以降低推理过程中的kv缓存开销,其训练方法在特定方向的选择也使得其算力成本有所降低。
科技媒体Maginative的创始人兼主编Chris McKay对此评论称,对于人工智能行业来说,DeepSeek-V3代表了一种潜在的范式转变,即大型语言模型的开发方式。这一成就表明,通过巧妙的工程和高效的训练方法,可能无需以前认为必需的庞大计算资源,就能实现人工智能的前沿能力。
他还表示,DeepSeek-V3的成功可能会促使人们重新评估人工智能模型开发的既定方法。随着开源模型与闭源模型之间的差距不断缩小,公司可能需要在一个竞争日益激烈的市场中重新评估他们的策略和价值主张。
不过,广发证券分析师认为,算力依然是推动大模型发展的核心驱动力。DeepSeek-V3的技术路线得到充分验证后,有望驱动相关AI应用的快速发展,应用推理驱动算力需求增长的因素也有望得到增强。尤其在实际应用中,推理过程涉及到对大量实时数据的快速处理和决策,仍然需要强大的算力支持。
在DeepSeek-V3刷屏之际,有一个bug也引发热议。
在试用DeepSeek-V3过程中,《每日经济新闻》记者在对话框中询问“你是什么模型”时,它给出了一个令人诧异的回答:“我是一个名为ChatGPT的AI语言模型,由OpenAl开发。”此外,它还补充说明,该模型是“基于GPT-4架构”。
国内外很多用户也都反映了这一现象。而且,12月27日,Sam Altman发了一个帖文,外媒指出,Altman这篇推文意在暗讽其竞争对手对OpenAI数据的挖掘。
于是,有人就开始质疑:DeepSeek-V3是否是在ChatGPT的输出基础上训练的?为此,《每日经济新闻》向深度求索发出采访请求。截至发稿,尚未收到回复。
针对这种情况产生的原因,每经记者采访了机器学习奠基人之一、美国人工智能促进会前主席Thomas G. Dietterich,他表示,他对全新的DeepSeek模型的细节还了解不够,无法给出确切的答案。“但从普遍情况来说,几乎所有的大模型都主要基于公开数据进行训练,因此没有特别需要合成的数据。这些模型都是通过仔细选择和清理训练数据(例如,专注于高质量来源的数据)来取得了改进。”
TechCrunch则猜测称,深度求索可能用了包含GPT-4通过ChatGPT生成的文本的公共数据集。“如果DeepSeek-V3是用这些数据进行训练的,那么该模型可能已经记住了GPT-4的一些输出,现在正在逐字反刍它们。”
“显然,该模型(DeepSeek-V3)可能在某些时候看到了ChatGPT的原始反应,但目前尚不清楚从哪里看到的,”伦敦国王学院专门研究人工智能的研究员Mike Cook也指出,“这也可能是个‘意外’。”他进一步解释称,根据竞争对手AI系统输出训练模型的做法可能对模型质量产生“非常糟糕”的影响,因为它可能导致幻觉和误导性答案。
不过,DeepSeek-V3也并非是第一个错误识别自己的模型,谷歌的Gemini等有时也会声称是竞争模型。例如,Gemini在普通话提示下称自己是百度的文心一言聊天机器人。
造成这种情况的原因可能在于,AI公司在互联网上获取大量训练数据,但是,现如今的互联网本就充斥着各种各样用AI生产出来的数据。据外媒估计,到2026年,90%的互联网数据将由AI生成。这种 “污染” 使得从训练数据集中彻底过滤AI输出变得相当困难。
“互联网数据现在充斥着AI输出,”非营利组织AI Now Institute的首席AI科学家Khlaaf表示,基于此,如果DeepSeek部分使用了OpenAI模型进行提炼数据,也不足为奇。
】【决战侏罗纪《巨兽战场》燃战开测 巨兽来袭!******
侏罗纪题材全新巨兽级策略手游《巨兽战场》删档测试,将于5月25日10:00震撼开启!宏大的巨兽战场,各方势力为了争夺巨兽和珍稀资源,展开了一场斗智斗勇的策略较量。谁将带领“巨兽军队”成为霸主?一切马上揭晓!
【史诗燃战侏罗纪,巨兽级SLG燃爆指尖】
作为一款侏罗纪题材的全新巨兽级SLG策略手游,《巨兽战场》打造了一个史诗宏大的奇幻世界。茂密的丛林中,潜伏着凶恶的扎卡叛军以及庞大的史前巨兽,他们将成为玩家探宝路上的拦路虎。而你要做的就是组成自己的巨兽军队,突破重重难关,击败他们赢取资源,壮大自己的力量,并与诸多玩家展开策略对抗,傲视巨兽战场!
在这里,你将与上百种史前巨兽相遇,科幻电影中才会出现的角龙、暴龙、长颈龙都会一一登场,并成为你麾下的一员大将。巨兽们特征各异,拥有不同的属性及技能,暴虐扫尾让人心悸胆寒,钢拳跃击气势震天……它们强强联合,将成为战场上的杀敌强手!而玩家作为巨兽军队的领袖,除了拥有巨兽们的“生杀大权”,还可以对巨兽进行培养,巨兽吞噬完成星级晋升、喂养兽食提升等级……多种方式帮你升级巨兽实力!除此之外,在科技改造下,巨兽也会全副武装,铠甲、巨炮全部配备,显示出现代科技与远古巨兽联动的魅力!
《巨兽战场》提供了一个与众不同的全新巨兽世界,为玩家带来堪比科幻大片的巨兽级SLG体验。掌上决战侏罗纪,你不心动吗?
【联合巨兽策略远征,智慧和实力双重较量】
除了与巨兽沉浸式交互,玩家还可以在《巨兽战场》中体验到多元玩法。在游戏中,每位玩家都拥有充满科技感的军事营地,在这里可以训练军队、生产资源等等,为你的策略远征提供后勤保障。值得一提的是,你的营地面积可以通过探索迷雾区域不断扩张,而探索的过程也是一段冒险的旅程,你将邂逅新巨兽、新宝藏,新鲜感也将不断产生。
与此同时,SLG玩法也将贯穿于你的探索全过程。遇到扎卡叛军怎么办?遇到巨兽怎么办?这时你倾力打造的巨兽军队就可以重磅出击啦!远程兵营中,榴弹兵、穿甲火箭兵、迫击炮兵等随时待命;近战兵营中,亚马逊先锋、丛林游击兵等蓄势待发……现代科技的强大攻击力会在战场上展现的淋漓尽致。
而巨兽也有不同属性,【领主】可增强全体士兵,【打野】适合在大地图打怪,【坦克】是前排扛伤利器……每个巨兽会拥有12种属性中的4种,选择哪位巨兽随你出征要根据情况而定。多元化的人类军队与属性各异的巨兽相互搭配衍生出了诸多策略,个中奥妙还需要玩家到游戏中亲自体会。
此外,“巨兽军队”的排兵布阵也是一门学问,比如在人类军队中,近战兵种适合前排冲锋陷阵,而远程兵种适合后排输出,提供火力支援;在巨兽中,【坦克】是当仁不让的前排肉盾,而【输出】则在后排扛起输出大旗。合理的安排站位,才是克敌制胜的重要法宝。。
为了让玩家充分体验游戏的策略性,《巨兽战场》提供了PVE和PVP两种战斗模式,打怪、真人PK应有尽有。考验智慧与实力的对决一触即发,赶紧来加入吧!
史前巨兽与现代科技联动来一场超级战争是什么体验?让侏罗纪题材全新巨兽级策略手游《巨兽战场》来告诉你!5月25日10:00,《巨兽战场》删档测试燃战开启,史前巨兽全力出击,准备好迎接挑战吧!更多游戏详情请关注微信公众号:巨兽战场(jszc3k),这里有最新消息哦~
关于《巨兽战场》:
在神秘的未来世界里,一场人类与巨兽的科幻大战争即将开启。
在这里,巨兽不再只是游戏的局部点缀,而是全新策略玩法的趣味原点!独创巨兽培养策略系统,不但能接触到上百种远古恐龙,更可以在大地图上捕捉它们,培养自己的专属巨兽队伍。
还有基地开发、巨兽培养、巨兽改造、科学研发、阵容搭配等创新策略玩法,全图实时争夺、军团即时战争、重点资源掠夺,给你前所未有的战争快感!
万兽集结,只待你策略远征!巨兽战场,寸土必争!
】【王者五五开黑节,10+明星组队朋友来相会!******
一年一度的《王者荣耀》五五开黑节如约将至,2021年的开黑节依旧为召唤师们准备了海量福利,除永久皮肤免费得,五五开黑不掉星等,还有bilibili、微视、虎牙、斗鱼、快手各大直播平台为召唤师送出专属开黑节福利。
5月1 日20:30 微视电竞星战队,5月1日21:00龚俊&高秋梓,5月2日20:00李现&孤影、5月3日20:00宋茜&张佳宁、5月4日20:00INTO1刘宇&INTO1林墨、5月5日20:30杨幂&陈学冬等明星大咖也将纷纷助阵,带来五一假期天天精彩的明星朋友局直播。召唤师们不妨马上召集小伙伴,小长假来峡谷一起欢乐开黑。
五五开黑节官方KV
明星直播表,大咖轮番空降狂派好礼
五五开黑节,大咖来助力。长假五天活动期间,到王者营地向明星朋友们提问,可获明星现场翻牌。参与明星直播竞猜,还有机会赢荣耀水晶、永久皮肤。五天五场直播,福利不停歇。
全民朋友局明星海报
5月1日,两场直播先后开启。先有浪姐再聚腾讯微视,金晨、李斯丹妮、孟佳、郁可唯、张含韵五星联袂,连同KPL官方解说高然、微视主播高司令与他的粉丝战队齐聚峡谷组队团建。直播中将抽出100份五五开黑节新皮肤免单、海量Q币、王者荣耀限量周边等奖品,同时还有微视电竞星战队签名队服和星战队超级宠粉神秘大奖。
浪姐直播海报
同样在5月1日,大“扇”人龚俊将携好友高秋梓登陆B站直播间开黑畅玩,直播期间设有互动采访、畅读弹幕、英雄语音模仿秀以及随机抽奖送福利等环节。
龚俊&高秋梓直播海报
5月2日,《王者荣耀》品牌代言人李现将与虎牙明星主播孤影、北京WB暖阳、北京WB阿豆一起高能开黑,与职业主播选手互秀高端操作。
李现直播海报
5月3日,《王者荣耀》品牌代言人宋茜携好闺蜜张佳宁现身斗鱼直播间。召唤师们届时完成斗鱼任务、营地任务即可兑换福利盲盒。开启盲盒可随机获得永久英雄、永久皮肤以及苹果手机、王者周边等实物奖励,百分百中奖,开盒必有奖。
宋茜&张佳宁直播海报
5月4日,INTO1成员刘宇、林墨正式登场,与虎牙明星主播剑仙、赖神组队上演峡谷出道秀。召唤师们观看直播完成互动,就有机会赢得精美游戏周边、京东卡、游戏道具等多重好礼。
刘宁&林墨直播海报
5月5日,快手王者朋友局。《王者荣耀》品牌代言人杨幂携好友陈学冬空降快手直播间,看两位明星召唤师你画我猜测默契、互选英雄玩心跳,在快手搜索“五五开黑节”一键参与,观看直播赢取快币。
杨幂&陈学冬直播海报
开黑不掉星,新皮肤新玩法同步登场
直播间共享狂欢,峡谷内福利拉满。开黑节全新玩法、全新皮肤即将上线,永久皮肤免费得,还可抽取内测皮肤,开启神秘商店及蔷薇珍宝阁兑换。5月5日当天与好友组队开黑,享有三次不掉星机会。
边路插图
开黑享福利,腾讯王者人生联合百城万店让你五一吃喝玩乐爽不停
王者荣耀官方商户福利平台腾讯王者人生联合百城万店,为召唤师献上专属省钱福利。衣食住行、吃喝玩购均享专属特权,更有免单、半价券等你来抢!麦当劳、美团外卖、滴滴出行、CoCo都可、同程旅行、上海地铁等百余家知名品牌狂撒优惠,使用优惠还有机会瓜分万元红包、抽取五五开黑节限量周边~峡谷内有开黑福利,峡谷外也有好礼相送。《王者荣耀》将于上海:BFC外滩金融中心(5月1日—5月5日)成都:春熙路红星路广场(5月4日—5月5日)两地打造“开黑记忆集市”。召唤师们前往“开黑记忆集市”可享受王者省钱福利。
中路插图
无处不团,有你才赞,《王者荣耀》五五开黑节即将开启。好友开黑不掉星,明星直播送福利,还有王者集市吃喝玩乐。这个五一,不妨相约王者峡谷,享受开黑乐趣,收获线上线下双倍快乐。
】v8.6.4版本
游戏流畅度优化:
为了让玩家们有更好的游戏体验,我们优化了游戏的运行流畅度,减少部分卡顿的现象
黑暗代理人 v11.2.895安卓版317.78M
pg网赌软件下载vivo版 v8.6.4安卓版974.89M
剑绝最新版 v6.8.83安卓版427.43M
球斗士 v5.4.9安卓版611.28M
高达战争:宇宙 oppo版本 v2.7.8安卓版671.11M
无敌风火轮赛车:极限竞速三七互娱版 v8.3.8安卓版344.88M
用户评论
0条评论