"模型"搜索结果 16 条
目前chatgpt哪个模型最强?

目前chatgpt哪个模型最强?

要说最强,当然是o1,但要说实用,那肯定是GPT-4o了~~ o1更适合科研一些~ 使用的话也很简单!现在AI领域也非常广,不仅仅 ChatGPT,还有很多其他领域~ AI的确很强大,不仅能帮助你节省时间、提高工作效率,还能做很多事~ 就像有了一把多功能的瑞士军刀,让你在工作中游刃有余,事半功倍。 以下是一些可以帮助你提高效率的AI工具,希望对你有帮助~ 1、AI工具类① AI 一下:yixiaai.com AI助手工具,100+助手模板,支持各种大模型…

中国在 GPT/LLM 大模型上是否已经实现了弯道超车?

中国在 GPT/LLM 大模型上是否已经实现了弯道超车?

这个问题真是一言难尽啊! 还是谈一下现状吧。中国的大模型公司与美国的大模型公司其实在数量上可能中国更多一些吧。 美国的OpenAI:No.1,毫无疑问!Google:尽管落了,但是依然是全球第二的实力吧?Meta:开源全靠它家的Llama系列。Microsoft:大家都知道,持有了大部分OpenAI的股份。但是自己的研发实力也是全球顶级的!Anthropic:OpenAI的一半员工干的。StabilityAI:尽管它家LLM不咋地,但是生图厉害啊!EleutherAI:一个…

字节跳动大模型训练被实习生恶意注入破坏代码,涉事者已被辞退,攻击带来的影响有多大?暴露出哪些问题?

这事坑就坑在: 运维怀疑买到了垃圾机器; 系统怀疑调度/框架出了问题; 算法怀疑模型见了鬼; 都没想到是内鬼在搞鬼; 因为大模型训练本来就会有很多因素影响,这种千卡万卡集群的问题更多;我看很多人都说权限管理,但这事和权限管理真没什么关系,因为看目前反馈的情况是钻的开源huggingface的load_ckpt接口,load ckpt是用于加载模型的checkpoint,反序列化时使用了pickle.load(),而 pickle 模块在反序列化时会执行数据中的…

有哪些“百试不爽”,提高思考深度的思维模型?

有哪些“百试不爽”,提高思考深度的思维模型?

俗话说思维决定格局,格局决定命运。 最近发现了一套让人茅塞顿开的思维模型,在这里分享给大家,一起打开格局! 建议收藏哦~学习力1 学习金字塔主动式学习,才是有效的学习! 2 费曼技巧(费曼学习法)想学会一个知识,不如尝试把它教给别人~ 3 刻意练习专注、重复、持续反馈。 4 RIA阅读法用自己的语言重述知识,并结合自己的相关经验,思考今后如何运用。 5 二八定律要用80%的时间做好那20%最重要的事! 思考力6 黄金圈法则杰…

听说百度要放弃基础通用大模型的研发了,真的假的?

整个国内模型底座第一次泡沫破裂就要来了。说个理想情况吧: 一,阶跃和智谱作为南北国家队,有政府投入兜底,保留革命火种。其他五小龙里除了DeepSeek,应该都赶紧放弃通用模型开发。转型专注做APP孵化或者B端客户实施(类似SAP,oracle,用友,金蝶)。拿着现在的算力GPU当做下轮融资入股,是最高收益解,能最大程度保护好已经入场投资人利益。而阶跃和智谱,即使获得其他四小龙算力支持,想要和LLaMA4这种赛亚人降临地球那样…

OpenAI新模型o1表现接近理化生博士水平,能解决83%国际奥数问题。国内的ai怎么水平还那么差?

我倒是不太担心o1把国内的AI甩得太远。o1这种类似于CoT的模式能成功,说明原本那些模型(GPT-4o, Claude 3.5 Sonnet等等)的上限是非常高的,只是之前的推理范式不给它们足够的token数思考。用GPT-4o mini做的o1 mini推理能力也这么强,更加证明推理能力和模型本身智力的关联并没有那么大。 现在OpenAI把reasoning这条路走通了,有理由相信Anthropic, xAI, 阿里,幻方都可以在几个月内跟上。也许最终的完成度没有OpenAI那么高,…

如何看待 OpenAI 发布 o1 系列模型?将带来哪些变革?

如何看待 OpenAI 发布 o1 系列模型?将带来哪些变革?

本来都要睡了,爬起来写点东西吧 其实截止至今晚之前,OpenAI 的乏力似乎是肉眼可见,Sora 的无限期跳票,GPT4o 的演示效果也没有被很好复现,再加上宫斗后遗症以及不少人才流失,Claude/Google/xAI 等一众竞争对手也从难以望其项背追赶到似乎触手可及。 OpenAI 用一颗 证明了,你大爷暂时还是你大爷,也给本来沉闷的夏末,带来一缕清风。哦不,是一道惊雷,也震醒了最近唱衰大模型前景的人。(各位从业同学又续了一命,还不快去…

大模型数据集哪里可以获取呢?

大模型数据集哪里可以获取呢?

景联文科技作为大模型数据服务商,提供海量高质量大模型数据集。 世界知识类期刊及高价值社区文本数据:高质量外文文献期刊 8500万篇英文高质量电子书 200万本 教育题库:K12教育题库 1800万大学题库 1.1亿,800万带解析英文题库 500万 专业知识类期刊、专利、代码:中文数字专利 4000万程序代码(代码注释) 20万 专利数据:全球专利基础著录数据 1.3亿全球专利原文数据 1亿全球专利附图数据全球专利法律状态数据全球专利法律…

时间序列预测模型有明显的优劣关系吗?

时间序列预测模型有明显的优劣关系吗?

本文作者简介:王世宇,蚂蚁集团算法专家,在AI创新技术部NextEvo主要负责时序算法研究方向,主导时序预测平台建设和时序算法创新研发和架构工作,推动预测与决策联动的双引擎能力。在ICLR, IJCAI, KDD, AAAI, WSDM, ICDM, DASFAA等顶级会议发表多篇论文。往期文章推荐 谷歌、Meta、Claude、Perplexity都在争取与苹果AI整合;阿里联合华东师大发布AI视频工具 Claude 3.5 Sonnet发布,比GPT-4o更智能;OpenAI CTO预测1年半“博士…

查理·芒格的100个思维模型具体是什么?

查理·芒格的100个思维模型具体是什么?

巧了,我刚好收集过查理芒格的100个思维模型,全是干货,原本我想把它们放到一起做成一张图片放到下面,但是这个图片实在太大了,足足有8MB,实在上传不了,所以我就把这100个思维模型分成了五个部分,一共五张图片,有需要的同学下载保存即可(整理真的不容易,如果对你有帮助的话记得点赞收藏哦~) 查理芒格是一位非常有智慧的人,在过去的46年里,他和巴菲特联手创造了有史以来最优秀的投资纪录——伯克希尔公司股票账面价值…

abaqus的模型同时存在四面体和六面体,能收敛吗?

abaqus的模型同时存在四面体和六面体,能收敛吗?

本篇文章将详细讲解Abaqus模型收敛性提高的方法。 1、调整Abaqus的网格大小简单解释:多尝试,找出最合适的网格密度 具体操作:一般合适的网格大小为:在截面上,网格取构件长宽的1/6-1/12,长宽比控制在1-2,在纵深方向,长度取为截面网格的0.6-2倍,尽可能使得网格为正方体,网格各方向的长度比不宜过大,一般纵深方向长度最长。 评价:该方法最推荐,但比较费时间和算力,批量建模前期可以对典型构件进行不同网格调试以得到最…

为什么现在的ai大模型好像只有中美在做,世界上其他国家都好像完全消失了?

当年美苏太空竞赛不就这样么 你能太空漫步我就直接登月行走 太空是一定会达成的目标,但人们都忽视了成本与收益,把长期目标极致缩短 然后苏联没了 当然,苏联没了有各种原因,但各种竞赛所消耗的海量资金无疑是拖垮苏联的重要一环 现在看AI竞赛真的有一种异曲同工之妙 同样的阳谋:落后就会挨打、无法证伪的目标 希望只是想多了

为什么会有那么多大模型答错「9.9 和 9.11 哪个大」?

为什么会有那么多大模型答错「9.9 和 9.11 哪个大」?

省流:不是tokenizer的问题,也不是注意力错误,也不是语义建模错误。我不知道为什么,这简直是这几天最令我困惑的事情了。 最简单的回答是归咎于tokenizer,但这很可能是过度简化了问题。 对于其他答主提及的gpt4o等模型,其tokenizer可以从openai的网站或tiktoken获得,其将 11 分词为一个token并不能证明是直接导致该现象的原因。 我们可以很简单地找到反例。如llama系列,从第一代开始其tokenizer就将单个数字作为分词。baic…

《黑神话悟空》最新的宣传片里,猴哥的模型很奇怪为什么没有人提出来?

笑死,作为一个3D模型设计师可以负责任的告诉你,你随便去找市面上能找得到的游戏原模型下载下来,丢到blender 3Dmax还是什么其他哪个软件里去看都可以,会很惊讶的发现,99%以上的模型不光看上去左右对称,实际上真的是左右对称,连脸上的网格点坐标都能精确到小数点后3位来镜像重叠。

阅兵时的各种导弹是真的吗,还是模型?

16年还在文 工团时,下部 队听过一个趣事。大家都知道部 队士 官四期转五期特别难,一个 旅甚至一个军都没一个!14年某导东风快递车队驾驶员四期到了转不了5期只好退 役。 这些驾驶员可都是部 队里的宝贝,曾驾驶快递车参加过多次演习和阅 兵,再破的路也能开的非常平稳,每当有重大活动都是他们开车。当他们旅街接到通知,快递车要经过天安 门时,部 队领导和新驾驶员都麻爪了,战 士心里没底不敢开,领导也觉得不保险不敢让他…

如何看待Huggingface CEO恭喜阿里Qwen2蝉联开源大模型榜首,并称中国处于领导地位?

如何看待Huggingface CEO恭喜阿里Qwen2蝉联开源大模型榜首,并称中国处于领导地位?

开源精神是互联网精神的支柱,GitHub 和 Huggingface两大开源平台则是互联网的启明星。通过开源平台分享自己的见识与成果,公允地面对质疑与挑战,让无论是开源代码还是开源产品触达更多地使用者,让技术的便利传播到更远的受众中,这就是开源的魅力。 在大模型这个高度集成的系统工程中,无数的训练、部署、适配都相互依赖,都需要专业人员去建设,Llama开源了,因此有海量的支持 Llama 框架的插件、服务、专属优化提供,SD 这…