世界排名No.1的大模型，有多厉害？国内可免费访问！

全球主机资源网 • 2025年 7月 25日上午12:42 • vps服务器

广告

世界排名No.1的大模型，有多厉害？国内可免费访问！

世界排名No.1的大模型，有多厉害？国内可免费访问！ 1:39 广告广告广告了解详情 > 会员跳广告首月9.9元秒后跳过广告

开通搜狐视频黄金会员，尊享更高品质体验！

1080P及以上画质仅为黄金会员专享>

开通/续费会员抱歉，您观看的视频加载失败请检查网络连接后重试，有话要说？请点击我要反馈>> 正在切换清晰度… 播放按esc可退出全屏模式 00:00 00:00 00:27 广告只看TA 高清倍速剧集字幕下拉浏览更多 5X进行中炫彩HDRVIP尊享HDR视觉盛宴超清 720P 高清 540P 2.0x 1.5x 1.25x 1.0x 0.8x 50 哎呀，什么都没识别到反馈循环播放跳过片头片尾画面色彩调整 AI明星识别视频截取跳过片头片尾是 | 否色彩调整亮度标准饱和度 100 对比度 100 恢复默认设置关闭复制全部log

大模型的发展，可谓一日千里

有业内人士说：

大模型时代的技术发展，是以“日”为单位计算的。

王珏老师深以为然。

有人计算过，

以10个国内主要大模型

加上10个国外主要大模型

平均每3天就会发布一版重要更新！

这不，昨晚(6.5）Google官宣发布了

Gemini 2.5 Pro-0605版

（上一版是0506版，这才过去一个月……）

这一版创造了一个全新纪录：

在数学、编程、推理基准测试中，新版模型全都是No.1

完全碾压o3、Claude 4、DeepSeek-R1。

Gemini-0605版在GPAQ——科学问题解决能力方面，

已经能够拿到86.4分，世界第一

（作为参考，DeepSeek是81分）

王珏老师专门试了一下一道“物理高考压轴题”

（这是由我家孩子皮克同学贡献的，据说难倒了一大票学霸）

（陪伴很多《学习科学》课程学员的皮克同学今年高三，明天高考，默默祝福！）

上次在测试时，

包括Gemini-0506版、Claude、Grok、DeepSeek在内的所有大模型

第一问基本都对：

然而，第二问、第三问所有大模型解错了！

今天，再用这道题测试了Gemini-0605版，

结果发现：第2问它也完全做对了！

——当然，第三问还是没解对……

让我们再耐心等待大模型的进化吧！

Gemini-0605版在编程能力方面，同样是世界 No.1！

我随手让它“制作一个DNA结构的三维模型”，

结果它用了5、6分钟的时间，生成了一段代码

运行后果然是可缩放、旋转的DNA双螺旋结构模型，

录屏如下：

这效果，真的是太令人惊叹了！

我把这段代码发布到了Html2Web网站上，大家扫码即可把玩：

最让人感到震撼的，是它在Humanalitys Last Exam人类终极测试（HLE）中，同样拿下了当下的No.1 ！

什么是“人类终极测试”呢？

因为传统的对大模型能力的测试（如MMLU–即大规模多任务语言理解、AIME-数学竞赛题、GPQA-科学问题解决，）

基本已被当下的大模型轻松“通关”（参见下图）

这样一来，

一来难以区分不同大模型的能力强弱，

二来也难以测出大模型的能力上限。

于是，HLE——人类终极测试也就应运而生！

看看上图，一年前的大模型的HLE成绩只有个位数

HLE的测试难度可见一斑！

HLE的题目收集自全球的贡献。当前包含的3,000道题目来自全球50个国家、500多所机构的近千名专家，包括数学家、化学家、语言学家等。

它有三大设计目标：

1、覆盖人类知识的前沿

问题需达到研究生或专家水平，例如“计算对称群Σ₄的∞–范畴下的自然余变换数量”。

2、抗检索性

所有问题无法通过简单的互联网搜索解决，例如“根据藏传希伯来语发音传统划分《诗篇》104:7的闭音节”。

3、多模态与自动化评分

10%的问题结合文本与图像（如古文字翻译、化学反应机理图），80%为精确匹配答案的简答题，20%为五选一以上的选择题。

HLE提出后，世界顶尖AI的表现让人咂舌，短短几天最高分从DeepSeek-R1的9.4，涨到了DeepSeek-0528的18.1分，O3的20.3分，以及Gemini0605的21.6分，可以说是进步飞快：

所以，王珏老师再次强调我的观点：

在大多数人还没有察觉的情况下

人类社会已经进入了崭新的时代——智能化时代，

现在对AI未来能力的最乐观估计

恐怕也是极为保守的

它的能力一定会远超人类的想象！

因此，永远不要轻视它

——不要觉得它只会计算、不会像人类那样思考，

就觉得它不行，人家是“算法文明”

算法文明的上限也许远高于人脑

——不要觉得它当下的能力不行

今天它的能力不够，也许明天就够了

今天还不会的事情，明天它可能就是专家了……

因此，今天关注大模型的发展、掌握大模型的使用

是每个人通往未来世界的“门票”！

当我们认清大模型的优势后

人类也不要妄自菲薄

人类有人类的独特能力和优势

但需注意：人类和大模型必须错位发展

不要和大模型在它擅长的方面比拼

——正像我们不会跟汽车比速度、比耐力一样！

最后，回到本文的主题：

Gemini 2.5 Pro这么优秀的大模型，

国内能不能访问呢？

可以的！

王珏老师一直推荐的AskManyAI网站，

https://askmany.cn/login?i=afad3e1d

或扫二维码访问：

可以让我们免费使用“Gemini 2.5 Pro免费版”（即0506版），如下图：

如果您想使用Gemini-0605版的话，需勾选上图中的“Gemini 2.5 Pro”，不过这就需要充值了……

如果你没有特殊的需求，只是一般性地写写文档，免费版足够用了！

————————————————————返回搜狐，查看更多

原创文章，作者：全球主机资源网，如若转载，请注明出处：http://www.expobonomi.com/1365.html

赞 (0)

全球主机资源网

0

我的世界：基岩1.20首个预览版发布！“旗帜+盾牌”合成新图案！

上一篇 2025年 7月 25日上午12:39

免费开玩游戏哪个好最新免费开玩游戏排行

下一篇 2025年 7月 25日

vps服务器

【怀旧向】2024 年回味一下 AMD 皓龙与 C32 平台

2025年 7月 23日
vps服务器

OANDA 在日本和GMO Internet Inc合作推出VPS服务

2025年 7月 24日
台湾vps

PQS五一促销：台北CN2原生IP/香港BGP/台湾彰化HiNet商宽/彰化HiNet动态/广移独享宽带VDS 年缴低至59.51折，数量有限售完不补!

2025年 7月 3日
国内vps

盘点免费CDN：不限内容，安全、稳定与速度兼具的长期选择

2025年 7月 27日
vps服务器

恒创科技：如何加快国外vps使用速度？

2025年 7月 27日
香港vps

专业版小区物业管理系统软件免费试用版

2025年 8月 3日
国内vps

中共中央、国务院、中央军委决定：蔡旭哲、宋令东、王浩泽获颁功勋奖章

2025年 7月 23日
便宜vps

OneTechCloud：超高速VPS，仅需25元，香港CN2/香港CMI/美国CN2GIA(原生IP)/美国CN2GIA+高防/美国CU2(原生IP)

2025年 7月 10日
国内vps

宿迁上线”速找活”零工信息平台，月余注册用户突破2.7万

2025年 7月 31日
vps服务器

学设计去国外哪个学校好？这5所顶尖院校闭眼选！

2025年 8月 3日

发表回复