网站更换空间对优化的影响,开发网站如何选需要注意什么,凡客公司,网站开发核心技术名人说#xff1a;一花独放不是春#xff0c;百花齐放花满园。——《增广贤文》 作者#xff1a;Code_流苏(CSDN)#xff08;一个喜欢古诗词和编程的Coder#x1f60a;#xff09; 目录 一、简要介绍1、Gemini是什么#xff1f;2、主要特点3、Gemini的版本4、应用潜力5、… 名人说一花独放不是春百花齐放花满园。——《增广贤文》 作者Code_流苏(CSDN)一个喜欢古诗词和编程的Coder 目录 一、简要介绍1、Gemini是什么2、主要特点3、Gemini的版本4、应用潜力5、使用方法 二、分类问题测试1、基础问答5个2、数学题解答5个3、逻辑推理5个4、创造性写作3个5、代码编写3个6、对话理解与情感交流2个7、翻译任务1个8、策略规划1个 三、测试结果仅代表个人观点 ★观前提示以下内容仅为测试内容不代表未来新版本如何。 在本篇博客中我们将一起探讨Google AI模型——Gemini。Gemini标志着Google在人工智能领域的一大飞跃不仅因为它的先进技术也因为它在多任务语言理解MMLU测试中首次超越了人类专家。这一成就显示了Gemini在知识获取和问题解决能力上的卓越性能最初名称为Bard最近赋名为了Gemini那么它究竟如何本篇内容将采用与上篇gpt3.5相同的问题来进行测试最后会在测试感受出说一下对比gpt3.5它能力的强弱。
一、简要介绍
1、Gemini是什么 Gemini 是 Google 开发的最新一代大型人工智能模型代表了 Google 在人工智能领域的最新进展。它是一个跨部门协作的成果由 Google 研究部的同事从头开始构建具有多模态能力能够处理、理解、操作并结合不同类型的信息包括文本、代码、音频、图像和视频。Gemini 被设计为迄今为止 Google 最灵活的模型旨在处理各种复杂的任务和挑战。
2、主要特点
多模态能力Gemini 能够无缝集成并处理文本、图像、音频和视频等多种类型的信息。超越人类专家的性能在多个领域的测试中特别是大规模多任务语言理解MMLU和小学数学推理GSM8K的测试中Gemini Ultra 的性能超越了现有的最先进模型包括GPT-4甚至在某些领域超越了人类专家。高度灵活Gemini 设计用于适应从大型数据中心到移动设备等不同的运行环境支持各种规模的应用部署。
3、Gemini的版本
Gemini Ultra针对最复杂任务的最强大版本性能在多个学术基准上超过了GPT-4。 例如官方公布的对比数据在文本上 在多模式上 Gemini Pro适合日常使用的版本已集成到 Google 的 Bard 聊天机器人中提升了其高级推理、规划和理解的能力。Gemini Nano设计用于嵌入移动设备如谷歌Pixel手机使大模型能够成为日常生活中的小助手。
4、应用潜力
由于其多模态处理能力Gemini 可以在多种应用场景中大放异彩包括自然语言处理文本生成、文本摘要、翻译等、高质量代码生成支持 Python、Java、C 和 Go 等编程语言以及处理超出编码范围的复杂问题如涉及复杂数学和理论计算机科学的竞争性编程问题。
5、使用方法
官网注册使用即可Gemini官网 了解了以上内容之后咱们一起去测试体验一下
二、分类问题测试
测试采用多类问题提问以检验其多方面的功能。
1、基础问答5个 Q1: 澳大利亚的首都是哪座城市✔ Q2: 地球与太阳之间的距离是多少✔ Q3: 水的沸点是多少度✔ Q4: 比萨斜塔在哪个国家✔ Q5: 世界上最长的河流是哪一条✔ 从回答来看5个问题均正确✔相比gpt3.5更加完善和全面。 2、数学题解答5个
Q1:小明有12个苹果他想平均分给他的3个朋友12个苹果分给3个人请问每个朋友可以得到几个苹果小学难度 ✔ Q2已知直角三角形的一条直角边长为5cm另一条直角边长为12cm求斜边的长度。初中难度 ✔ 结果算对了但是中间则怎么突然冒出英文解释了san值狂掉… Q3:若一个二次函数表达式为 f ( x ) a x 2 b x c ( a ≠ 0 ) f(x) ax^2 bx c (a≠0) f(x)ax2bxc(a0)已知f(1)0f(2)3且f(x)图像经过点(3,10)请求出a、b、c的具体值。初中难度 ✔ Q4在平面直角坐标系中曲线C的方程为 y x 3 − 6 x 2 9 x 10 y x^3 - 6x^2 9x 10 yx3−6x29x10求曲线C过原点处的切线方程。高中难度 ✔ 这题虽然解对了但是与gpt3.5一样用到了一些高等数学的知识这里要注意甄别。 Q5计算函数 f(x) x^3 - 2x^2 x 在 x 2 处的导数。大学基础难度 ✔ gpt3.5在大学基础难度的题出了错而Gemini此处求解正确。 3、逻辑推理5个
Q1: 如果所有猫都喜欢吃鱼而Tom是一只猫那么Tom会喜欢吃鱼吗✔ 一般的判断答案应该是喜欢但是它的回答不无道理因此也可看作对的。 Q2: 假设AB且BC请问A是否一定大于C✔ 一般的判断答案应该是A大于C但是它的回答考虑范围更广因此也是对的。 Q3: 你有1000kg蘑菇含水量是99。现在晒几天晒到含水量为98%那需要晒掉多少水✔ gpt3.5在这里出现了计算错误。 Q4: 有一个没有刻度的长方形的塑料盒子没有盖子它的容积是1升。请问如果只能使用这个盒子称量依次能够准确地量出多少升的水半✔半✖ 正确答案如果只能使用这个盒子称量一次能够正确地量出 0.5 升的水。也能量出 1/6 升将长方形盒子倾斜水位到达盒子的上一边及底下的边线即可。 Q5: 72、36、24、18、( )✖ 正确答案14.4 4、创造性写作3个
Q1: 请续写一个故事开头“在一个寒冷的冬夜小镇图书馆的灯突然熄灭了……” 写的偏对话式的故事不过也算有头有尾。 Q2: 编写一首关于秋天落叶的五言律诗。 相比于gpt3.5此处出现了语意理解错误以及常识性错误。 Q3: 写一个关于人工智能与人关系的短篇小说。 前后逻辑性还不错但是小说的情节过于简单流水化不具有创新性。 5、代码编写3个
Q1: 用Python编写一个函数用于判断一个数是否为质数。 Gemini所写代码如下
def is_prime(n):判断一个数是否为质数Args:n: 要判断的数Returns:True 如果n是质数False 如果不是if n 1:return Falseif n % 2 0 and n ! 2:return Falsefor i in range(3, int(n ** 0.5) 1, 2):if n % i 0:return Falsereturn Trueprint(is_prime(13)) # True
print(is_prime(15)) # FalseQ2: 用Python编写一个程序检查一个字符串是否为回文正读反读都一样的词。
Gemini所写代码如下
def is_palindrome(s):检查一个字符串是否为回文Args:s: 要检查的字符串Returns:True 如果s是回文False 如果不是s s.lower() # 将字符串转换为小写s .join(ch for ch in s if ch.isalnum()) # 删除非字母数字字符return s s[::-1] # 将字符串反转并与原字符串比较print(is_palindrome(racecar)) # True
print(is_palindrome(madam)) # True
print(is_palindrome(hello)) # False测试了下成功运行并得到正确反馈。 Q3: 用Python编写一个程序实现二叉树的深度优先搜索DFS并返回所有节点的遍历顺序。
def dfs(root):实现二叉树的深度优先搜索Args:root: 二叉树的根节点Returns:所有节点的遍历顺序if root is None:return []result []# 递归访问左子树result dfs(root.left)# 访问根节点result.append(root.val)# 递归访问右子树result dfs(root.right)return result
class TreeNode:def __init__(self, val):self.val valself.left Noneself.right Noneroot TreeNode(1)
root.left TreeNode(2)
root.right TreeNode(3)
root.left.left TreeNode(4)
root.left.right TreeNode(5)print(dfs(root)) # [4, 2, 5, 1, 3]6、对话理解与情感交流2个
Q1: 我今天心情不好能给我讲个笑话吗 这个笑话且别说get到笑点了 Q2: 你能帮我分析一下最近压力大的原因并提供缓解压力的方法吗 给的方法不错几个建议挺有道理分解任务学会说“不”寻求帮助。 7、翻译任务1个
Q: 将这段文字翻译成英语“张骞(Zhang Qian)是中国第一个伟大的探险家。他不畏艰险克服重重困难两次出使西域开通了中国同西亚和欧洲的通商关系将中国的丝和丝织品运往西亚和欧洲开拓了历史上著名的“丝绸之路”。同时他又将西域的风土人情、地理文化以及特有物种等介绍到中原极大地开阔了人们的视野。 正如历史学家所指出的那样如果没有张骞出使西域就不可能有丝绸之路的开辟也就不会有汉朝同西域或欧洲的文化交流。”六级翻译原题 翻译着…怎么还拓展了 Q: 再将这段英语翻译成中文 整体可以看出翻译效果是不错但是语意理解上跟gpt模型还是有一定差距的。 8、策略规划1个
Q: 假设你是某初创公司的CEO公司在市场扩张过程中遇到了资金短缺问题你将如何制定一份详尽的战略计划既保证业务持续增长又能吸引新的投资者 这计划还不错但是跟gpt3.5一样的通病在于流水账很多描述上偏流水化没有像人一样在交流时的创造性和灵活性。 本次测评就到这里接下来总结一下感受。
三、测试结果仅代表个人观点
根据之前使用3.5和4的感受Gemini整体实力大概在gpt3.5 - 4之间的水平小部分能力确实超过了4但综合实力gpt4目前更强一些。至于官方公布的实力对比可能是付费版本或预览版本之间的比较笔者对此尚存疑惑不在此表态欢迎大家评论谈一下你们的观点。
不过从gpt3.5到今天的Gemini给我一个感受就是铁打的流水机器人很长一段时间内不可能完全替代有创造性的人。相比于担心AI发展太快不如精进技术做AI的引领者 关于测试暂时测试这些很感谢你能看到这里如有相关疑问还请下方评论留言。 Code_流苏(CSDN)一个喜欢古诗词和编程的Coder 如果对大家有帮助的话希望大家能多多点赞关注这样我的动力会更足