Google Gemini网站首页
Google Gemini是什么?
谷歌Gemini官网网址:https://deepmind.google/technologies/gemini/
谷歌Gemini是由Google DeepMind开发的多模态人工智能模型系列,具有强大的文本、图像、视频、音频和代码处理能力.
Google Gemini介绍
版本
-
Gemini Ultra:规模最大、能力最强,适用于处理高度复杂的任务。
-
Gemini Pro:在各种任务上表现均衡,是扩展性最佳的模型。
-
Gemini Nano:用于端侧任务的最高效模型,包括1.8B参数的Nano-1和3.25B参数的Nano-2两个版本,从较大的Gemini模型中蒸馏训练得到,并采用4位量化。
特点
-
原生多模态:从一开始就对不同模态进行预训练,再用额外的多模态数据微调,能够无缝理解和组合不同类型的信息。与传统多模态模型相比,Gemini在处理音频等信息时,可以端到端处理原始数据,识别更多细节。
-
强大的推理能力:例如能根据不同颜色的毛线给出可编织的物体,看到画面中出现吉他时提供对应演奏音频,还能智能追踪视频中物体的运动轨迹。在MMLU等基准测试中表现出色,Gemini Ultra在MMLU上达到90.0%准确率。
-
高效协作开发:由谷歌各团队大规模协作开发,从头构建,确保了模型的综合性能。
应用场景
发展历程
-
2023年9月,Gemini开启小范围内测。
-
2023年12月6日,谷歌正式发布Gemini。
-
2024年2月8日,谷歌宣布聊天机器人Bard将直接称为Gemini,网页版支持40种语言,并将在Android和iOS的Google应用程序上推出新的Gemini应用程序。
-
2024年2月16日,谷歌升级了Gemini系列模型,并发布用于早期测试的Gemini 1.5版本。
-
2024年4月,谷歌在Google Next大会上宣布将首次通过其AI应用平台Vertex AI向公众开放Gemini 1.5 Pro。
-
2024年12月11日,谷歌发布了新一代AI模型Gemini 2.0及其配套项目,包括实时多模态交互助手Project Astra、浏览器智能助手Project Mariner以及代码开发助理Jules。
Google Gemini怎么使用?