近日(北京时间8月1日),Google DeepMind发布了Gemma2 2B模型,便攀升至小模型榜首。
据官网宣称,Gemma2 2B是一种更小、更安全、更透明的模型。通过DeepMind官网介绍可知,谷歌的Gemma2 2B通过大模型训练的数据并提炼或蒸馏(distill)来学习,其表现已经超过ChatGPT 3.5和同等规模的其他开源模型。
同时,Gemma2 2B模型对于硬件配置相对降低,因而可以部署、运行在云服务Google Vertex AI或Google Kubernetes Engine(谷歌分布式引擎)和英伟达T4深度学习加速器免费层,也可以部署在本地的边缘设备、电脑、手机上。
在Gemma2 2B发布的同时,谷歌(DeepMind)还发布了安全内容划分器模型ShieldGemma和着眼于解释模型内在运行机制的模型解释器Gemma Scope模型。前者ShieldGemma基于Gemma 2三种规格的模型开发。
据介绍,今年6月27日(北京时间6月28日)发布了其开源大模型Gemma2;此时的Gemma 2包含9B(90亿)和27B(270亿)参数两种。官网介绍,Gemma 2 27B的表现已经超越了Llama 3 8B和Grok-1 304B模型。而实际上,谷歌在今年2月份开源了其Gemma模型,基于Genimi同样的研究和技术,同样也包含了Gemma 9B和27B两种参数型号。
据悉,基于WebLLM和 WebGPU技术,通过下载Gemma2 2B等模型之后,便可以在本地浏览器体验Gemma2 2B模型服务。通过浏览器体验Gemma2 2B等模型,每秒30~40 Token,能有效解决9.9 > 9.11的问题,效能超越ChatGPT 3.5 Turbo和Mistral-8x7B。通过浏览器体验地址:https://huggingface.co/spaces/mlc-ai/webllm-simple-chat,选择Gemma 2 2B模型下载之后,便可以通过浏览器体验,简易操作,参考这里的视频。
Gemma2 2B的发布,让人们都可以更加方便地获取、使用AI。
附录:
Gemma 2 2B在线体验地址:
https://aistudio.google.com/ (可以选择的Google的闭源、开源共7种模型)
Nvidia英伟达提供的Gemma 9B在线体验地址:https://build.nvidia.com/explore/discover#gemma-2-9b-it
通过浏览浏览器体验Gemma 2 2B地址:https://huggingface.co/spaces/mlc-ai/webllm-simple-chat
基于Vertex AI部署、体验Gemma 2模型:
Gemma 2 2B模型权重资源下载地址:
Gemma 2 2B等模型配置教程:https://github.com/google-gemini/gemma-cookbook
Google官方公布的简易提示词设置教程: