谷歌 Gemini 2.0 Flash保姆式使用教程指南

谷歌 Gemini 2.0 Flash是什么?

谷歌这几天的Gemini 2.0 Flash模型很火,Gemini 2.0 Flash 是谷歌推出的一款多模态人工智能模型,具备强大的图像生成和编辑能力。它能够通过简单的文本提示生成和修改图像,支持多模态输入和输出,包括文本、图像、音频等多种数据类型。Gemini 2.0 Flash 的核心特点是其原生多模态能力,能够在一个模型内同时处理文本和图像生成任务。

谷歌 Gemini 2.0 Flash怎么使用教程指南.jpg

一、在ai Studio中使用Gemini 2.0 Flash

在本教程中,我将一步步教你如何在AI Studio来 使用Gemini 2.0 Flash 生成或编辑图片。

1.  登录谷歌AI Studio

2. 选择模型

  • 登录后,你会看到一个界面,可以选择不同的模型。

  • 在“Model”下拉菜单中,找到并选择【Gemini 2.0 Flash (Image Generation) Experimental】模型。

谷歌 Gemini 2.0 Flash怎么使用教程指南.webp

3. 输入文字描述生成图片

  1. 在页面中的【Create prompt】框中输入你想要生成的图片的描述。描述越详细,生成的图片越符合你的预期。例如:“一只在森林中奔跑的白色兔子,阳光透过树叶洒在地上,画面风格是写实的,分辨率1080p。”

  2. 输入完成后,点击【Generate】或【开始】按钮,等待模型生成图片。

4. 编辑图片

如果你对生成的图片不满意,或者想进一步编辑,可以在【Create prompt】框中输入新的指令。

  • 添加元素:例如,“在图片中添加一朵红色的玫瑰花。”

  • 修改风格:例如,“将图片的风格改为卡通风格。”

  • 调整细节:例如,“把兔子的眼睛颜色改为蓝色。”

每次输入指令后,点击【Generate】或【开始】,等待模型生成新的图片。

5. 上传图片进行编辑

  1. 如果你有现成的图片需要编辑,可以点击页面上的【Upload Image】按钮,上传图片。

  2. 上传完成后,在【Create prompt】框中输入你想要的编辑指令,例如:“把图片中的背景换成蓝天白云。”

  3. 点击【Generate】或“开始”,等待模型完成编辑。

二、通过接入 Gemini API 使用

1. 获取 API 密钥

  • 访问 Google AI Studio

  • 点击“创建 API 密钥”按钮。请记住复制密钥。

  • 将其粘贴到名为.env的文件中,格式如下:

GOOGLE_API_KEY=replace_this_with_api_key

2. 安装 Python 依赖项

如果你使用 Python,可以通过以下命令安装必要的库:

pip install google-genai pyautogui python-dotenv sounddevice numpy

或者,也可以从GitHub 存储库下载requirements.txt文件并使用它来创建 Conda 环境:

conda create --name gemini python=3.11
conda activate gemini
pip install -r requirements.txt

3. 编写代码调用 API

使用以下代码示例调用 Gemini 2.0 Flash 的图像生成功能:

from google.generativeai import Client
# 初始化客户端
client = Client(api_key="你的API密钥")
# 图像生成
prompt = "一只在森林中奔跑的白色兔子,阳光透过树叶洒在地上,画面风格是写实的,分辨率1080p。"
response = client.generate_image(prompt)
# 保存生成的图片
with open("generated_image.png", "wb") as f:
f.write(response.image)

谷歌 Gemini 2.0 Flash怎么使用教程指南.webp

三、进阶使用方法

1. 指明编辑主体

如果图片中有多个主体,你需要明确指明要编辑的对象。例如:

“把图片中的兔子的眼睛颜色改为蓝色。”

“将图片中的背景换成蓝天白云,但保留兔子不变。”

2. 文字结合生成系列图片

如果你想生成一系列相关的图片,可以先输入一个故事的开头,然后逐步扩展。例如:

“生成一个孩子在海边玩耍的场景。”

“接下来,孩子捡起一个贝壳,仔细观察。”

“最后,孩子把贝壳放回海里。”

3. 使用英文提示词

如果生成的图片不符合预期,可以尝试将描述转换为英文。例如:

中文:“一只在森林中奔跑的白色兔子。”

英文:“A white rabbit running in the forest.”

四、注意事项

免费额度限制:Google AI Studio 提供的免费使用额度有限制,目前每天最多 50 次请求,每分钟不超过 2 次,如果超出限制,可能需要等待一段时间,或者升级到付费版本。

描述的准确性:描述越详细,生成的图片越符合预期。尽量使用具体的词汇和细节描述。

隐私和安全:不要上传或生成包含敏感信息的图片,确保你的使用符合相关法律法规。

通过以上步骤,你应该可以顺利使用 Gemini 2.0 Flash 来生成和编辑图片了。如果有问题,可以随时参阅官方文档!

Gemini 2.0 的官方文档:https://ai.google.dev/gemini-api/docs/models?hl=zh-cn

收藏
最新工具
喵记多APP
喵记多APP

快手推出的边聊天边记录的AI笔记,主要功能包括管理笔记,如剪藏、...

畅图
畅图

一款由摹客推出的AI原生可视化工具,专为个人和团队的创意表达、知...

Ztalk ai
Ztalk ai

一个AI驱动的会议实时语音翻译平台,可以与 Zoom、Googl...

Supercut
Supercut

一款屏幕录制工具,能帮你快速录下屏幕上的内容,录制的视频可以自动...

DreamShootAI
DreamShootAI

一个能帮你用照片生成各种风格图片的AI情侣照片生成工具,比如情侣...

讯飞星辰MaaS
讯飞星辰MaaS

科大讯飞开发的一款一站式AIGC内容运营平台,主要面向开发者,提...

星辰Agent开发平台
星辰Agent开发平台

讯飞星火新一代智能体Agent开发平台,助力开发者快速搭建生产级...

Drimo智能影视创作平台
Drimo智能影视创作平台

一款由追梦极客推出的面向影视、广告从业者以及AI视频创作者设计的...

码上飞
码上飞

一个需求秒变软件的全流程自动化智能开发平台,码上飞是L4级无人软...

Simular AI
Simular AI

一款专为Mac用户设计的本地AI智能助手,它能通过自然语言处理执...