My VitePress Site

1M上下文相当于2小时视频、6小时音频

Gemini 多模态

any2any mnjhuy76

媒体生成（多模态）

Gemini 2.5 Flash

Imagen 4

Veo 3.1 文生视频、图生视频

TTS

MCP(Model Context Protocol，模型上下文协议)

构建AI智能体

智能体系统：

工作流程
智能体

智能体开发工具包（ADK）

可部署在本地、云端、Cloud Run、GKE

在Cloud Run 上托管MCP服务器

一个结合ADK和Cloud Run的简单AI智能体的demo

不用管理k8s集群，没有配置

ADK agent部署到Cloud Run

MCP server的部署

Model 模型

tools工具

Orchestration 编排

Runtime 运行时

执行复杂工作

代理(agent)会去调用

企业级

数百个连接器、80万+自定义API、知识图谱、智能体计划、工作流程

Non-live API

多模态能力

live API

Gemini 2.5 Computer Use

传统RPA将被Computer Use Agent代替

GemBooth 改自拍风格

GenMedia

NanoBanana, Veo, Lyria 2

Veo 3:

元素融合（3张图生成一个视频）

音画同步

首尾帧

演讲与对话

音效

提示词遵循

Lyria:

文生音乐

Google保障版权、可放心使用

Chirp 3:

Full Style

AI earn money?

TTS

Demo:

NanoBanana生成一些图，然后利用Veo让图片动起来。(Consumer Packaged goods)

Nano 可以直接生成模特（有很多模特）

AI提供创意、提高生产力

人监督AI的实现

很多工作流

StoryCraft

Minisql

Log

Tmp

媒体生成（多模态）

构建AI智能体

Log

媒体生成（多模态） ​

构建AI智能体 ​

媒体生成（多模态）

构建AI智能体