Skip to content

1M上下文相当于2小时视频、6小时音频

Gemini 多模态

any2any mnjhuy76

媒体生成(多模态)

Gemini 2.5 Flash

Imagen 4

Veo 3.1 文生视频、图生视频

TTS

MCP(Model Context Protocol,模型上下文协议)

构建AI智能体

智能体系统:

  • 工作流程
  • 智能体

智能体开发工具包(ADK)

  • 可部署在本地、云端、Cloud Run、GKE

在Cloud Run 上托管MCP服务器

一个结合ADK和Cloud Run的简单AI智能体的demo

不用管理k8s集群,没有配置

ADK agent部署到Cloud Run

MCP server的部署

Model 模型

tools工具

Orchestration 编排

Runtime 运行时

执行复杂工作

代理(agent)会去调用

企业级

数百个连接器、80万+自定义API、知识图谱、智能体计划、工作流程

Non-live API

多模态能力

live API

Gemini 2.5 Computer Use

传统RPA将被Computer Use Agent代替

GemBooth 改自拍风格

GenMedia

NanoBanana, Veo, Lyria 2

Veo 3:

元素融合(3张图生成一个视频)

音画同步

首尾帧

演讲与对话

音效

提示词遵循

Lyria:

文生音乐

Google保障版权、可放心使用

Chirp 3:

Full Style

AI earn money?

TTS

Demo:

NanoBanana生成一些图,然后利用Veo让图片动起来。(Consumer Packaged goods)

Nano 可以直接生成模特(有很多模特)

AI提供创意、提高生产力

人监督AI的实现

很多工作流

StoryCraft