Appearance
1M上下文相当于2小时视频、6小时音频
Gemini 多模态
any2any mnjhuy76
媒体生成(多模态)
Gemini 2.5 Flash
Imagen 4
Veo 3.1 文生视频、图生视频
TTS
MCP(Model Context Protocol,模型上下文协议)
构建AI智能体
智能体系统:
- 工作流程
- 智能体
智能体开发工具包(ADK)
- 可部署在本地、云端、Cloud Run、GKE
在Cloud Run 上托管MCP服务器
一个结合ADK和Cloud Run的简单AI智能体的demo
不用管理k8s集群,没有配置
ADK agent部署到Cloud Run
MCP server的部署
Model 模型
tools工具
Orchestration 编排
Runtime 运行时
执行复杂工作
代理(agent)会去调用
企业级
数百个连接器、80万+自定义API、知识图谱、智能体计划、工作流程
Non-live API
多模态能力
live API
Gemini 2.5 Computer Use
传统RPA将被Computer Use Agent代替
GemBooth 改自拍风格
GenMedia
NanoBanana, Veo, Lyria 2
Veo 3:
元素融合(3张图生成一个视频)
音画同步
首尾帧
演讲与对话
音效
提示词遵循
Lyria:
文生音乐
Google保障版权、可放心使用
Chirp 3:
Full Style
AI earn money?
TTS
Demo:
NanoBanana生成一些图,然后利用Veo让图片动起来。(Consumer Packaged goods)
Nano 可以直接生成模特(有很多模特)
AI提供创意、提高生产力
人监督AI的实现
很多工作流
StoryCraft