Google I/O Extended Tokyo 2025 キーワード集 3
2025/7/5 15:00

Gemini inputs and outputs
Veo
パズルゲーム
アイテムの絵を描くとGeminiが理解してオブジェクト化してマップに配置してくれる
焚き火の絵を書いてアイテム召喚し、氷を溶かすデモ
Geminiは汎用モデルなので絵でなくて「火」という文字でもいい
これ面白い。この応用方法は深堀りしていきたいな 


お絵かきを分析
「絵がどういうものかを分析せよ」というプロンプト
ただし、ゲームで定義済みのアイテムに限る。それ以外はNoneを返させる。
ゲームバランス
→ Fire
属性を推測
→ { falls, burns, ... }
画像を生成
Imagen, Gemini (こっちがいい)
イラストのスタイルもプロンプトで指定する
漫画、実写、ピクセルアート
自然言語でゲームを操作
Cast spell
「火を消す」「車を壊す」
最初から全部作るのは大変なのでこれを使う
Safty levelを自分の都合でカスタマイズできる
Gemini 2.0 Flashでアイテム画像を作って時短
鍵、錆びた鍵
ゲームの素材を簡単に用意できる時代になったな
ゲームステージのマスク画像をアップロードして、テクスチャを作らせる
SDKコードとして持ち出せる
これが最高 
Build apps with Gemini
ここでVibe codingできる
「コードが生成されているのを見るのが、Vibe codingの楽しみ方です」
「大体の時間は、Geminiに仕事を任せてコーヒーを飲みに行って、戻ってきて、ああできているな〜と言う」
早い段階でプロトタイプを作れるのがいい
「面白いかどうかを確認できるレベルのものが作れればいい」
オフラインモデル
Gemma 3
Gemini系統
Gemini nano系統

モバイルデバイスで使うことを意識したマルチモーダルモデル
旅行先で写真を見せながら
「ここはどこなの?」