はじめに
最近,様々なタイプのAIが話題だ。特に注目を集めているのが動画生成AIであるveo3だ。veo3はGoogle DeepMindが開発した最新の動画生成AIモデルで、2025年5月に発表された。テキストや画像を入力として、音声付きの高品質な動画を自動生成することができる。主な特徴として,自然な動きや物理的整合性を再現可能であり,静止画を動画に変換する機能が追加されている。
普段画像ばかり生成しているので,たまには動画も生成してみたくなり,veo3を触ってみた。
veo3での動画生成
すると,以下の動画が生成された。非常にきれいな動画であり,ものすごく注意してみないとおかしな点は見当たらない。また,同時に生成された音声も極めて自然であった。まるで手持ちカメラのように視点が若干揺れているのにも驚いた。文章の指示に完全に従っているわけではないが,それでもおおよその筋はあっている。プロンプトをもう少しうまく書ければ,理想の動画が生成できるだろう。
これだけ簡単に動画を生成できるのであれば,化学の勉強などに応用できるのでは?と考えた。
化学結合の動画生成
動画用AI
そこで,以下のような単純な化学結合の生成を動画で描画するよう頼んでみた。
出力結果は以下の通りで,雰囲気はそれっぽいが,構造が明らかに間違っていたり,結合生成の様子も違っていたりと,なかなか難しいようだ。
汎用のAI
動画生成が難しいのなら,HTMLでのアニメーションはどうか?というわけで,Claude-Opus-4に頼んでみた。
結果,以下のようなHTMLコードが出力された。結合生成の様子を,アニメーションで解説してくれるようだ。
なかなか見た目はよく,プロトン付加などを理解しているように見える。しかし,構造の様子は4番の四面体中間体で怪しく,6番の水分子脱離で完全にぶっ壊れた。この後使用上限に引っ掛かるまで修正を重ねたが,完全に修正することは出来なかった。このレベルできっちりと分子認識をできるようになるには,あと数世代必要だと感じた。
まとめ
自分が思っていた以上に,簡単に動画を作成できることが分かった。動画や音声に全く違和感はなく,こんな簡単でいいのかと思ったくらいだ。惜しいのは化学結合の生成で,どうしても正しい構造を描写してくれなかった。これは動画でもアニメーションでも同じで,「あるべき構造」というのをAIが自発的に理解できるのはまだ数世代待つ必要がありそうだ。とはいえ,教科書に書いてある2次元の巻き矢印だけではなく,将来的には反応機構の順番を3Dで簡易に確認することができるようになっているだろう。平面のイラストでは理解しづらい部分をAIにお願いして3D化してもらうといった未来はすぐそこにあるのだ。
コメント