Google發表最新AI模型Lumiere！強大運算為市面上AI影片生成之突破

Google最新發表之AI模型Lumiere，是首個採用STUNet 架構計算出連續性動態影像的AI模型。

科技的發展日新月異，幾乎每過一段時間就會有階段性的突破。近日，Google發表了全新影片生成AI模型「Lumiere」；與曾被濫用在AI換臉影片所使用的「DeepFaceLab」不同，Lumiere主打的是從無到有的生成及風格化視覺處理，它能夠靠著文字指令產生連續影片，或是上傳原有的圖片、影片，讓Lumiere產生不同風格化的作品。

強大的運算系統，讓影片「無中生有」，或讓「圖片動起來」

Lumiere主要透過 STUNet 架構（Space-Time U-Net architecture）來生成影片，與其他現有AI影片模型截然不同的是，現有的AI影片模型大多是先建立一個關鍵影格，後再逐格合成連續影片所需的關鍵幀，但這會導致影片產生不自然或抖動。

而使用STUNet 架構的Lumiere，則是利用模型學習物體多個時、空間的移動及變化軌跡，所以能夠直接將一次性指令運算為「連續性的畫面」，讓影片顯得更加真實及流暢。

從示範影片中，我們可以看到使用者輸入「一隻帶著好笑墨鏡的狗正在開車」指令後，Lumiere所產生的真實畫面；或者，我們將名畫「戴珍珠耳環的少女」上傳，並輸入「女孩眨眼及並微笑」的指令，就可以得到動起來的名畫。

或者，丟入一張靜止的篝火或蝴蝶照片，使用「Cinemagraph」功能，圈起想要營造動態的範圍，Lumiere也能產生搖曳的火焰和撲動的翅膀。

生成風格化系列影片，或進行影片修復

Lumiere運算系統的強大可不止如此，「Stylized Generation」功能顯示，當使用者上傳了一張螢光藍的蘑菇參考圖，並輸入「跳舞的熊」指令；AI就能參考上傳素材的「材質與風格」，隨即產出與參考圖風格一致的指令作品。靠著此功能，使用者可以大量產生同系列的動圖，不論是卡通或手繪風格，都難不倒Lumiere。