生成式人工智慧的實施階段
生成式人工智慧(AI)模型的構建涉及多階段的過程,為了獲得所需的成果,必須以系統性的方式進行。
美國西北密蘇里州立大學阿傑·班迪(Ajay Bandi)副教授等人,於2023年,《未來網路期刊》(Future Internet)上,發表了一篇名為〈生成式人工智慧的力量:需求、模型、輸入輸出格式、評估指標與挑戰的回顧〉(The Power of Generative AI: A Review of Requirements, Models, Input–Output Formats, Evaluation Metrics, and Challenges)的文章中提到,雖然確切的術語和步驟可能因特定的方法和環境而有所不同,但生成式AI通常包括以下常見階段:問題定義、資料的收集和預處理、模型的選擇、模型的訓練、模型的評估、模型的精緻調整、部署、監控與維護,如圖1所示。
資料來源:Bandi, A., Pydi Venkata Satya, R. A., & Yudu Eswar Vinay Pratap,Kumar Kuchi. (2023). The Power of Generative AI: A Review of Requirements, Models, Input–Output Formats, Evaluation Metrics, and Challenges. Future Internet, 15(8), 260. https://doi.org/10.3390/fi15080260
該研究指出,在生成式AI模型的建構過程中,初始階段的核心在於清晰定義模型的目標,以解決特定問題。這涵蓋確定所需結果、資料需求以及任何限制,為後續階段奠定堅實基礎。精確的問題定義有助於資料收集和有效的模型選擇,進而簡化整個實施流程。
接著進入到數據收集與預處理階段,此階段需蒐集大規模且具代表性的數據集,包括文本、圖像、聲音、視訊等。數據的多樣性和全面性對於捕捉潛在模式至關重要。
完成資料收集後,進入模型選擇階段,即選擇最適合的生成模型結構,例如VAE(Variational Autoencoder)、GAN(Generative Adversarial Network)等。模型結構的選擇需與問題需求相符,為後續步驟鋪平道路。
確定生成模型結構後,進入模型訓練階段。在此階段,使用已收集或可用的資料集來訓練選擇的模型。透過這個過程,模型學習資料中的潛在模式和統計關係。訓練生成模型通常需要大量的運算資源,特別是在處理大規模資料集和複雜模型時。為提升訓練速度,通常會使用高效能硬體,如圖形處理器(GPU)或張量處理器(TPU)。此階段,特定的訓練演算法也會根據所選擇的模型而有所不同。
模型訓練完成後,後續階段包括評估階段和驗證其性能。評估指標針對特定任務或領域量身定制。在影像生成的情況下,可以使用初始分數、FID(Frechet Inception Distance score)或視覺檢查等指標來評估生成樣本的品質和多樣性。
在某些情況下,可能需要進行後處理以提高品質或遵守生成輸出的規範。此時可使用影像平滑、文字校正或風格轉換等技術,根據特定領域的需求處理生成的樣本。
最後,成功訓練和驗證後,即可向模型提供輸入,並獲得與訓練資料分佈一致的輸出,進而探索生成模型所展現的多樣性和創造力。
作者:羅凱揚(台科大企管博士)、黃揚博(政大企管碩士、識商創辦人)
資料來源:Bandi, A., Pydi Venkata Satya, R. A., & Yudu Eswar Vinay Pratap,Kumar Kuchi. (2023). The Power of Generative AI: A Review of Requirements, Models, Input–Output Formats, Evaluation Metrics, and Challenges. Future Internet, 15(8), 260. https://doi.org/10.3390/fi15080260