時間:2023-12-23|瀏覽:346
您準備好提高您的品牌知名度了嗎? 考慮成為人工智能影響之旅的贊助商。 詳細了解這里的機會 。
Stability AI 是一家以 Stable Diffusion 文本到圖像生成器而聞名的公司,宣布其新的基礎圖像到視頻模型 Stable Video Diffusion (SVD) 現已在其開發者平臺上并通過其應用程序編程接口提供( API),允許第三方開發者將其整合到自己的應用程序、網站、軟件和服務中。
該公司寫道:“這一新功能提供了對專為各個領域設計的最先進視頻模型的編程訪問……我們發布此版本的目標是為開發人員提供一種有效的方法,將高級視頻生成無縫集成到他們的產品中。”在一篇博客文章中。
雖然該版本可以幫助希望生成 AI 視頻的企業,但也可能引起一些擔憂,因為 Stability AI 因在 LAION-5B 上訓練其模型而受到批評,LAION-5B 是一個開源 AI 數據集,已被發現包含至少 1,008 個視頻兒童性虐待材料的實例,因此本周被下線。
盡管如此,對于希望在應用程序中構建生成視頻的個人和企業來說,Stability 的新 SVD API 插件確實在質量方面提供了領先的選項之一,提供“2 秒的視頻,包括 25 個生成的幀和 24 個生成的幀”。 FILM 插值,平均時間為 41 秒”,Stability AI 在其 LinkedIn 頁面上發布的一篇文章稱。
對于大型視頻活動來說,這可能還不夠,但它肯定可以派上用場來制作帶有特定消息(包括模因)的 GIF。
VB事件
人工智能影響之旅
制定 AI 治理藍圖 – 請求 1 月 10 日活動的邀請。
了解更多
該產品采用了 Runway 和 Pika Labs 的競爭性視頻生成模型,后者最近從 Lightspeed Venture Partners 籌集了 5500 萬美元,并推出了一個新的網絡平臺來生成和編輯視頻。
然而,這些產品都沒有通過 API 提供視頻生成人工智能模型——你需要直接訪問它們各自的網站和應用程序才能使用它們,這意味著至少目前,外部開發人員無法真正在其上構建應用程序他們或合并他們。
值得注意的是,Stability 還計劃為其視頻生成器推出面向用戶的網絡體驗,盡管沒有透露何時推出。
該公司正在呼吁用戶加入等待名單,成為第一批試用該界面的用戶。
首先我們來了解一下穩定視頻擴散有什么作用
近一個月前在研究預覽中宣布,Stable Video Diffusion 允許用戶通過靜態圖像(包括 JPG 和 PNG)提示來生成 MP4 視頻。
根據該公司分享的樣本,該模型在制作所需的剪輯方面做得不錯,但仍處于初級階段,只能生成持續長達兩秒的短視頻。
這甚至比以研究為中心的視頻模型生成的四秒剪輯還要短。
當然,多個視頻剪輯可以鏈接在一起形成一個更大的視頻。
就穩定性而言,它聲稱可以在廣告、營銷、電視、電影和游戲等領域提供幫助。
更有趣的是,與上個月發布的用于探測和反饋的模型不同,最近發布的模型可以生成多種布局和分辨率的視頻,包括1024×576、768×768和576×1024。
它還包括運動強度控制和基于種子的控制等附加功能,允許開發人員在可重復生成或隨機生成之間進行選擇。
盡管存在爭議,但穩定仍在繼續
雖然 Stable Video Diffusion 的推出確實為企業提供了一種在其產品中構建視頻生成功能的簡單方法,但這也凸顯了 Stability AI 已準備好爭奪市場,盡管有些人質疑其訓練數據的來源。
就在最近,斯坦福互聯網天文臺的一份報告發現,免費的 LAION-5B 數據集已用于訓練流行的 AI 文本到圖像生成器,包括 Stable Diffusion 1.5(由 Runway 發布并由 Stability 支持),包含至少 1,008 起兒童性虐待材料。
出版商 LAION 現已刪除該數據集。
甚至在今年早些時候,該公司就在一項集體訴訟中被點名,指控該公司向 LAION 支付費用,以獲取“未經許可創建穩定擴??散的數十億受版權圖像的副本”。
目前,Stability 的開發者平臺 API 提供對所有公司模型的訪問,從 Stable Diffusion XL 文本到圖像生成器到新的 SVD 模型。
該公司還提供會員資格,幫助客戶在本地托管模型。
VentureBeat 的使命
是成為技術決策者獲取有關變革性企業技術和交易知識的數字城鎮廣場。
了解我們的簡報。