shauncastic.com

Lightricks Just Made AI Video Generation 30x lebih cepat – dan Anda tidak akan memerlukan $ 10.000 GPU


Listen Later

Bergabunglah dengan buletin harian dan mingguan kami untuk pembaruan terbaru dan konten eksklusif tentang liputan AI terkemuka di industri. Pelajari lebih lanjut

Lightricks, perusahaan di balik aplikasi kreatif populer seperti Facetune dan Videoleap, hari ini mengumumkan rilis model generasi video AI yang paling kuat hingga saat ini. Model LTX Video 13-miliar-parameter (LTXV-13B) menghasilkan video AI berkualitas tinggi hingga 30 kali lebih cepat daripada model yang sebanding saat menjalankan perangkat keras tingkat konsumen daripada GPU perusahaan yang mahal.

Model ini memperkenalkan “rendering multiskala,” sebuah pendekatan teknis baru yang secara dramatis meningkatkan efisiensi dengan menghasilkan video dalam lapisan detail progresif. Ini memungkinkan pembuat untuk menghasilkan video AI berkualitas profesional di komputer desktop standar dan laptop kelas atas alih-alih membutuhkan peralatan perusahaan khusus.

“Pengenalan model video LTX parameter 13B kami menandai momen penting dalam generasi video AI dengan kemampuan untuk menghasilkan video berkualitas tinggi di GPU konsumen,” kata Zeev Farbman, co-founder dan CEO Lightricks, dalam sebuah wawancara eksklusif dengan VentureBeat. “Pengguna kami sekarang dapat membuat konten dengan lebih konsistensi, kualitas yang lebih baik, dan kontrol yang lebih ketat.”

https://www.youtube.com/watch?v=7zmxtMyud_u

Bagaimana Lightricks mendemokratisasi video AI dengan memecahkan masalah memori GPU

Tantangan utama untuk pembuatan video AI adalah persyaratan komputasi yang sangat besar. Model terkemuka dari perusahaan seperti Runway, Pika, dan Luma biasanya berjalan di cloud pada beberapa GPU kelas perusahaan dengan 80GB atau lebih dari VRAM (memori video), membuat penyebaran lokal tidak praktis bagi sebagian besar pengguna.

Farbman menjelaskan bagaimana LTXV-13B membahas batasan ini: “Garis pemisah utama antara GPU konsumen dan perusahaan adalah jumlah VRAM. Nvidia memposisikan perangkat keras game mereka dengan batas memori yang ketat-Generasi sebelumnya, sedangkan GPU, 32 GPU yang berkaitan pada 24 gigabytes dari VRAM, sementara yang paling tinggi 509 GPU. menawarkan lebih banyak lebih banyak. ”

Model baru ini dirancang untuk beroperasi secara efektif dalam kendala perangkat keras konsumen ini. “Model lengkap, tanpa kuantisasi, tanpa perkiraan apa pun, Anda akan dapat berjalan di GPU konsumen teratas – 3090, 4090, 5090, termasuk versi laptop mereka,” kata Farbman.

Dua kelinci yang dihasilkan AI, diberikan pada GPU konsumen tunggal, melangkah setelah pandangan sekilas ke kamera-sampel empat detik yang belum diedit dari model LTXV-13B baru Lightricks. (Kredit: Lightricks)
Inside 'MultiScale Rendering': Teknik yang diilhami oleh artis yang membuat AI Video Generation 30x lebih cepat

Inovasi inti di balik efisiensi LTXV-13B adalah pendekatan rendering multiskala, yang digambarkan Farbman sebagai “terobosan teknis terbesar dari rilis ini.”

“Ini memungkinkan model untuk menghasilkan detail secara bertahap,” jelasnya. “Anda mulai di kisi -kisi kasar, mendapatkan perkiraan kasar dari pemandangan, dari gerakan benda -benda yang bergerak, dll. Dan kemudian pemandangan itu dibagi menjadi ubin. Dan setiap ubin diisi dengan detail yang semakin banyak.”

Proses ini mencerminkan bagaimana seniman mendekati adegan yang kompleks – dimulai dengan sketsa kasar sebelum menambahkan detail yang semakin halus. Keuntungan untuk AI adalah bahwa “jumlah puncak VRAM Anda dibatasi oleh ukuran ubin, bukan resolusi akhir,” kata Farbman.

Model ini juga memiliki ruang laten yang lebih terkompresi, yang membutuhkan lebih sedikit memori sambil mempertahankan kualitas. “Dengan video, Anda memiliki rasio kompresi yang lebih tinggi yang memungkinkan Anda, saat Anda berada di ruang laten, untuk hanya mengambil lebih sedikit VRAM,” tambah Farbman.

Metrik kinerja yang menunjukkan model LTXV-13B LighTricks menghasilkan video hanya dalam 37,59 detik, dibandingkan dengan lebih dari 1.491 detik untuk model yang bersaing pada perangkat keras yang setara-peningkatan kecepatan hampir 40 ×. (Kredit: Lightricks)
Mengapa Lightricks bertaruh pada open source ketika pasar AI semakin tertutup

Sementara banyak model AI terkemuka tetap di belakang API tertutup, Lightricks telah membuat LTXV-13B sepenuhnya open source, tersedia di Face Hugging Face dan GitHub. Keputusan ini datang selama periode ketika pengembangan AI open-source telah menghadapi tantangan dari kompetisi komersial.

“Setahun yang lalu, banyak hal ditutup, tetapi segalanya agak terbuka. Kami melihat banyak LLM dan model difusi yang keren membuka,” Farbman merefleksikan. “Saya lebih optimis sekarang daripada setengah tahun yang lalu.”

Strategi open-source juga membantu mempercepat penelitian dan peningkatan. “Rasionalitas utama untuk open-sourcing adalah untuk mengurangi biaya R&D Anda,” jelas Farbman. “Ada banyak orang di dunia akademis yang menggunakan model, menulis makalah, dan Anda mulai menjadi kurator ini yang memahami di mana emas asli berada.”

Bagaimana Kemitraan Getty dan Shutterstock membantu menyelesaikan tantangan hak cipta AI

Ketika tantangan hukum meningkat terhadap perusahaan AI yang menggunakan data pelatihan yang tergores, Lightricks telah mengamankan kemitraan dengan Getty Images dan Shutterstock untuk mengakses konten berlisensi untuk pelatihan model.

“Mengumpulkan data untuk pelatihan model AI masih merupakan area abu -abu yang sah,” Farbman mengakui. “Kami memiliki pelanggan besar di segmen perusahaan kami yang peduli dengan hal -hal semacam ini, jadi kami perlu memastikan kami dapat memberikan model yang bersih untuk mereka.”

Kemitraan ini memungkinkan Lightricks untuk menawarkan model dengan risiko hukum yang berkurang untuk aplikasi komersial, berpotensi memberikan keuntungan di pasar perusahaan yang berkaitan dengan masalah hak cipta.

The Strategic Gamble: Why Lightricks menawarkan model AI canggih gratis untuk startup

Dalam langkah yang tidak biasa untuk industri AI, Lightricks menawarkan LTXV-13B gratis untuk melisensikan perusahaan dengan pendapatan tahunan di bawah $ 10 juta. Pendekatan ini bertujuan untuk membangun komunitas pengembang dan perusahaan yang dapat menunjukkan nilai model sebelum monetisasi.

“Pemikirannya adalah bahwa akademisi lepas kait. Orang -orang ini dapat melakukan apa pun yang mereka inginkan dengan model,” kata Farbman. “Dengan startup dan industri, Anda ingin menciptakan situasi win-win. Saya tidak berpikir Anda dapat menghasilkan banyak uang dari komunitas seniman yang bermain dengan barang-barang AI.”

Untuk perusahaan besar yang menemukan kesuksesan dengan model ini, Lightricks berencana untuk menegosiasikan perjanjian lisensi yang mirip dengan bagaimana mesin game menagih pengembang yang sukses. “Begitu mereka mencapai sepuluh juta pendapatan, kita akan datang untuk berbicara dengan mereka tentang lisensi,” jelas Farbman.

Terlepas dari kemajuan yang diwakili oleh LTXV-13B, Farbman mengakui bahwa generasi video AI masih memiliki keterbatasan. “Jika kita jujur ​​dengan diri kita sendiri dan melihat model teratas, kita masih jauh dari film -film Hollywood. Mereka belum ada di sana,” katanya.

Namun, ia melihat aplikasi praktis langsung di bidang-bidang seperti animasi, di mana para profesional kreatif dapat menggunakan AI untuk menangani aspek produksi yang memakan waktu. “Ketika Anda berpikir tentang biaya produksi animasi kelas atas, karya kreatif yang sebenarnya, orang-orang yang berpikir tentang kerangka kunci dan ceritanya, adalah sebagian kecil dari anggaran. Tetapi pembingkaian utama adalah sumber daya yang besar,” kata Farbman.

Ke depan, Farbman memprediksi perbatasan berikutnya adalah model video multimodal yang mengintegrasikan berbagai jenis media dalam ruang laten bersama. “Ini akan menjadi musik, audio, video, dll. Dan kemudian hal -hal seperti melakukan sinkronisasi bibir yang baik akan lebih mudah. ​​Semua hal ini akan hilang. Anda akan memiliki model multimoda ini yang tahu cara beroperasi di semua modalitas yang berbeda ini.”

LTXV-13B sekarang tersedia sebagai rilis open-source dan sedang diintegrasikan ke dalam aplikasi kreatif Lightricks, termasuk platform bercerita andalannya, LTX Studio.

Wawasan harian tentang kasus penggunaan bisnis dengan VB setiap hari

Jika Anda ingin mengesankan bos Anda, VB Daily telah Anda liput. Kami memberi Anda sendok dalam tentang apa yang dilakukan perusahaan dengan AI generatif, dari pergeseran peraturan hingga penyebaran praktis, sehingga Anda dapat berbagi wawasan untuk ROI maksimum.

Baca Kebijakan Privasi Kami

Terima kasih telah berlangganan. Lihat lebih banyak buletin VB di sini.

Kesalahan terjadi.

...more
View all episodesView all episodes
Download on the App Store

shauncastic.comBy Shauncastic!