
رقمنة
دخلت شركة Video Rebirth المنافسة المباشرة مع كبرى شركات التكنولوجيا في سباق الذكاء الاصطناعي، بعدما جمعت 80 مليون دولار في جولة تمويل شارك فيها كل من AMD وهيونداي موتور. وتسعى الشركة حاليًا إلى تطوير نموذج عالم (World Model) قادر على إنشاء بيئات ثلاثية الأبعاد تفاعلية في الوقت الفعلي، في خطوة تستهدف دفع تقنيات الفيديو المولد بالذكاء الاصطناعي إلى مرحلة جديدة.
كيف حجزت Video Rebirth لنفسها مكانًا وسط سباقات الذكاء الاصطناعي؟
على الورق، تبدو Video Rebirth أصغر من أن تنافس في سباقات الذكاء الاصطناعي ذات التكلفة العالية. فالشركة، التي لم يتجاوز عمرها عامين، جمعت 80 مليون دولار فقط، ويعمل لديها 30 موظفًا موزعين بين مقرها في سنغافورة ومكتبها في هونغ كونغ، بينما تتطلب نماذج الفيديو المتقدمة عشرات الملايين من الدولارات للتدريب، ومبالغ أكبر لتشغيلها.
لكن الواقع سار في اتجاه مختلف. فقبل أسابيع من الإطلاق الرسمي لنموذجها “Bach” في مايو/أيار، تمكنت الشركة من اقتحام قائمة أفضل نماذج تحويل النص إلى فيديو على مؤشر Artificial Analysis، محتلة المركز السادس خلف شركات التكنولوجيا الكبرى مثل علي بابا وByteDance وKuaishou Technology وxAI. والأكثر لفتًا، أن Bach أصبح أعلى نموذج مملوك لشركة ناشئة في التصنيف، مع أقل تكلفة لإنتاج دقيقة فيديو بين أفضل 10 نماذج.
وقال ليو وي، الشريك المؤسس والرئيس التنفيذي لشركة Video Rebirth، إن الأداء الذي حققته الشركة رغم صغر حجم فريقها يؤكد نجاح نهجها التقني في تطوير نماذج الذكاء الاصطناعي.
وأضاف أن تطوير محركات الفيديو بالذكاء الاصطناعي ليس سوى البداية، إذ تسعى الشركة إلى تدريب نماذج قادرة على إنتاج مشاهد واقعية تخضع لقوانين الفيزياء، تمهيدًا لبناء ما يُعرف بـ”النموذج العالمي” (World Model). ويعد هذا المجال من أبرز ساحات المنافسة بين شركات مثل غوغل وميتا وOpenAI، نظرًا لإمكاناته في إحداث تحول في قطاعات مثل القيادة الذاتية والروبوتات والألعاب. ويؤكد ليو أن شركته تعمل على تطوير نموذج قادر على فهم البيئة المحيطة والتنبؤ بما سيحدث لاحقًا، بطريقة تحاكي قدرة الإنسان على استنتاج النتائج اعتمادًا على المنطق والخبرة.
ولا يرى ليو وي أن مستقبل شركته يكمن في إنتاج الفيديوهات فحسب، بل في ما يمكن أن تقود إليه هذه التقنية. ويقول إن Video Rebirth تستخدم توليد الفيديو كوسيلة لبناء “نموذج عالمي” قادر على فهم العالم ومحاكاته، مضيفًا: “خلال ثلاث سنوات، سنثبت أن العالم الفيزيائي يمكن محاكاته في الوقت الفعلي”.
استقطاب المستثمرين
ولتحقيق هذا الهدف، أغلقت الشركة في مارس/آذار جولة تمويل تأسيسية بقيمة 80 مليون دولار، من دون الإفصاح عن تقييمها. وجذبت الجولة مستثمرين من قطاعات الرقائق والسيارات والألعاب ورأس المال الجريء، من بينهم AMD Ventures، وZER01NE التابعة لمجموعة هيونداي موتور، وHiven المرتبطة بمجموعة CJ، وشركة Actoz Soft، إلى جانب Qiming Venture Partners وGaw Capital، في إشارة إلى اتساع الاهتمام العالمي بالرهان على تقنيات “النموذج العالمي”.
ولا يبدو أن Video Rebirth تنوي التوقف عند جولة التمويل الأخيرة، إذ تؤكد أنها تستعد لجمع تمويل جديد خلال يوليو/تموز، من دون الكشف عن تفاصيله.
وتستهدف الشركة حاليًا عملاء من قطاعات الإعلان والترفيه وصناعة الأفلام والألعاب عبر نموذجها “Bach”. ويتميز النموذج بقدرته على إنتاج فيديوهات متعددة المشاهد تصل مدتها إلى 45 ثانية اعتمادًا على صور مرجعية وأوامر نصية، متفوقًا على نموذج Seedance 2.0 من ByteDance، الذي يقتصر على 15 ثانية لكل فيديو متعدد المشاهد. كما يوفر Bach إمكانات أخرى، مثل إنتاج مقاطع تصل إلى 10 ثوانٍ من النصوص أو الصور، وربط شخصية ثابتة بفيديو مرجعي للحفاظ على اتساقها عبر المشاهد.
وتنافس Video Rebirth في سوق مزدحم وشديد الكلفة، إذ يتطلب توليد الفيديو بالذكاء الاصطناعي قدرات حوسبة تفوق بكثير تلك اللازمة لتوليد النصوص.
وتجلت كلفة هذا السباق عندما قررت اوبن ايه اي في مارس/آذار إغلاق منصة Sora بشكل مفاجئ، رغم أن التطبيق كان قد سجل نحو 10 ملايين عملية تنزيل منذ إطلاقه في سبتمبر/أيلول، وأبرم اتفاقية أسهم وترخيص بقيمة مليار دولار مع شركة والت ديزني، أُلغيت لاحقًا. وكانت فوربس قد قدرت في نوفمبر/تشرين الثاني أن OpenAI كانت تنفق نحو 15 مليون دولار يوميًا لإنتاج ملايين مقاطع الفيديو التي تبلغ مدة كل منها 10 ثوانٍ استجابة لطلبات المستخدمين، بتكلفة تقارب 1.30 دولار لكل مقطع.
ويرى ليو وي أن ارتفاع تكلفة تشغيل النماذج بعد تدريبها كان أحد أبرز التحديات التي واجهت OpenAI، مشيرًا إلى أن تكلفة إنتاج مقطع فيديو مدته 10 ثوانٍ عبر نموذج “Bach” أقل بكثير من النماذج المتقدمة المنافسة، لكنه امتنع عن الكشف عن الرقم الدقيق لأسباب تنافسية.
وأوضح أن الشركة نجحت في خفض تكاليف التشغيل بفضل تقنية خاصة طورتها، قال إنها تسرّع عملية توليد الفيديو بما يصل إلى 10 أضعاف. وتعتمد التقنية، التي تحمل اسم “Multi-Step Sampling Loss”، على تدريب النموذج على توقع الأخطاء وتصحيحها أثناء عملية التوليد، ما يقلل عدد الخطوات اللازمة لإنتاج الفيديو النهائي، في حين تحتاج النماذج التقليدية إلى خطوات أكثر لأنها لا تستطيع التنبؤ بهذه الأخطاء مسبقًا.
ويؤكد ليو وي أن الشركة لم تكتف بخفض تكاليف تشغيل النموذج، بل نجحت أيضًا في تقليص تكاليف تدريبه، مشيرًا إلى أن تطوير “Bach” استلزم “جزءًا بسيطًا” من الميزانية التي تتطلبها النماذج المنافسة، من دون الكشف عن أرقام محددة.
وأوضح أن الشركة اعتمدت على تدريب النموذج باستخدام عدد أقل من مقاطع الفيديو، لكنها ركزت على محتوى أعلى جودة، شمل أفلامًا ومقاطع موسيقية مرخصة، إلى جانب مقاطع صورتها داخليًا، معظمها بدقة 720p. كما صُمم “Bach” لفصل مهمة فهم التعليمات النصية عن مهمة توليد المشاهد، بدلًا من الاعتماد على نموذج واحد لتنفيذ المهمتين، وهو ما أسهم في تحسين كفاءة استخدام القدرات الحاسوبية.
وفي تعليق على هذه التصريحات، قالت OpenAI إن فريق Sora يعيد توجيه جهوده نحو أبحاث محاكاة العالم لدعم تطبيقات الروبوتات والمهام الفيزيائية في العالم الحقيقي.
وأضاف ليو أن نموذج Bach يتميز أيضًا بقدرته على إنتاج فيديوهات تراعي قوانين الفيزياء، مثل الجاذبية وتصادم الأجسام والإضاءة، وهي من أبرز التحديات التي تواجه نماذج الفيديو الحالية. كما أشار إلى أن النموذج يحافظ على اتساق المنتجات في الإعلانات التجارية، ويقدم تعبيرات وجه ومشاهد بصرية تناسب احتياجات صناع الأفلام. وكانت شركة Hiven قد أعلنت في مارس/آذار أنها تتوقع التعاون مع Video Rebirth عبر شركات مجموعة CJ، بما في ذلك CJ ENM المتخصصة في إنتاج الدراما والأفلام الكورية.
آفاق مشرقة
عندما أدرك ليو أن موجة جديدة من الذكاء الاصطناعي بدأت تتشكل بعيدًا عن النماذج اللغوية التقليدية، لم يتردد في اتخاذ قرار قد يبدو محفوفًا بالمخاطر. ففي سبتمبر/أيلول 2024، غادر منصبه المرموق في تينسنت، متخليًا عن وظيفة ذات دخل مرتفع، ليراهن على ما يصفه بفرصة استثنائية في مجال “الذكاء الاصطناعي الفيزيائي”.
ومن أجل تحويل هذه الرؤية إلى شركة ناشئة، أسس Video Rebirth بمساعدة فريق يضم أسماء تمتلك خبرات متنوعة في الذكاء الاصطناعي والتمويل والاستثمار. فقد انضم إليه لي ديفو، المدير السابق لمختبر الذكاء الاصطناعي في تينسنت، إلى جانب ليو بينغ القادم من جيه بي مورغان تشيس، ودان كونغ الذي سبق له العمل مديرًا في صندوق 42X Fund التابع لشركة G42 المدعومة من أبوظبي.
لكن ليو لا يتوقع أن يتحقق النجاح بين ليلة وضحاها. فعلى عكس الحماس الذي يحيط بالتقنيات الجديدة، يرى أن “نماذج العالم”، وهي نماذج ذكاء اصطناعي تسعى إلى فهم البيئة المحيطة ومحاكاتها رقميًا، ستحتاج إلى وقت طويل قبل أن تصل إلى مرحلة الانتشار الواسع. ويستشهد بما حدث مع النماذج اللغوية الكبيرة، التي استغرقت أكثر من عشرين عامًا للانتقال من إطار نظري ظهر في ورقة بحثية عام 2003 إلى تقنية غيّرت العالم.
ولهذا يعتقد أن العام المقبل سيبقى في معظمه عام الاختبارات والاختراقات العلمية داخل المختبرات، أكثر من كونه عام التبني الجماهيري أو التطبيقات التجارية الواسعة.
ورغم ذلك، لا يبدو أن عامل الوقت يثير قلقه. فبالنسبة إليه، لا يتعلق الأمر بسباق قصير المدى، بل ببناء تقنية يعتقد أنها ستصبح جزءًا أساسيًا من مستقبل الذكاء الاصطناعي.
ويقول بثقة: “أعتزم تكريس كامل طاقتي للبحث والتطوير حتى أنجح في تطوير نموذج يحقق قيمة تجارية فعلية، وأنا على يقين بأن هذه اللحظة قادمة”.
فوربس الشرق الاوسط
ترجمة: إيمان فوزي نوفل




