- لقد أذهل سام ألتمان صناعة الذكاء الاصطناعي مرة أخرى.
- كشفت شركة OpenAI يوم الخميس عن نموذجها الجديد لتحويل النص إلى فيديو Sora.
- لقد صدمت قدرة سورا على إنتاج مقاطع فيديو عالية الدقة شبكة الإنترنت.
لقد أذهل سام ألتمان صناعة الذكاء الاصطناعي. مرة أخرى.
هذه المرة، ليس بسبب أ طرد الصدمة من OpenAI، ولا هو بسبب أي شيء يتعلق به ChatGPT. بدلًا من ذلك، يرجع ذلك إلى نموذج الذكاء الاصطناعي الجديد كليًا والذي يُسمى Sora.
يوم الخميس هو قدم العالم إلى سورا، والتي تأخذ اسمها من الكلمة اليابانية التي تعني “سماء”، ويمكنها إنشاء مقاطع فيديو تصل مدتها إلى دقيقة واحدة من النص.
يقول OpenAI هدفه مع سورا هو تعليم الذكاء الاصطناعي كيفية “فهم ومحاكاة العالم المادي المتحرك، بهدف نماذج التدريب التي تساعد الأشخاص على حل المشكلات التي تتطلب تفاعلًا في العالم الحقيقي”.
هذه طريقة مملة بعض الشيء لوصف ما يستطيع النموذج فعله بالفعل. يمكنه إنشاء مقاطع فيديو عالية الدقة لكل شيء بدءًا من ولاية كاليفورنيا أثناء اندفاع الذهب في القرن التاسع عشر وحتى الرسوم المتحركة ثلاثية الأبعاد المشابهة لإنتاج Dreamworks. كل ما يطلبه منك هو رسالة نصية بسيطة.
ومن الجدير بالذكر أن هذه ليست المرة الأولى لهذا النوع من التكنولوجيا.
تمتلك شركة Runway الناشئة ومقرها نيويورك، والمدعومة من Google وNvidia، أداة تعتمد على الذكاء الاصطناعي تصنع الفيديو من النص. ميتا لديه شيء مماثل يسمى فيديو الايمو. في الشهر الماضي، كشفت جوجل عن نسختها من تحويل النص إلى فيديو والتي تسمى لوميير.
هل الضجة حولهم قابلة للمقارنة مع سورا؟ ليس تماما.
ويرجع ذلك جزئيًا إلى أن قيادة ألتمان مملوكة للقطاع الخاص OpenAI يمنحه الحرية في الترويج لهذه التكنولوجيا – على الرغم من أنها لا تزال قيد الاختبار بحثًا عن أي ضرر. (ملاحظة: إصدار Sora يقتصر على “أعضاء الفريق الأحمر” الذين سيختبرونه من حيث المخاطر، بالإضافة إلى فنانين بصريين وصانعي أفلام مختارين.)
ولهذا السبب فإن إعلانه عن Sora على وسائل التواصل الاجتماعي لم يتضمن فقط رابطًا تشعبيًا لمدونة تشرح نموذج الذكاء الاصطناعي الجديد؛ لقد تضمن التعامل المباشر مع الأشخاص الذين يتبعونه.
في X، تلقى طلبات سريعة من المستخدمين بشأن مقاطع الفيديو التي يرغبون في مشاهدتها والتي أنشأها Sora.
“نود أن نعرض لك ما يستطيع سورا فعله، يرجى الرد مع التسميات التوضيحية لمقاطع الفيديو التي ترغب في مشاهدتها وسنبدأ في إنشاء بعضها!” هو كتب. جاءت الطلبات تتدفق.
طلبت منه شخصية الإنترنت MrBeast مقطع فيديو لـ قرد يلعب الشطرنج في الحديقة. طلب آخر أن يرى المستردون الذهبيون يبثون على الجبل. طلب الرئيس التنفيذي لشركة لا شيء، كارل باي، مقطع فيديو لويل سميث وهو يتناول السباغيتي. لقد فعل الكثير من الأشخاص الآخرين ذلك أيضًا.
سلط نيكونج كوثاري، الشريك في شركة Khosla Ventures، الضوء على تأثير استراتيجية ألتمان من خلال مقارنتها بالطريقة التي شاركت بها جوجل تحديث ضخم لنموذج الذكاء الاصطناعي الخاص به، Gemini، عبر مدونة في نفس اليوم الذي تم فيه إطلاق سراح سورا.
جوجل تعلن عن شيء مذهل قال على X، من خلال توسيع “نافذة السياق” الخاصة بـ Gemini – عدد الكلمات التي يمكن لنموذج الذكاء الاصطناعي معالجتها حول رمز مستهدف – بما يصل إلى مليون. إنه تقدم هائل، لكنه تقدم لا تعرضه Google مثل Altman.
“لا يوجد ملعب، لا أستطيع أن أحاول ذلك بنفسي. “هناك بعض مقاطع الفيديو المثيرة للإعجاب في منشور المدونة، لكنها ليست مخصصة لي على الإطلاق”، كتب كوثاري على X، بينما سلط الضوء على أن ألتمان كان “يعرض” قدرات سورا من خلال تلقي الطلبات من الآخرين.
“سوف يطغى هذا إلى حد كبير على إنجازات Google المثيرة للإعجاب للغاية. قال كوثاري: “إن Google في موقف متأخر وتحتاج إلى “المشاركة” للاستحواذ على المشاركة الذهنية مرة أخرى”.
رغم ذلك، قد لا يستمر الضجيج لفترة طويلة.
قد يشكل إصدار نموذج ذكاء اصطناعي قادر على إنتاج مقاطع فيديو مثيرة للإعجاب تهديدات جديدة للصناعة الإبداعية، الأمر الذي أثار بالفعل مخاوف بشأن قدرة الذكاء الاصطناعي التوليدي على الاستيلاء على وظائفهم بعد الإضرابات التي شهدتها هوليوود العام الماضي.
يمكن أن يؤدي التبني الواسع النطاق لهذه التكنولوجيا أيضًا إلى إحداث فوضى في الانتخابات هذا العام إذا تم استخدامها من قبل جهات فاعلة سيئة تسعى إلى إنشاء مقاطع فيديو كاذبة لأمثال دونالد ترامب أو جو بايدن.
ومن المحتمل أن يؤدي ذلك إلى تجدد المطالب أيضًا بأن تكون شركة OpenAI شفافة بشأن البيانات التي تستخدمها لتدريب نماذجها بنفس الطريقة التي تتبعها النماذج مفتوحة المصدر.
لكن في الوقت الحالي، يقتنع الناس بالضجيج الذي يتحدث عنه ألتمان.
“مدمن السفر. فخور بالتواصل. خبير مستقل في ثقافة البوب. رجل أعمال.”
More Stories
هذا الشاحن المصنوع من GaN بقوة 100 واط رقيق وقابل للطي
كو: ترقية ذاكرة الوصول العشوائي إلى 12 جيجابايت في العام المقبل ستقتصر على iPhone 17 Pro Max
تعود Verdansk أخيرًا إلى Call of Duty Warzone، والمعجبون سعداء بذلك