يستخدم PaLM 2 من Google ما يقرب من خمسة أضعاف البيانات النصية مقارنة بالسابق

يستخدم نموذج اللغة الكبيرة PaLM 2 من Google ما يقرب من خمسة أضعاف كمية البيانات النصية للتدريب مثل سابقتها LLM ، حسبما علمت CNBC.
في الإعلان عن PaLM 2 الأسبوع الماضي ، قالت Google إن النموذج أصغر من PaLM السابق ولكنه يستخدم “تقنية” أكثر كفاءة.
أصبح الافتقار إلى الشفافية حول بيانات التدريب في نماذج الذكاء الاصطناعي موضوعًا ساخنًا بشكل متزايد بين الباحثين.

سوندار بيتشاي ، الرئيس التنفيذي لشركة Alphabet Inc. ، خلال مؤتمر Google I / O Developers في ماونتن فيو ، كاليفورنيا ، يوم الأربعاء ، 10 مايو 2023.

ديفيد بول موريس | بلومبرج | صور جيتي

علمت CNBC أن نموذج اللغة الكبير الجديد من Google ، الذي أعلنت عنه الشركة الأسبوع الماضي ، يستخدم ما يقرب من خمسة أضعاف بيانات التدريب التي استخدمها سابقتها من عام 2022 ، مما يسمح لها بأداء مهام أكثر تقدمًا في الترميز والرياضيات والكتابة الإبداعية.

تم تدريب PaLM 2 ، نموذج الشركة الجديد للغة كبيرة الاستخدام العام (LLM) الذي تم الكشف عنه في Google I / O ، على 3.6 تريليون رمز ، وفقًا للوثائق الداخلية التي شاهدتها CNBC. الرموز ، وهي سلاسل من الكلمات ، هي لبنة مهمة لتدريب LLM ، لأنها تعلم النموذج أن يتنبأ بالكلمة التالية التي ستظهر في تسلسل.

تم إصدار إصدار Google السابق من PaLM ، والذي يمثل نموذج لغة Pathways ، في عام 2022 وتم تدريبه على 780 مليار رمز مميز.

بينما كانت Google حريصة على إظهار قوة تقنية الذكاء الاصطناعي الخاصة بها وكيف يمكن دمجها في البحث ورسائل البريد الإلكتروني ومعالجة النصوص وجداول البيانات ، لم تكن الشركة راغبة في نشر الحجم أو التفاصيل الأخرى لبيانات التدريب الخاصة بها. كما حافظت شركة OpenAI ، الشركة المبتكرة ChatGPT المدعومة من Microsoft ، أيضًا على سرية تفاصيل أحدث لغة LLM تسمى GPT-4.

READ يُظهر تحديث طريقة اللعب في Cyberpunk 2077 2.0 تغييرات هائلة في العمل

وتقول الشركات إن سبب عدم الإفصاح هو الطبيعة التنافسية للأعمال. يسارع كل من Google و OpenAI لجذب المستخدمين الذين قد يرغبون في البحث عن معلومات باستخدام روبوتات المحادثة بدلاً من محركات البحث التقليدية.

ولكن مع احتدام سباق التسلح في مجال الذكاء الاصطناعي ، يطالب مجتمع البحث بمزيد من الشفافية.

منذ الكشف عن PaLM 2 ، قالت Google إن النموذج الجديد أصغر من LLMs السابقة ، وهو أمر مهم لأنه يعني أن تكنولوجيا الشركة أصبحت أكثر كفاءة أثناء إنجاز مهام أكثر تعقيدًا. يتم تدريب PaLM 2 ، وفقًا للوثائق الداخلية ، على 340 مليار معلمة ، وهو مؤشر على مدى تعقيد النموذج. تم تدريب PaLM الأولي على 540 مليار معلمة.

لم تقدم Google تعليقًا على الفور على هذه القصة.

جوجل قال في منشور مدونة حول PaLM 2 ، يستخدم النموذج “تقنية جديدة” تسمى “مقياس الحوسبة الأمثل”. هذا يجعل LLM “أكثر كفاءة مع أداء أفضل بشكل عام ، بما في ذلك استدلال أسرع ، ومعلمات أقل للخدمة ، وتكلفة خدمة أقل.”

عند الإعلان عن PaLM 2 ، أكدت Google تقارير CNBC السابقة بأن النموذج مدرب على 100 لغة ويؤدي مجموعة واسعة من المهام. يتم استخدامه بالفعل لتشغيل 25 ميزة ومنتجات ، بما في ذلك chatbot Bard التجريبي للشركة. إنه متوفر بأربعة أحجام ، من الأصغر إلى الأكبر: Gecko و Otter و Bison و Unicorn.

يعتبر PaLM 2 أقوى من أي نموذج موجود ، يعتمد على الإفصاحات العامة. LLM على Facebook يسمى LLaMA ، وهو أعلن في فبراير ، تم تدريبه على 1.4 تريليون توكن. كانت آخر مرة شاركت فيها OpenAI حجم تدريب ChatGPT مع GPT-3 ، عندما قالت الشركة إنها تدربت على 300 مليار رمز في ذلك الوقت. أصدرت شركة OpenAI GPT-4 في مارس ، وقالت إنها تعرض “أداءً على مستوى الإنسان” في العديد من الاختبارات المهنية.

READ يقول Helldivers 2 Dev إنه لن يضيف "PvP" أبدًا لأنه يريد "تقليل العناصر السامة" من المجتمع

LaMDA ، محادثة LLM أن Google قدَّم قبل عامين وتم الترويج له في فبراير جنبًا إلى جنب مع Bard ، تم تدريبه على 1.5 تريليون رمز ، وفقًا لأحدث الوثائق التي اطلعت عليها CNBC.

مع وصول تطبيقات الذكاء الاصطناعي الجديدة إلى الاتجاه السائد بسرعة ، تزداد الجدل الدائر حول التكنولوجيا الأساسية.

المهدي المحمدي ، أحد كبار علماء الأبحاث في Google ، استقال في فبراير حول افتقار الشركة للشفافية. يوم الثلاثاء ، أدلى الرئيس التنفيذي لشركة OpenAI ، سام ألتمان ، بشهادته في جلسة استماع للجنة الفرعية القضائية التابعة لمجلس الشيوخ بشأن الخصوصية والتكنولوجيا ، واتفق مع المشرعين على أن هناك حاجة إلى نظام جديد للتعامل مع الذكاء الاصطناعي.

قال ألتمان: “بالنسبة لتقنية جديدة جدًا ، نحتاج إلى إطار عمل جديد”. “بالتأكيد تتحمل شركات مثل شركتنا الكثير من المسؤولية عن الأدوات التي نضعها في العالم.”

– ساهم جوردان نوفيت من سي إن بي سي في هذا التقرير.

يشاهد: دعا سام ألتمان ، الرئيس التنفيذي لشركة OpenAI ، إلى الإشراف على الذكاء الاصطناعي

Mariam Al-Farsi

مريم الفارسي كاتبة في موقع alqraralaraby.news، تغطي موضوعات الأخبار والسياسة والأعمال والتكنولوجيا والرياضة والترفيه وأسلوب الحياة. تركز على تقديم معلومات واضحة ومفيدة، ومتابعة المستجدات والأحداث الجارية، مع إبراز القصص والموضوعات التي تهم القرّاء، بأسلوب مهني يجمع بين الدقة والوضوح وسهولة الفهم.

سوني تتجه إلى التوزيع الرقمي الكامل لألعاب بلاي ستيشن بحلول 2028

معادلة جديدة في سوق الهواتف الذكية.. هل تنجح شاومي في مزاحمة أبل وسامسونغ؟

ضغوط تطوير GTA 6 تعيد الجدل حول بيئة العمل في صناعة الألعاب

شلالات الدم في القارة القطبية الجنوبية.. ظاهرة طبيعية تكشف أسرار عالم معزول منذ 1.5 مليون عام

ماذا ينتظر الأرض بعد موت الشمس؟ اكتشاف فلكي غير مسبوق يقرّب العلماء من الإجابة

سوني تتجه إلى التوزيع الرقمي الكامل لألعاب بلاي ستيشن بحلول 2028

نجوم الفن يحتفلون بزفاف ابنة شقيق عماد زيادة عند سفح الأهرامات

اترك تعليقاً إلغاء الرد

قصص أخرى

سوني تتجه إلى التوزيع الرقمي الكامل لألعاب بلاي ستيشن بحلول 2028

معادلة جديدة في سوق الهواتف الذكية.. هل تنجح شاومي في مزاحمة أبل وسامسونغ؟

ضغوط تطوير GTA 6 تعيد الجدل حول بيئة العمل في صناعة الألعاب

ربما فاتك

شلالات الدم في القارة القطبية الجنوبية.. ظاهرة طبيعية تكشف أسرار عالم معزول منذ 1.5 مليون عام

ماذا ينتظر الأرض بعد موت الشمس؟ اكتشاف فلكي غير مسبوق يقرّب العلماء من الإجابة

سوني تتجه إلى التوزيع الرقمي الكامل لألعاب بلاي ستيشن بحلول 2028

نجوم الفن يحتفلون بزفاف ابنة شقيق عماد زيادة عند سفح الأهرامات