الجزء أي شيء، الذي تم إصداره مؤخرًا بواسطة Facebook Research ، يفعل شيئًا وجده معظم الأشخاص الذين انغمسوا في رؤية الكمبيوتر أمرًا شاقًا: معرفة موثوقة أي وحدات البكسل في الصورة تنتمي إلى كائن. جعل ذلك أسهل هو الهدف من نموذج Segment Anything Model (SAM) ، الذي تم إصداره مؤخرًا بموجب ترخيص Apache 2.0.
النتائج تبدو رائعة ، وهناك عرض تفاعلي متاح حيث يمكنك اللعب بالطرق المختلفة التي يعمل بها SAM. يمكن للمرء أن ينتقي الأشياء عن طريق الإشارة والنقر على صورة ، أو يمكن تقسيم الصور تلقائيًا. بصراحة ، من المثير للإعجاب رؤية SAM يجعل إخفاء الكائنات المختلفة في صورة ما يبدو بلا مجهود. ما يجعل هذا ممكنًا هو التعلم الآلي ، وجزء من ذلك هو حقيقة أن النموذج الذي يقف وراء النظام قد تم تدريبه على مجموعة بيانات ضخمة من الصور والأقنعة عالية الجودة ، مما يجعلها فعالة للغاية في ما تفعله.
بمجرد تقسيم الصورة ، يمكن استخدام هذه الأقنعة للتفاعل مع أنظمة أخرى مثل اكتشاف الكائنات (التي تحدد وتسمي ماهية الكائن) وتطبيقات رؤية الكمبيوتر الأخرى. يعمل هذا النظام بشكل أكثر قوة إذا كانوا يعرفون بالفعل أين يبحثون ، بعد كل شيء. هذا مشاركة مدونة من Meta AI يخوض في بعض التفاصيل الإضافية حول ما هو ممكن مع SAM ، والتفاصيل الكاملة في ورقة البحث.
تعتمد مثل هذه الأنظمة على مجموعات بيانات عالية الجودة. بالطبع ، لا شيء يتفوق على مجموعة كبيرة من بيانات العالم الحقيقي ، لكننا رأينا أيضًا أنه من الممكن إنشاء بيانات آلية لم تكن موجودة في الواقع ، والحصول على نتائج مفيدة.
“مدمن السفر. فخور بالتواصل. خبير مستقل في ثقافة البوب. رجل أعمال.”
More Stories
هذا الشاحن المصنوع من GaN بقوة 100 واط رقيق وقابل للطي
كو: ترقية ذاكرة الوصول العشوائي إلى 12 جيجابايت في العام المقبل ستقتصر على iPhone 17 Pro Max
تعود Verdansk أخيرًا إلى Call of Duty Warzone، والمعجبون سعداء بذلك