تعمل شركة الذكاء الاصطناعي التابعة لشركة Elon Musk، xAI، على إضافة مدخلات متعددة الوسائط إلى برنامج Grok chatbot الخاص بها، وفقًا لوثائق المطور العامة. ما يعنيه هذا هو أنه قد يتمكن المستخدمون قريبًا من تحميل الصور إلى Grok وتلقي إجابات نصية.
في مستندات المطورين، يوضح نموذج نص Python كيف يمكن للمطورين استخدام مكتبة أدوات تطوير برامج xAI لإنشاء استجابة تعتمد على كل من النصوص والصور. يقرأ هذا البرنامج النصي ملف صورة، ويقوم بإعداد مطالبة نصية، ويستخدم x.AI SDK لإنشاء استجابة.
يعد هذا تحديثًا كبيرًا لـ Grok، الذي تم إصداره بواسطة xAI لأول مرة في نوفمبر 2023 وهو متاح للمستخدمين الذين يدفعون مقابل اشتراك X Premium Plus. آخر تحديث كان Grok 1.5 في مارس، والذي جاء مزودًا بقدرات تفكير محسنة.
تم تدريب النموذج “على مجموعة متنوعة من البيانات النصية من المصادر المتاحة للجمهور من الإنترنت حتى الربع الثالث من عام 2023 ومجموعات البيانات التي تمت مراجعتها وتنظيمها من قبل … مراجعين بشريين”، وفقًا لمنشور مدونة من X. ولم يتم تدريب Grok-1 على بيانات X…