تقوم جوجل بمعاينة نموذج Gemini AI جديد مصمم للتنقل والتفاعل مع الويب عبر المتصفح، مما يسمح لوكلاء الذكاء الاصطناعي بالقيام بأشياء داخل واجهات مصممة للاستخدام من قبل الأشخاص وليس الروبوتات. يستخدم النموذج، المسمى Gemini 2.5 Computer Use، “قدرات الفهم البصري والاستدلال” لتحليل طلب المستخدم وتنفيذ مهمة، مثل ملء نموذج وإرساله.
يمكن استخدامه لاختبار واجهة المستخدم أو للتنقل بين الواجهات المصممة للأشخاص الذين ليس لديهم واجهة برمجة التطبيقات (API) أو أي اتصال مباشر آخر متاح. تم استخدام إصدارات أخرى من هذا النموذج لميزات الوكيل في AI Mode وProject Mariner، وهو نموذج بحثي يستخدم وكلاء الذكاء الاصطناعي لتنفيذ المهام بمفرده في المتصفح، مثل إضافة عناصر إلى سلة التسوق الخاصة بك بناءً على قائمة المكونات.
يأتي إعلان Google بعد يوم واحد فقط من كشف OpenAI عن تطبيقات جديدة لـ ChatGPT كجزء من يوم التطوير السنوي، ويستمر في تركيز اهتمامه على ميزة ChatGPT Agent التي يمكنها إكمال المهام المعقدة على جهازك.