
أعلنت شركة قوقل عن إضافة أداة “Select from screen” إلى جيميناي “Gemini” في متصفح “قوقل كروم” Chrome، بالتزامن مع توفير قدرات التحكم بالحاسوب داخل نموذج Gemini 3.5 Flash للمطورين.
وتأتي هذه الخطوة ضمن جهود الشركة لتوسيع إمكانيات جيميناي وتحويله إلى مساعد أكثر قدرة على فهم المحتوى والتفاعل معه داخل مختلف البيئات الرقمية.
أداة Select from Screen تصل إلى متصفح قوقل كروم
أضافت قوقل أداة جديدة تحمل اسم Select from Screen داخل جيميناي في متصفح قوقل كروم.
وتظهر الأداة ضمن قائمة الإضافات (+) الموجودة داخل واجهة جيميناي، حيث تتيح للمستخدم تحديد أي نص أو صورة من الصفحة المفتوحة وإرسالها مباشرة إلى Gemini ضمن الطلب.
وعند تفعيل الميزة، يقوم المتصفح بتظليل الصفحة الحالية مع إظهار رسالة تطلب من المستخدم اختيار النص أو الصورة التي يريد الاستفسار عنها.
بعد ذلك يتم إدراج العنصر المحدد تلقائيًا داخل مربع المحادثة ليتمكن جيميناي من تحليله أو الإجابة عن الأسئلة المتعلقة به.
وأوضحت قوقل أن الميزة بدأت بالوصول ضمن إصدار متصفح قوقل كروم رقم 149، وقد تتطلب إعادة تشغيل المتصفح حتى تظهر للمستخدمين.
نموذج Gemini 3.5 Flash يدعم التحكم بالحاسوب
بالتزامن مع ذلك، أعلنت قوقل عن إضافة أداة Computer Use بشكل مدمج داخل نموذج Gemini 3.5 Flash.
وتحل هذه الإمكانية محل نموذج Gemini 2.5 Computer Use المستقل، حيث أصبحت قدرات التحكم بالحاسوب جزءًا من النموذج نفسه.
كما تنضم هذه الميزة إلى أدوات أخرى مدمجة داخل النموذج مثل:
- Search Grounding
- Maps Grounding

جيميناي في متصفح كروم
تطوير وكلاء ذكيين قادرين على تنفيذ المهام
تقول قوقل إن المطورين سيتمكنون من استخدام الإمكانيات الجديدة لبناء وكلاء ذكيين قادرين على:
- رؤية محتوى الشاشة.
- فهم وتحليل المعلومات.
- اتخاذ الإجراءات المناسبة.
- العمل عبر المتصفح والهواتف الذكية وأجهزة الكمبيوتر.
وتهدف هذه القدرات إلى دعم سيناريوهات الأتمتة المتقدمة والمهام الاحترافية التي تتطلب تنفيذ خطوات متعددة بشكل متتابع.
تحسين مهام الأتمتة والاختبارات البرمجية
وفقًا للشركة، يوفر Gemini 3.5 Flash أداءً أفضل في المهام طويلة المدى وعمليات الأتمتة المؤسسية.
وتشمل الاستخدامات المحتملة:
- الاختبارات البرمجية المستمرة.
- تحليل التطبيقات.
- تنفيذ مهام العمل الاحترافية.
- إدارة العمليات متعددة الخطوات.
وفي أحد الأمثلة التي عرضتها قوقل، استخدم Gemini قدرات Computer Use لتحليل تطبيق Gemini نفسه وإنشاء قائمة مصنفة بميزاته المختلفة.
مزايا أمان إضافية للشركات
قدمت قوقل أيضًا مجموعة من الضوابط الأمنية المخصصة لعملاء المؤسسات، تشمل:
- طلب موافقة المستخدم قبل تنفيذ العمليات الحساسة أو غير القابلة للتراجع.
- إيقاف المهام تلقائيًا عند اكتشاف محاولات حقن أوامر غير مباشرة (Prompt Injection).
وتهدف هذه الإجراءات إلى تعزيز موثوقية الأنظمة المعتمدة على الوكلاء الذكيين وتقليل المخاطر الأمنية المحتملة.
التوفر
أكدت قوقل أن إمكانيات Computer Use أصبحت متاحة بدءًا من اليوم عبر Gemini API للمطورين، بينما بدأ طرح أداة Select from Screen تدريجيًا لمستخدمي متصفح قوقل كروم إصدار رقم 149.
هل ترى أن دمج قدرات التحكم بالحاسوب داخل Gemini يمثل الخطوة التالية نحو وكلاء الذكاء الاصطناعي القادرين على تنفيذ المهام بشكل مستقل؟








