6 أشهر
"Nano Banana Pro".. كيف تنشئ صوراً احترافية بالذكاء الاصطناعي؟
السبت، 22 نوفمبر 2025
أطلقت غوغل رسمياً أحدث نماذجها الخاصة بتوليد الصور بالذكاء الاصطناعي "Nano Banana Pro"، وهو نموذج متقدم يعتمد على قدرات "Gemini 3" ويستهدف المصممين والمبدعين الراغبين في إنشاء صور دقيقة وواقعية مع تحكم فني واسع في التفاصيل.
ويُعد النموذج الجديد خطوة بارزة في جهود غوغل لتطوير أدوات الإبداع الرقمي؛ إذ لا يكتفي بتوليد الصور، بل يمنح المستخدم إمكانية ضبط الإضاءة وزوايا التصوير والأنماط الفنية، إضافة إلى دمج النصوص والتفاصيل التقنية داخل الصورة بدقة كبيرة.
وبات النموذج متاحاً عالمياً داخل تطبيق "Gemini(link is external)" عبر خيار Create image باستخدام نموذج Thinking، ما يتيح للمستخدمين تجربته ابتداءً من هذا الأسبوع.
"Nano Banana Pro".. كيف تنشئ صوراً احترافية بالذكاء الاصطناعي؟
وضع الرؤية.. الأساس لإنشاء صور دقيقة
لتسهيل الوصول إلى أفضل النتائج، توصي غوغل(link is external) بتضمين مجموعة عناصر داخل التوجيهات النصية قبل توليد الصورة، أبرزها:
الموضوع: تحديد ما يجب أن يظهر بوضوح (مثل: روبوت بملامح جامدة، أو قط يرتدي قبعة ساحر).
التكوين: زاوية التصوير (لقطة واسعة، بورتريه، زاوية منخفضة).
الحركة: ما الذي يحدث داخل الصورة (صبّ القهوة، قيادة سيارة، الجري).
الموقع: مكان المشهد (مقهى على سطح المريخ، مكتبة مزدحمة، حديقة مفتوحة).
الأسلوب الفني: مثل الرسوم ثلاثية الأبعاد، اللوحات المائية، أو التصوير الواقعي.
تعليمات التحرير: مثل تغيير لون جسم ما أو إزالة عنصر من الخلفية.
وتؤكد الشركة أن إضافة هذه التفاصيل تُعد المفتاح للحصول على صور متناسقة واحترافية.
ضبط التفاصيل.. الطريق نحو نتائج واقعية
تشير غوغل إلى أن رفع مستوى الاحترافية يتطلب أوامر أكثر دقة، مثل:
التكوين ونسب الأبعاد: مثال: "ملصق عمودي 16:9" أو "صورة سينمائية عريضة 21:9".
الإضاءة وزوايا الكاميرا: مثل "إضاءة الساعة الذهبية"، "بُعد بؤري f/1.8"، "ظلال طويلة".
دمج النصوص بدقة: تحديد الخط والمكان مثل "عنوان أبيض عريض أعلى الصورة".
الدقة العلمية: لطلب رسوم بيانية أو مخططات دقيقة دون تشويه.
الصور المرجعية: تحديد دور كل صورة عند دمج أكثر من صورة لبناء مشهد واحد.
قدرات "Nano Banana Pro"
تؤكد غوغل أن النموذج الجديد "Nano Banana Pro" يقدم مجموعة واسعة من الميزات، أبرزها توليد صور تتضمن نصوصاً واضحة وملائمة للاستخدام في الملصقات، إلى جانب إنتاج صور دقيقة اعتماداً على المعرفة الواقعية المدمجة في نموذج Gemini 3 Pro.
ويتيح النموذج أيضاً ترجمة النصوص داخل الصور، إضافة إلى التحكم في الإضاءة وزوايا الكاميرا للحصول على نتائج سينمائية، فضلاً عن إنتاج صور بدقات 1K و2K و4K، وقدرته على دمج 6 إلى 14 صورة لضمان اتساق الشخصيات والمشاهد في المخرجات النهائية.
ورغم التطور الكبير الذي يقدمه "Nano Banana Pro"، توضح غوغل أن النموذج ما يزال يواجه بعض التحديات التقنية، إذ قد تظهر أخطاء في النصوص الصغيرة المدمجة داخل الصور بين حين وآخر.
Loading ads...
كما يمكن أن تتراجع دقة المحتوى عند ترجمة النصوص إلى لغات متعددة، ولا سيما اللغات ذات البنية المعقدة، في حين قد تؤدي التعديلات المتقدمة إلى تشوهات غير طبيعية في بعض اللقطات، إضافة إلى احتمال فقدان الاتساق بين ملامح الشخصيات عند إجراء تغييرات متتالية على الصورة ذاتها.
لقراءة المقال بالكامل، يرجى الضغط على زر "إقرأ على الموقع الرسمي" أدناه





