كيف يمكن استخدام إنشاء صور AI باستخدام DALL · E 2 في التسويق الرقمي؟
نشرت: 2022-10-17"واو ، هل أخذت ذلك؟ انتظر لحظة - تم ذلك بواسطة مصور محترف ...؟ "
كان هذا هو رد فعل جيك ، مديرنا الطبي ، عندما عرضت عليه الصورة أدناه: صورة واقعية تم إنشاؤها بواسطة DALL · E 2 من OpenAI ، تم إنشاؤها في غضون ثوانٍ ، باستخدام موجه أدخلته لـ "صورة ماكرو لفراشة على زهرة عباد الشمس" .
إنها صورة تبدو حقيقية جدًا وقد التقطت حدة ولون الفراشة في المقدمة والتركيز الناعم لعباد الشمس في الخلفية. في الواقع ، لدرجة أنك ستتعرض لضغوط شديدة للعثور على العديد من الأشخاص الذين يمكنهم العثور على أي إشارات ذيل واضحة أو مصنوعات يدوية أو شعور بالخطأ ، والتي يمكن أن تكون شائعة في الصور التي تم إنشاؤها بواسطة الذكاء الاصطناعي.
كانت هذه هي اللحظة التي أدركت فيها أننا دخلنا إلى النقطة التي يمكن عندها لأنظمة الذكاء الاصطناعي المتقدمة أن تفهم وتخلق صورًا واقعية لا يمكن تمييزها في كثير من الحالات عن الحياة الواقعية. هذا له آثار مثيرة للاهتمام لأي شخص يعمل في الصناعات الإبداعية والرقمية ، أو في الواقع أي دور يتضمن مصادر الصور أو التلاعب بالصور.
في هذا المقال ، أستكشف بعض التطبيقات العملية لاستخدام OpenAI's DALL · E 2 في عالم التسويق الإبداعي والرقمي وكيف يمكن استخدام أدوات التحرير التي تمت ترقيتها مؤخرًا لـ DALL · E 2 لدعم العمل الإبداعي.
ما هو DALL · E 2؟
DALL · E 2 من OpenAI هو منشئ صور قائم على الذكاء الاصطناعي يأخذ نصًا بسيطًا موجهًا وينشئ صورًا بناءً على فهم الذكاء الاصطناعي لهذا الموجه. في غضون ثوانٍ ، ستحصل على أربعة أشكال مختلفة للصور يمكن تنزيلها أو مشاركتها أو حفظها كمفضلة في حساب OpenAI الخاص بك.
DALL · E 2 متاح الآن للجميع. تحصل على 15 رصيدًا مجانيًا شهريًا ، مع رصيد واحد مطلوب لكل جيل وكل 115 رصيدًا بتكلفة 15 دولارًا. يمكنك إنشاء صور من نقطة الصفر أو تحميل صورك الخاصة للتلاعب بشرط أن تتبع سياسة محتوى DALL · E 2 ، ووفقًا لشروط الاستخدام ، "يجوز لك استخدام Generations لأي غرض قانوني ، بما في ذلك الاستخدام التجاري".
هذا يجعل الإسناد موضوعًا مثيرًا للاهتمام ومقدار الفضل الذي يجب منحه للشخص الذي يقدم المطالبات ، أو مصدر الصورة عند تحرير صورة أو DALL · E 2. جميع الصور التي استخدمتها في منشور المدونة هذا ، على سبيل المثال ، أنا إما تم إنشاؤه باستخدام DALL · E 2 أو إنشاء صورة مكتبة مخزون معدلة ، لكنني سأشعر إلى حد ما بالاحتيال إذا نسبت هذه الأجيال أو التعديلات إلى نفسي.
يمكن إنشاء الصور بناءً على:
- الموضوع: يمكنك إنشاء صور لأي شيء تريده ؛ المناظر الطبيعية والحيوانات والأشياء والمفاهيم المجردة طالما أنها تتبع سياسة المحتوى التي تحظر على سبيل المثال إنشاء صور لأشخاص مشهورين لتجنب انتشار التزييف العميق.
- متوسط: من الرسومات بالقلم الرصاص واللوحات الزيتية إلى فن البكسل والرسوم التوضيحية الرقمية ، يمكن لـ DALL · E 2 إنشاء صور تمثل أي نوع من الوسائط.
- الإعدادات البيئية: أضف إلى العوامل البيئية السريعة مثل "غروب الشمس" أو "الضباب" لمنح صورك جوًا قليلاً.
- الموقع: إذا كنت بحاجة إلى وضع صورك في موقع معين ، فقم بإعطاء الموجه اسم مدينة أو بلد ويجب أن تحصل على المعالم وأنماط المباني وما إلى ذلك المرتبطة بهذا المكان.
- الأسلوب الفني: يمكن لـ DALL · E 2 إنشاء صور بأسلوب فنانين مختلفين. ما عليك سوى إضافة "في أسلوب [الفنان]" إلى مطالباتك.
- إعدادات الكاميرا: مفيدة بشكل خاص لأنماط التصوير الفوتوغرافي ، يمكنك إضافة إعدادات الكاميرا لطلباتك لمنح الصور مجموعة متنوعة من اللقطات والصفات المختلفة. تشمل الأمثلة "لقطة ماكرو 35 مم" أو "التعرض الطويل" أو "عدسة عين السمكة".
ما عليك سوى استخدام لغة طبيعية لدمج أي مما سبق للمساعدة في وصف ما تريده مثل "هومر سيمبسون في مقهى باريسي بأسلوب بيكاسو" وفي غضون ثوانٍ ستحصل على عدة أجيال.
من السهل أن تضيع في حفرة من الاحتمالات عند استكشاف إمكانيات DALL · E 2 ، ولكن هناك أيضًا العديد من التطبيقات العملية للأداة خاصة في التصميم والتسويق والتي سيتم استكشافها لاحقًا في هذه المقالة.
كيف يعمل DALL · E 2؟
لن أتظاهر أنني أفهم تمامًا أو سأحاول شرح كيفية عمل إنشاء صور DALL · E 2 AI بالضبط - هناك الكثير من المقالات التي تفعل ذلك. لكن ما يمكنني قوله هو أنها أكثر بكثير من مجرد خوارزمية ذكية تستخدم مجموعة معقدة من المنطق. إنه تعلم الآلة. ذكاء اصطناعي تم تدريبه ، بمرور الوقت ، من مليارات الصور المصدر واللغة الطبيعية والعلاقة بين كليهما.
يوجد في قلبه نموذج انتشار يبدأ بضوضاء عشوائية ويتم تنقيحه بشكل متكرر على مدار دورات متعددة حتى يظهر شيء يشبه فهم الذكاء الاصطناعي للموجه المطلوب.
أداة DALL · E 2 نفسها سهلة الاستخدام. بمجرد تسجيل الدخول ، يتم الترحيب بك بحقل إدخال بسيط حيث يمكنك البدء في إنشاء الصور بناءً على مطالبة نصية أو يمكنك تحميل صورتك الخاصة لتحريرها.
يتوفر عدد من أدوات تحرير الصور لكل من الصور التي تم إنشاؤها وتحميلها والتي سنستكشفها لاحقًا في هذه المقالة.
استخدام DALL · E 2 لتحديد مصادر الصور
أحد الاستخدامات الأكثر وضوحًا لإنشاء الصور المستند إلى الذكاء الاصطناعي هو تحديد مصادر الصور أو أنماط الصور الأخرى لاستخدامها في منشورات المدونات والعروض التقديمية ومواقع الويب والإعلانات والوسائط الأخرى المتنوعة. غالبًا ما تكون مكتبات صور الأسهم مثل ShutterStock أو iStockPhotos أو Unsplash اختيارات شائعة عندما يتعلق الأمر بمصادر الصور ، ولكن من المحتمل أن نرى الأشخاص يتجهون بشكل متزايد إلى أمثال DALL · E 2 للحصول على بديل أسرع وأقل تكلفة ، بالإضافة إلى الإنشاء من الصور الفريدة حقًا ولا توجد في أي مكان آخر عبر الإنترنت.
يمكن أن يكون DALL · E 2 مفيدًا بشكل خاص عند الحصول على صور لها موضوع محدد للغاية مثل "Golden Retriever جلس على شاطئ يطل على غروب الشمس" أو "صورة لثعلب يقفز عبر الجرس الأزرق في غابة مع أشعة الشمس يلمع من خلال الأشجار ". من المحتمل أن يستغرق الحصول على صور مماثلة من مكتبات صور مخزنة مختلفة وقتًا أطول ، وفي كثير من الحالات من غير المحتمل أن يكون الموضوع موجودًا.
ما أجده مذهلاً حقًا مع أسلوب التصوير الفوتوغرافي لتوليد الصور هو أن DALL · E 2 يمكنه تكرار جميع أنواع الإعدادات البيئية بدقة. بدءًا من وهج ضوء الشمس وإلقاء الضوء بدقة على الظلال وصولاً إلى حدة الكائنات المقربة والتشويش التدريجي للعناصر البعيدة. يمكنك أيضًا تضمين مطالبات للإعدادات المختلفة القائمة على الكاميرا مثل "Macro 35mm" أو "Fisheye" أو "Lens Flare".
عند إنشاء صور فوتوغرافية عالية الجودة ، لاحظت أجيالًا أكثر واقعية من الموضوعات الأكثر شيوعًا. على سبيل المثال ، هناك العديد من الصور الفوتوغرافية للكلاب على الشواطئ أكثر من الثعالب التي تقفز في بلوبيلس ، لذا فإن المزيد من المحتوى للذكاء الاصطناعي لاستخلاص المراجع منه.
أحد القيود الرئيسية الجديرة بالإشارة هو أن جميع الصور التي تم إنشاؤها تقتصر على 1024 × 1024 بكسل ، لذلك لن نقوم بإنشاء صور للوحات الإعلانات في أي وقت قريب ...
توسيع أبعاد الصورة
أحد الاستخدامات الأكثر شيوعًا التي أراها لـ DALL · E 2 في عالم الإبداع والتسويق هو تحسين الصور الموجودة وتحريرها ، بدلاً من التوليد الكامل للصور الجديدة. بصفتي مطور ويب ، عادةً ما أواجه تحديات حيث يتم العثور على صورة جيدة لائقة ولكن النسبة والأبعاد تسبب محاصيل رديئة عند تحميل الصورة نظرًا لأن حاوية الصورة تكون نسبة مختلفة عن الصورة.
هنا مثال. صورة مخزون جميلة لكلب يميل من نافذة السيارة التي تم تخصيصها للاستخدام على وحدة بطل مميزة ، لكن النسبة القياسية للمناظر الطبيعية للصورة المصدر لم تلعب بشكل جيد مع نسبة 21: 9 فائقة الاتساع للبطل المميز لافتة.
من خلال تحميل الصورة إلى DALL · E 2 واستخدام أداة "Generation Frame" ، يمكننا تمديد الصورة عن طريق السماح للذكاء الاصطناعي بملء الفجوات. عند استخدام Generation Frame ، ستحتاج دائمًا إلى الاحتفاظ بجزء من الصورة الأصلية داخل الإطار لمنح AI مزيدًا من المعلومات للعمل من خلالها.
يعتبر النص الفوري مهمًا أيضًا هنا وعادة ما تريد وصف ما تريده في إطار الإنشاء بدلاً من الصورة بأكملها. بالنسبة لهذه المطالبة ، استخدمت للتو عبارة "التلال والسماء" ودع DALL · E 2 يقوم بالباقي.
لكل جيل ، ستمنحك DALL · E 2 أربعة أشكال مختلفة لتختار من بينها. الصورة التي شعرت بها أعلاه كانت الأكثر تصديقًا ؛ مع امتداد جيد للطريق ، مع وجود حفنة من الأشجار المتولدة ، وبعض السحب المثيرة للاهتمام دون أن تكون متراكبة بشكل كبير ودفق (لم أطلبه سوى إضافة جيدة) يركض خلف الأشجار.
تحرير المصنوعات اليدوية
يمكن أيضًا إجراء تعديلات على الأجزاء التي بها مشكلات من الصور بسرعة وكفاءة باستخدام DALL · E 2. كان المثال أدناه طلبًا حديثًا كان علينا استبدال انعكاس مشتت للانتباه في نظارات السلامة الخاصة بمدير البناء.
باستخدام أداة Eraser لتعديل جزء الانعكاس من الصورة الموضحة في الجزء العلوي الأيسر ، جنبًا إلى جنب مع توفير موجه "امرأة بنظارات أمان تنظر إلى iPad" ، قام DALL · E 2 بإنشاء الباقي ، وصولاً إلى الحافة وإبرازها من النظارات والتظليل ومطابقة الألوان بدقة.
إضافة محتوى إلى صورة موجودة
وبالمثل ، يمكن أن تكون إضافة عناصر إلى صورة بنفس سهولة إزالتها. هذا مثال على صورة شخص ينظر عبر الوادي. ألن يكون لطيفًا إذا كان أفضل صديق لهم بجانبهم؟ لا توجد مشكلة ، ما عليك سوى مسح مساحة بحجم كلب من الصورة باستخدام أداة Eraser وإعطاء الأمر المناسب ؛ تم استخدام عبارة "كلب صيد ذهبي يجلس بجانب المرأة التي تنظر إلى المسافة" في المثال أدناه
توليد صور متشابهة بصريا
ربما تكون قد عثرت على صورة جيدة حقًا من حيث التركيب والموضوع ، ولكن لأي سبب من الأسباب ، فإنها لا تعمل تمامًا. بدون إجراء أي تعديلات على الإطلاق أو تغييرات على النص الفوري ، يمكنك استخدام ميزة "إنشاء أشكال مختلفة" لإنشاء صور متشابهة من حيث الأسلوب والتركيب.
في المثال أدناه ، الإضاءة والتظليل وزوايا الكاميرا كلها متشابهة جدًا ويتم إعادة إنشاء نفس النوع من الكلاب ، جنبًا إلى جنب مع امرأة ترتدي سترة تنظر إلى التلال مع طريق ينسج من خلالها ولكن العناصر بها كل شيء تغير؛ التلال والطريق جديدان والمرأة والكلب مختلفان.
إنشاء لوحات المزاج
خلال المراحل الأولى من المشروع الإبداعي ، غالبًا ما تستخدم Mood Boards لتعيين الأسلوب البصري والنغمة والتوجيه الإبداعي من خلال الحصول على مزيج من لقطات الشاشة والنصوص والصور الموجودة. نظرًا لأنه يمكنك مطالبة DALL · E 2 لأي نوع من الأنماط المرئية بدءًا من الرسومات بالقلم الرصاص والطلاء وحتى فن البكسل والعروض ثلاثية الأبعاد ، فقد يوفر الذكاء الاصطناعي التوليفي نقطة انطلاق جيدة لتعيين نغمة أو اتجاه بصري.
دعم طرح العلامة التجارية
عند طرح علامة تجارية جديدة ، من الشائع محاكاة شكل التصميمات الجديدة عبر عناصر ثابتة مختلفة ، أو تصور تصميمات مواقع الويب في الموقع على أجهزة مختلفة. قد يكون DALL · E 2 قادرًا على دعم إنشاء خلفية فريدة ترتبط بأعمال العميل.
على سبيل المثال ، إنشاء صورة لبطاقات العمل في حقل زهرة برية لعلامة تجارية موجهة نحو البيئة ، أو محاكاة كمبيوتر محمول بمنزل حديث في الخلفية لنشاط تجاري في قطاع بناء المنازل.
الحصول على الإلهام
أعتقد أننا ما زلنا بعيدين عن إنشاء مواد مرئية جاهزة للطباعة أو مصممة بالكامل لعمليات النشر الإبداعية ، ولكن أحد المجالات التي يمكن أن يكون فيها DALL · E 2 مفيدًا لدعم عملية التصميم هو توفير بعض الإلهام السريع لتدفق العصائر الإبداعية .
على سبيل المثال ، قمت بإنشاء ما يلي في محاولة لإنشاء شعار لبيرة جديدة تحت عنوان steampunk باستخدام موجه "تصميم شعار لبيرة steampunk". في حين أن DALL · E 2 رائع في فهم المطالبات النصية ، فإن إنشاء النص هو أحد المجالات التي يعاني فيها DALL · E 2. في جميع الأشكال المنتجة ، يكون النص مؤهلاً أو لا معنى له. على الرغم من ذلك ، أعتقد أنه لا يزال هناك إمكانية للإلهام من هذه الأنواع من الأجيال سواء كانت ألوانًا أو تكوينًا أو عناصر مستخدمة في الصور المنتجة.
إنتاج تخطيطات تقريبية
المجال الآخر الذي يمكن لـ DALL · E 2 دعمه هو الحصول على تخطيطات أولية وتركيبات يمكن استخدامها كفكرة أو نقطة انطلاق لأمثال الإعلانات وتصميمات مواقع الويب. تستند الأمثلة أدناه لتصميم موقع ويب وإعلان كتيب على المطالبات "تصميم [موقع ويب] [كتيب] لشركة طاقة مستدامة"
من خلال التعلم الآلي وفهم مليارات الصور المصدر ، ستدمج DALL · E 2 بشكل طبيعي الاصطلاحات القياسية عندما يتعلق الأمر بالتخطيطات. مع مثال تصميم موقع الويب ، يتم عرض التنقل الرئيسي في الجزء العلوي لجميع الأشكال ، وعادة ما يكون شعار العلامة التجارية في أعلى اليسار وكان هناك دائمًا وحدة بطل كبيرة وعنوان كبير أسفل العنوان متبوعًا بفقرات من النص أدناه. وبالمثل ، كان اللون الأخضر موضوعًا شائعًا للون مع هذه الاختلافات لأنه بطبيعة الحال يرتبط ارتباطًا وثيقًا بكلمة "الاستدامة".
النص غير مقروء بشكل ملحوظ والعديد من الصور داخل التخطيطات غامضة ، ولكن من وجهة نظر تركيبية ، أعتقد أن هناك ما يكفي من الإمكانات هنا لـ DALL · E 2 للقيام بدور داعم عند البحث عن إلهام للتخطيطات.
استنتاج
إن DALL · E 2 من OpenAI والتقدم الذي نراه الآن مع نماذج توليد الصور القائمة على الذكاء الاصطناعي مثل Imagen من Google (ليس بعد للاستهلاك العام) مثيران للإعجاب بلا شك ، وأرى أن دورها في التسويق الرقمي والفضاء الإبداعي هو أكثر بكثير من داعم بدلاً من تهديد مباشر للأدوار الإبداعية والتسويقية. كما رأينا مع بعض الأمثلة أعلاه ، هناك بعض القيود الواضحة خاصة فيما يتعلق بحجم الإخراج وإنشاء النص. حتى مع استخدام معظم الصور القائمة على التصوير الفوتوغرافي المستخدمة في المقالة ، فمن المحتمل أن يتمكن معظم الأشخاص من معرفة أن معظمهم ليسوا صورًا حقيقية ، ولكن سيصبح من الصعب تحديدها بمرور الوقت.
ما زلنا في المراحل الأولى من الإنشاء المعتمد على الصور بالذكاء الاصطناعي ، لكني أرى العديد من التطبيقات المفيدة للقطاع الإبداعي والتسويق من توليد الإلهام والأفكار ، إلى مصادر الصور وتحرير الصور المتقدم. لن يمر وقت طويل قبل أن تصبح API لهذه الأدوات متاحة ومدمجة مع أدوات التصميم الشائعة مثل PhotoShop أو Figma. إنه مجال رائع وسأتابع تقدمه خلال الأشهر والسنوات القادمة.