اعرض المزيد

تطبيق DALL-E 2 مراجعة شاملة كاملة وكيفية العمل 

3 mins
بواسطة Shilpa Lama

يتحدث العديد من الأشخاص عن تطبيق DALL-E 2 الذي صممته شركة OpenAI منذ شهور من إصداره، حيث يرى البعض إمكانيته في تغيير الفن في ظل رؤية البعض الأخر أن صور الذكاء الاصطناعي ستؤدي إلى القضاء على الإبداع. 

ولكن هذا التطبيق يرصد نوع جديد من الفن، لذا نشرح في هذا المقال التطبيق وكيفية استخدامه وسلبياته. 

في هذا الدليل الإرشادي 

  • ما هو تطبيق DALL-E 2؟
  • كيفية العمل
  • ما مدى جودة التطبيق؟
  • السلبيات والإيجابيات
  • الخلاصة 

ما هو تطبيق DALL-E 2؟

منشيء صور بواسطة الذكاء الاصطناعي، حيث يمكن إنشاء صور فنية من خلال نصوص، أسسته شركة OpenAI في يناير 2021 والأسم يتكون من مقطعين؛ الأول DALL-E وهي لوحة فنية للفنان الإسباني سلفادور دالي و Wall-E شخصية روبوت متحرك من شركة Pixar.

وفي شهر يوليو من العام الماضي، تم توافر التطبيق للمستخدمين لتجعله الشركة بعد ذلك نسخة متاحة يصل إليها كل شخص. 

ويستخدم التطبيق النصوص في إنشاء صور أصلية بوجود 3.5 مليار معلمة مقارنة بالإصدار الأول الذي يستخدم 12 مليار معلمة ولكن DALL-E 2 يمكن أن يصمم صور أكثر دقة 4 مرات من الإصدار الأول ومطابقة للواقع. 

كيفية العمل

يمتاز التطبيق بسهولة الاستخدام، ويمكن تعلم الاستخدام من خلال البرنامج التعليمي للموقع الرسمي والذي يصف كيفية إنشاء حساب وتسجيل الدخول، وإذا كنت تمتلك حساباً في شركة OpenAI فقط قم بإدخال البريد الإلكتروني ورقم الهاتف للتحقق. 

قم بإدخال نص مكون من 400 حرف، كي يستطيع منشيء الذكاء الاصطناعي التعامل وإنشاء الصور والحصول على نتائج من خلال الرسائل النصية. 

فمثلاً: عند كتابة (مجموعة من الذئاب تعوي على سطح القمر) يمكننا رؤية هذه النتائج ذات الأربع أشكال المختلفة. 

أو (عرض ثلاثي الأبعاد لجندي روماني يأخذ قسطاً من الراحة) فسنجد هذه الصور. 

ما مدى جودة التطبيق؟

لمعرفة مدى جودة التطبيق، فقد نلاحظ فهمه للغة الطبيعية وأوصاف النص وفهمه ايضا للأنماط والموضوعات والخلفيات والمواقع والمفاهيم، ومن ثم إنتاج صور عالية الجودة. 

ويعمل التطبيق من خلال بعض المفاهيم مثل: 

  • CLIP: التدريب المسبق على الصور ومدى استخدام اللغة الطبيعية لتعلم أجهزة الكمبيوتر لكيفية ارتباط الصور المختلفة بينها وبين بعضها، ويتكون CLIP من شبكتين عصبيتين وهم تشفير خاص بالصور والنصوص. 
  • ويتم التدريب الشبكتين على مجموعات كبيرة من أزواج الصور والنصوص حيث يحلل النموذج تعليقات الصور لإنشاء مثيلات لها أي أن CLIP يعمل كجسر بين النص والصورة. 
  • النموذج السابق الذي يتطلب نص توضيحي وبالتالي إنشاء عمليات دمج الصور عبر CLIP.
  • نموذج انتشار وحدة فك التشفير (unCLIP): حيث قيام معكوس نموذج CLIP بإنشاء الصور باستخدام عمليات دمج الصور. 
  • وبالتالي ينشيء التطبيق صور من خلال الجمع بين النماذج السابقة.

ويؤسس نموذج unCLIP تمثيل عقلي للصور بناءً على التمثيل العقلي العام.

كما يحتفظ التمثيل العقلي بالسمات والميزات المتسقة لغوياً، مثل الحيوانات والكائنات واللون والخلفية وبالتالي إنتاج صور جديدة. 

نلاحظ أن هذا الدليل الإرشادي يرصد كيفية عمل التطبيق من خلال التنفيذ والمعادلات الرياضية الأكثر تعقيداً. 

وقد نشرت شركة OpenAI بحثاً بعنوان إنشاء الصورة الشرطية للنص الهرمي بواسطة CLIP Latents في وقت سابق من هذا العام. 

السلبيات والإيجابيات

الإيجابيات 

  • توقع مخرجات عالية الجودة بواسطة الذكاء الاصطناعي باستخدام النصوص الدقيقة الوصف.
  • يتم ذلك من خلال بضع ثوان مقارنة بالرسام الذي قد يستغرق ساعات أو أيام لفي إنتاج الصور. 
  • لا توجد رسوم مقابل الأفكار المرئية التي يحصل عليها المستخدم من خلال هذا التطبيق. 
  • استخدام التطبيق لفهمه الخاص للموضوع والنمط ولوحات الألوان قبل تسليم المخرجات. 
  • توجد أربع أشكال لكل صورة، وكل منها يحمل شكل ومضمون ومعنى وأسلوب فريد. 
  • لا يتطلب خبرة في تحرير الصور حيث يمكن رسم رائد فضائي على المريخ وإضافة حيوان أليف إلى الصورة ويمكن تعديل الصورة عن طريق التكبير والتصغير حتى الحصول على النتائج المطلوبة. 
  • لا يمكن  إنشاء صور دموية أو إباحية أو سياسية. 

السلبيات 

  • يعتمد جودة الصورة على مدى جودة وصف النص فكلما كان المستخدم أكثر تحديداً كانت الصور أكثر جودة. 
  • لا يستطيع دمج كائنات متعددة أو خصائص مثل الشكل والاتجاه واللون. 
  • لا يستطيع التميز في الأداء على الرغم من كتابة بعضاً من النصوص البسيطة. 
  • مثال 1: عند كتابة 100 ضفدع في زي جنود رومان يسيرون في الصحراء فلم يفهم التطبيق العبارة بشكل جيد. 
  • مثال 2: ركوب دراجة أحادية أمام برج أيفل، ورفض التطبيق رسم دراجة أحادية ومواجهة صعوبات في إنتاج الصورة. 

مخاوف من تطبيق DALL-E 2

برمجت شركة OpenAI هذا التطبيق على عدم إنشاء صور خاصة بشخصيات عامة ومشاهير أو صور ذات جودة عالية تتعلق بأشخاص حقيقين وهذه خطوة مميزة في منع إساءة استخدام البرنامج. 

ولكن قد لا يحد ذلك من التقاط بعض الجهات الخبيثة للصور وتحويلها إلى وجه شخص. 

وتتضمن المخاوف ايضا حقوق الطبع والنشر الخاصة بالتطبيق، وبخاصة مع زيادة شهرته حيث يمكن إعادة طباعة الصور، ولكن تعتمد مولدات الفن بواسطة الذكاء الاصطناعي على عمل الفنانين لتحليل الفن وتعمله وخلقه. 

ولا يمكن استبعاد الانتهاكات الخاصة بقوانين الملكية الفكرية. 

الخلاصة 

لا يعد التطبيق مثالياً ولكن قد يصبح التطبيق أكثر كفاءة بواسطة التعلم الآلي، وبالتالي يكون خطوة كبيرة في أنظمة الذكاء الاصطناعي الذي قد يتفوق على البشر في الإبداع. 

وقد اتخذت شركة OpenAI عدد من الإجراءات لمنع إساءة استخدام التطبيق في ظل عدم وجود حد للهجمات الإلكترونية، ولكن قد يساهم الذكاء الاصطناعي والتكنولوجيا الداعمة لها في انتشار هذا التطبيق خلال الأشهر والسنوات القادمة. 

أفضل منصة كريبتو في الإمارات
أفضل منصة كريبتو في الإمارات
أفضل منصة كريبتو في الإمارات

Trusted

إخلاء مسؤولية

جميع المعلومات المنشورة على موقعنا الإلكتروني تم عرضها على أساس حسن النية ولأغراض المعلومات العامة فقط. لذا، فأي إجراء أو تصرف أو قرار يقوم به القارئ وفقاً لهذه المعلومات يتحمل مسؤوليته وتوابعه بشكل فردي حصراً ولا يتحمل الموقع أية مسؤولية قانونية عن هذه القرارات. في موقع Learn غايتنا الأولى هي توفير معلومات رفيعة المستوى. فنوف المحتوى التعليمي حقه من التحديد والبحث والابتكار لنضمن تقديم كل ما هو مفيد وممتع لقرائنا. وللحفاظ على هذا المستوى والاستمرار في صنع محتوى رائع وممتع ومفيد، قد يكافئنا شركاؤنا بعمولة لذكرهم في مقالاتنا. إلا أننا نود أن نؤكد أن هذه العمولات لا تؤثر بأي شكل على نزاهتنا في صنع محتوى محايد أمين ومفيد لقرائنا الأعزاء دون تحيز أو تفضيل على الإطلاق.

marina_ezzat_alfred.jpg
مارينا عزت ألفريد
مارينا عزت ألفريد هي صحفية ومترجمة متخصصة في الاقتصاد والتقنية والعملات المشفرة، وتملك خبرة أكثر من 10 سنوات في تحرير المواد الصحفية التقنية والاقتصادية. تخرجت مارينا في كلية الإعلام بجامعة القاهرة وعملت في أبرز المؤسسات الصحفية العربية قبل أن تنضم إلى BeINCrypto. تهتم مارينا بشكل خاص حاليًا بالاقتصاد الرقمي وآلياته وتقنية البلوكتشين والعملات المشفرة وتؤمن بدورها في خلق المستقبل المالي العالمي.
READ FULL BIO
برعاية
برعاية
للإعلان والمبيعات: https://ar.beincrypto.com/sales/