DALL-E

DALL-E چیست؟ هوش مصنوعی برای خلق آثار هنری

سرفصل‌های مقاله

شاید چند سال پیش فکر اینکه بتوانیم یک متن را به تصویر تبدیل کنیم، مثل رویا بود. اما به لطف هوش مصنوعی DALL-E این اتفاق به واقعیت پیوسته. اما دقیقا DALL-E چیست؟

DALL-E یک سرویس تولید تصویر با هوش مصنوعی است که هر متنی را به تصاویر هنری تبدیل می‌کند. مهم نیست متن شما ساده یا پیچیده باشد، DALL-E متن مورد نظر را به خوبی درک می‌کند. 

DALL-E یکی از جدیدترین فناوری‌های مبتنی بر هوش مصنوعی است؛ یک مدل هوش مصنوعی مولد که می‌تواند تصاویری را که قبلا وجود نداشته، ایجاد کند. تنها کاری که باید انجام دهید این است که از آن بخواهید تخیلات شما را به تصویر تبدیل کند!

این فناوری اولین بار در ژانویه ۲۰۲۱ منتشر شد و از آن زمان تاکنون نسخه دوم این هوش مصنوعی به نام DALL-E 2 ارتقا یافته است.

با توجه به سادگی استفاده از این برنامه هوش مصنوعی، استفاده از آن حتی برای بسیاری از کسانی که از نقاشی سردرنمی‌آورند هم جذاب، سرگرم‌کننده و آسان است.

جالب است بدانید که تصاویر تولید شده توسط DALL-E بسیار شبیه تصاویر خلق شده توسط بشر است.

DALL-E علاوه بر داشتن توانایی به تصویر کشیدن اشیا و مناظر از دنیای اطراف ما، می‌تواند این تصاویر را به سبک خاصی مانند هنر دیجیتال، آبرنگ یا امپرسیونیسم ارایه دهد.

DALL-E چیست و چگونه کار می‌کند؟

DALL-E
نحوه کار DALL-E

همان‌طور که گفتیم DALL-E یک مدل هوش مصنوعی مولد است که توسط OpenAI توسعه یافته و می‌تواند تصاویر و آثار هنری را از یک پیام متنی تولید کند. به عبارت دیگر کافی است شما یک جمله درباره‌ این‌که دقیقا به چه تصویری نیاز دارید خطاب به آن بنویسید تا DALL-E تصویر مدنظرتان را در عرض چند ثانیه بسازد.

برای اینکه بدانیم DALL-E چطور کار می‌کند لازم است به این نکته اشاره کنیم که چند نوع فناوری مختلف برای توسعه‌ این هوش مصنوعی با یکدیگر ترکیب شده و کار می‌کنند و مسیر توسعه‌ آن به ریاضیات پیچیده‌ای بستگی دارد.

تصاویر تولید شده حاصل تعداد زیادی عکس با شرح متن هستند. به این ترتیب با وجود اطلاعات کافی، هوش مصنوعی می‌تواند یاد بگیرد که چگونه یک شی را تشخیص و آن را چطور در قالب تصویر نمایش دهد.

DALL-E با استفاده از زبان GPT-3 (Generative Pre-trained Transformer) ساخته شده است.

یکی دیگر از بخش‌های اصلی DALL-E استفاده از مدل Diffusion است. این مدل یک تصویر پر از جزییات است که از هزاران پیکسل تشکیل شده و جزییات آن قابل تشخیص نیست. اما در نهایت تصویر واضحی خلق می‌کند که با دستور (متن) مورد نظر شما مطابقت دارد.

با DALL-E چه کاری می‌توانید انجام دهید؟

حالا که متوجه شدیم DALL-E چیست و چگونه کار می‌کند، سراغ موارد استفاده از آن می‌رویم. از DALL-E می‌توان در موارد بسیاری استفاده کرد؛ مثلا از آن برای مونتاژ یا بازسازی یک اثر هنری معروف استفاده کنید، یا یک اثر هنری اصلی را با قابلیت ویرایش تغییر دهید.

Outpainting یکی دیگر از ویژگی‌های DALL-E است که امکان خلق آثار بزرگ‌تر و اتصال پنل‌های تصویر تولید شده را به یک اثر هنری فراهم می‌کند.

در واقع DALL-E قدرتش را از جهان ما، از جمله تاریخ هنر و میلیون‌ها تصویری که احتمالا از اینترنت جمع‌آوری کرده به دست می‌آورد. به این ترتیب با ترکیب چندین فناوری جدید در هوش مصنوعی، می‌توانید تخیل خود را با استفاده از کلمات به تصویر بکشید.

چطور از DALL·E استفاده کنیم؟

DALL·E یک ابزار مبتنی بر مرورگر است، همچنین یک API ارایه می‌دهد که توسعه‌دهندگان می‌توانند در برنامه‌های خود از آن استفاده کنند. برای استفاده از DALL-E، ابتدا باید یک حساب کاربری ایجاد کنید که با تایید ایمیل یا شماره تلفن خود، بلافاصله امکان استفاده از این ابزار هوش مصنوعی را خواهید داشت.

همه کاربران برای شروع ۵۰ امتیاز رایگان دریافت می‌کنند که برای بررسی نحوه عملکرد ابزار کافی است. همچنین ماهانه ۱۵ امتیاز رایگان دیگر در اختیار کاربران قرار می‌دهد که زیاد نیست و لازم است از این به بعد برای کسب امتیاز بیشتر، هزینه کنید.

برای ساخت یک اثر هنری لازم است توضیحی از آن‌چه در ذهن‌تان دارید را در کادر متن وارد کنید، به عنوان مثال “فضانوردی سوار بر اسب به سبک امپرسیونیست”، سپس روی کلید “generate” کلیک کنید و DALL·E چهار تصویر ۱۰۲۴x۱۰۲۴ ایجاد می‌کند. اگر تصویر همان موضوع مدنظرتان نبود، لازم است درخواست خود را تغییر دهید تا به نتیجه دل‌خواه برسید.

اما اگر از تصویر خلق شده راضی هستید، روی تصویر کلیک کنید. در صفحه بعدی می‌توانید تصویر را دانلود کنید. امکان ویرایش تصویر هم وجود دارد. ابزارهایی مانند پاک‌کن و گزینه‌هایی برای آپلود و تکمیل تصویر هم در اختیارتان قرار می‌دهد.

ویژگی‌های DALL-E

ویژگی‌
ویژگی‌های DALL-E

نسخه اولیه DALL-E فقط می‌توانست تصاویر ایجاد شده با هوش مصنوعی را به صورت کارتونی و اغلب در پس‌زمینه ساده ارایه دهد. اما نسخه‌ بعدی این محصول یعنی DALL-E 2 ارتباط بهتری بین تصاویر و متن توصیف شده با استفاده از تکنیکی به نام ” diffusion” برقرار می‌کند.

این ارتباط با الگوی نقاط تصادفی شروع می‌شود و زمانی که ویژگی‌های خاصی از آن تصویر را تشخیص می‌دهد، به تدریج آن را به تصویر تبدیل و عکس‌هایی با کیفیت و وضوح بالا ارائه می‌کند.

یکی از ویژگی‌های DALL-E 2 ویرایش ساده تصویر است. فقط لازم است یک کادر در اطراف بخشی از تصویری که می‌خواهید تغییر دهید بکشید و درخواست خود را تایپ کنید تا تغییر ایجاد شود.

بنابراین می‌توان عکس‌ها را با دقت، بر اساس یک توضیح ساده ویرایش و روتوش کرد. همچنین می‌توان بخشی از یک تصویر را با تصویری که توسط هوش مصنوعی ایجاد شده پر یا جایگزین کرد که به‌طور یک‌پارچه با تصویر اصلی ترکیب ‌شود.

استقاده از DALL-E در ایران

شاید یکی از دغدغه‌های اصلی کاربران ایرانی، چگونگی نحوه اتصال به هوش مصنوعی است. به خاطر تحریم‌های زیاد و فیلترینگ سایت‌های خارجی، اتصال به این سیستم‌ها کمی سخت شده است. اما نگران نباشید. با دانلود اپلیکیشن زی‌گپ، شما می‌توانید با DALL-E و سایر سرویس‌های هوش مصنوعی به راحتی و با استفاده از زبان فارسی کار کنید.

از مهم‌ترین مزایای دستیار هوش مصنوعی زیگپ می‌توان به موارد زیر اشاره کرد:

  • اتصال به پیشرفته‌ترین موتورهای هوش مصنوعی نظیر ChatGPT و Dall-E
  • وجود اپلیکیشن موبایل (فعلا نسخه اندروید) برای دسترسی راحت‌تر و سریع‌تر
  • پشتیبانی از زبان‌های مختلف
  • دستیار صوتی فارسی زبان

ما سعی کردیم که به ساده‌ترین شکل برای شما توضیح دهیم که DALL-E چیست و چگونه کار می‌کند. شما هم می‌توانید نظرات خود را در مورد DALL-E و سایر سرویس‌های هوش مصنوعی با ما و سایر کاربران به اشتراک بگذارید.

نوید رضایی
نوید رضایی