شاید چند سال پیش فکر اینکه بتوانیم یک متن را به تصویر تبدیل کنیم، مثل رویا بود. اما به لطف هوش مصنوعی DALL-E این اتفاق به واقعیت پیوسته. اما دقیقا DALL-E چیست؟
DALL-E یک سرویس تولید تصویر با هوش مصنوعی است که هر متنی را به تصاویر هنری تبدیل میکند. مهم نیست متن شما ساده یا پیچیده باشد، DALL-E متن مورد نظر را به خوبی درک میکند.
DALL-E یکی از جدیدترین فناوریهای مبتنی بر هوش مصنوعی است؛ یک مدل هوش مصنوعی مولد که میتواند تصاویری را که قبلا وجود نداشته، ایجاد کند. تنها کاری که باید انجام دهید این است که از آن بخواهید تخیلات شما را به تصویر تبدیل کند!
این فناوری اولین بار در ژانویه ۲۰۲۱ منتشر شد و از آن زمان تاکنون نسخه دوم این هوش مصنوعی به نام DALL-E 2 ارتقا یافته است.
با توجه به سادگی استفاده از این برنامه هوش مصنوعی، استفاده از آن حتی برای بسیاری از کسانی که از نقاشی سردرنمیآورند هم جذاب، سرگرمکننده و آسان است.
جالب است بدانید که تصاویر تولید شده توسط DALL-E بسیار شبیه تصاویر خلق شده توسط بشر است.
DALL-E علاوه بر داشتن توانایی به تصویر کشیدن اشیا و مناظر از دنیای اطراف ما، میتواند این تصاویر را به سبک خاصی مانند هنر دیجیتال، آبرنگ یا امپرسیونیسم ارایه دهد.
DALL-E چیست و چگونه کار میکند؟
همانطور که گفتیم DALL-E یک مدل هوش مصنوعی مولد است که توسط OpenAI توسعه یافته و میتواند تصاویر و آثار هنری را از یک پیام متنی تولید کند. به عبارت دیگر کافی است شما یک جمله درباره اینکه دقیقا به چه تصویری نیاز دارید خطاب به آن بنویسید تا DALL-E تصویر مدنظرتان را در عرض چند ثانیه بسازد.
برای اینکه بدانیم DALL-E چطور کار میکند لازم است به این نکته اشاره کنیم که چند نوع فناوری مختلف برای توسعه این هوش مصنوعی با یکدیگر ترکیب شده و کار میکنند و مسیر توسعه آن به ریاضیات پیچیدهای بستگی دارد.
تصاویر تولید شده حاصل تعداد زیادی عکس با شرح متن هستند. به این ترتیب با وجود اطلاعات کافی، هوش مصنوعی میتواند یاد بگیرد که چگونه یک شی را تشخیص و آن را چطور در قالب تصویر نمایش دهد.
DALL-E با استفاده از زبان GPT-3 (Generative Pre-trained Transformer) ساخته شده است.
یکی دیگر از بخشهای اصلی DALL-E استفاده از مدل Diffusion است. این مدل یک تصویر پر از جزییات است که از هزاران پیکسل تشکیل شده و جزییات آن قابل تشخیص نیست. اما در نهایت تصویر واضحی خلق میکند که با دستور (متن) مورد نظر شما مطابقت دارد.
با DALL-E چه کاری میتوانید انجام دهید؟
حالا که متوجه شدیم DALL-E چیست و چگونه کار میکند، سراغ موارد استفاده از آن میرویم. از DALL-E میتوان در موارد بسیاری استفاده کرد؛ مثلا از آن برای مونتاژ یا بازسازی یک اثر هنری معروف استفاده کنید، یا یک اثر هنری اصلی را با قابلیت ویرایش تغییر دهید.
Outpainting یکی دیگر از ویژگیهای DALL-E است که امکان خلق آثار بزرگتر و اتصال پنلهای تصویر تولید شده را به یک اثر هنری فراهم میکند.
در واقع DALL-E قدرتش را از جهان ما، از جمله تاریخ هنر و میلیونها تصویری که احتمالا از اینترنت جمعآوری کرده به دست میآورد. به این ترتیب با ترکیب چندین فناوری جدید در هوش مصنوعی، میتوانید تخیل خود را با استفاده از کلمات به تصویر بکشید.
چطور از DALL·E استفاده کنیم؟
DALL·E یک ابزار مبتنی بر مرورگر است، همچنین یک API ارایه میدهد که توسعهدهندگان میتوانند در برنامههای خود از آن استفاده کنند. برای استفاده از DALL-E، ابتدا باید یک حساب کاربری ایجاد کنید که با تایید ایمیل یا شماره تلفن خود، بلافاصله امکان استفاده از این ابزار هوش مصنوعی را خواهید داشت.
همه کاربران برای شروع ۵۰ امتیاز رایگان دریافت میکنند که برای بررسی نحوه عملکرد ابزار کافی است. همچنین ماهانه ۱۵ امتیاز رایگان دیگر در اختیار کاربران قرار میدهد که زیاد نیست و لازم است از این به بعد برای کسب امتیاز بیشتر، هزینه کنید.
برای ساخت یک اثر هنری لازم است توضیحی از آنچه در ذهنتان دارید را در کادر متن وارد کنید، به عنوان مثال “فضانوردی سوار بر اسب به سبک امپرسیونیست”، سپس روی کلید “generate” کلیک کنید و DALL·E چهار تصویر ۱۰۲۴x۱۰۲۴ ایجاد میکند. اگر تصویر همان موضوع مدنظرتان نبود، لازم است درخواست خود را تغییر دهید تا به نتیجه دلخواه برسید.
اما اگر از تصویر خلق شده راضی هستید، روی تصویر کلیک کنید. در صفحه بعدی میتوانید تصویر را دانلود کنید. امکان ویرایش تصویر هم وجود دارد. ابزارهایی مانند پاککن و گزینههایی برای آپلود و تکمیل تصویر هم در اختیارتان قرار میدهد.
ویژگیهای DALL-E
نسخه اولیه DALL-E فقط میتوانست تصاویر ایجاد شده با هوش مصنوعی را به صورت کارتونی و اغلب در پسزمینه ساده ارایه دهد. اما نسخه بعدی این محصول یعنی DALL-E 2 ارتباط بهتری بین تصاویر و متن توصیف شده با استفاده از تکنیکی به نام ” diffusion” برقرار میکند.
این ارتباط با الگوی نقاط تصادفی شروع میشود و زمانی که ویژگیهای خاصی از آن تصویر را تشخیص میدهد، به تدریج آن را به تصویر تبدیل و عکسهایی با کیفیت و وضوح بالا ارائه میکند.
یکی از ویژگیهای DALL-E 2 ویرایش ساده تصویر است. فقط لازم است یک کادر در اطراف بخشی از تصویری که میخواهید تغییر دهید بکشید و درخواست خود را تایپ کنید تا تغییر ایجاد شود.
بنابراین میتوان عکسها را با دقت، بر اساس یک توضیح ساده ویرایش و روتوش کرد. همچنین میتوان بخشی از یک تصویر را با تصویری که توسط هوش مصنوعی ایجاد شده پر یا جایگزین کرد که بهطور یکپارچه با تصویر اصلی ترکیب شود.
استقاده از DALL-E در ایران
شاید یکی از دغدغههای اصلی کاربران ایرانی، چگونگی نحوه اتصال به هوش مصنوعی است. به خاطر تحریمهای زیاد و فیلترینگ سایتهای خارجی، اتصال به این سیستمها کمی سخت شده است. اما نگران نباشید. با دانلود اپلیکیشن زیگپ، شما میتوانید با DALL-E و سایر سرویسهای هوش مصنوعی به راحتی و با استفاده از زبان فارسی کار کنید.
از مهمترین مزایای دستیار هوش مصنوعی زیگپ میتوان به موارد زیر اشاره کرد:
- اتصال به پیشرفتهترین موتورهای هوش مصنوعی نظیر ChatGPT و Dall-E
- وجود اپلیکیشن موبایل (فعلا نسخه اندروید) برای دسترسی راحتتر و سریعتر
- پشتیبانی از زبانهای مختلف
- دستیار صوتی فارسی زبان
ما سعی کردیم که به سادهترین شکل برای شما توضیح دهیم که DALL-E چیست و چگونه کار میکند. شما هم میتوانید نظرات خود را در مورد DALL-E و سایر سرویسهای هوش مصنوعی با ما و سایر کاربران به اشتراک بگذارید.