این که گوگل هوش مصنوعی مولد تصویر خود را توسعه دهد، شگفت آور نیست. اما ابزار هوش مصنوعی Imagen کاملاً شبیه بقیه نیست.
گوگل مدل هوش مصنوعی خود به نام Imagen را دارد. بازی مشکوک با کلمات “تصور” و “تصویر” به نوعی به شما میگوید که در مورد چیست. مانند بسیاری دیگر از مولدهای متن به تصویر هوش مصنوعی، میتوانید به سادگی با توضیحات متنی تصویری تولید کنید که به شما اجازه میدهد تخیل خود را زنده کنید.
آنچه که ابزار هوش مصنوعی Imagen را متمایز میکند، این است که نسخه اولیه آن ویژگیهای بسیار خاصی دارد. میتوانید از مدل هوش مصنوعی برای ایجاد ساختمانهایی با تمهای مختلف یا استایل دادن به یک موجود متحرک استفاده کنید.
ابزار هوش مصنوعی Imagen گوگل چیست؟
هوش مصنوعی Imagen یک مدل متن به تصویر است که توسط گوگل توسعه یافته است. و به لیست رو به رشد تولیدکنندههای تبدیل متن به تصویر هوش مصنوعی مانند DALL-E 2، Dream by Wombo و Stable Diffusion اضافه میشود که همگی میتوانند تصاویر شگفتانگیزی را از توضیحات متن ایجاد کنند.
گوگل، ابزار هوش مصنوعی Imagen را از طریق اپلیکیشنی به نام AI Test Kitchen منتشر کرده است و اگر تا به حال نام آن را نشنیده اید، ارزش دیدن دارد. در یک استاندارد جامع و دشوار به نام Drawbench از دیگر مدلهای تبدیل متن به تصویر مانند مدلهای VQ-GAN+CLIP و DALL-E 2 بهتر عمل میکند. با این حال، گوگل همچنین هشدار می دهد که Imagen مستعد تعصبات نژادی و جنسیتی است و باید با احتیاط از آن استفاده کرد.
از اولین نگاه گالری تصاویر تولید شده توسط Imagen، نقطه قوت آن در ایجاد خروجیهای واقع گرایانه است.
ابزار هوش مصنوعی Imagen گوگل دو عملکرد اصلی دارد: City Dreamer و Wobble. اولی میتواند تصاویری از ساختمانها با موضوعات تولید کند. دومی نیز میتواند تصاویری از موجوداتی با ویژگیهای مختلف ایجاد کند.
چگونه از هوش مصنوعی گوگل Imagen استفاده کنیم؟
Imagen ابزاری قوی است که به افراد امکان میدهد با استفاده از هوش مصنوعی تصاویر را ایجاد و ویرایش کنند. اجازه دهید پیادهسازی عملی برنامه را بررسی کنیم:
اولین قدم این است که به وب سایت Google Imagen AI بروید یا کاربران میتوانند آن را برای موبایل دانلود کنند. سپس یک حساب کاربری رایگان بسازید. کاربران برای استفاده از این برنامه نیاز به یک حساب گوگل دارند. هنگامی که کاربران ثبت نام کردید، داشبوردی را میبینید که در آن کاربران میتوانند به ویژگیهای مختلف این ابزار دسترسی داشته باشند.
ویژگی دیگر این برنامه Image-to-Image نام دارد که به شما امکان میدهد تصاویر موجود را با استفاده از دستورات متنی ویرایش کنید. برای استفاده از این ویژگی، یک عکس آپلود کنید یا یکی از مجموعه را انتخاب کنید. سپس یک دستور متنی را در کادر تایپ کنید و دکمه «اعمال» را بزنید.
تفاوت اصلی ابزار هوش مصنوعی Imagen با DALL-E یا میدجرنی
چیزی که Imagen را منحصر به فرد میکند این است که برای تولید دو خروجی بسیار خاص بر اساس توابع به نام های City Dreamer و Wobble طراحی شده است.
City Dreamer تا حدودی یادآور بازیهایی مانند Sim City است که در آن ساختمانهایی برای ایجاد یک شهر میسازید. با Imagen، میتوانید چیزی شبیه خانهای که از s’mores ساخته شده است را توصیف کنید، و توضیحات شما را به یک تصویر تبدیل میکند.
از طرف دیگر، Wobble بر اساس توضیحات شما موجودات منحصر به فردی تولید میکند و به نوعی شبیه شخصیتهای متحرک پیکسار هستند (مثلاً به Monsters Inc. فکر کنید). برخی از چیزهایی که میتوانید با آنها بازی کنید، نوع لباسی است که موجود میپوشد یا از چه موادی ساخته شده است.
در نظر فنی، تحقیقات گوگل در مورد سیستمهای تبدیل متن به تصویر هوش مصنوعی نشان داده است که استفاده از مدلهای زبان بزرگتر، کلید ایجاد تصاویر با کیفیت بالاتر است. به علاوه تصاویری که بیشتر با توضیحات متن هماهنگ میشوند.
ابزار هوش مصنوعی Imagen روشی جالب و ساده برای ایجاد و ویرایش تصاویر با استفاده از هوش مصنوعی است. کاربران میتوانند از آن برای مقاصد شخصی یا حرفهای مانند ساختن میم، لوگو، پوستر، آگهی و غیره استفاده کنند. کاربران میتوانند تصاویر را با دوستان خود به اشتراک بگذارند.
ایزار هوش مصنوعی ایرانی ؛ زیگپ
برای دسترسی کاربران ایرانی به هوش مصنوعی و استفاده از امکانات متنوع آن، اپلیکیشن زیگپ راهاندازی شد. زیگپ یک دستیار هوش مصنوعی است که میتواند به عنوان یک راهنما، همهجا و همیشه همراه شما باشد.
با استفاده از زیگپ میتوان آموخت، سرگرم شد، محتوای جدی تولید کرد و در زمینه کار و امور روزمره از آن کمک گرفت. زیگپ با اتصال به موتور هوش مصنوعی ChatGPT و لئوناردو در حال حاضر و سایر دستیارهای هوش مصنوعی در آینده نزدیک، میخواهد تجربهای آسان و خوشایند از همزیستی با هوش مصنوعی را برای کاربران ایرانی فراهم کند.
دستیار هوش مصنوعی ایرانی Zigap با پشتیبانی همزمان از زبانهای انگلیسی و فارسی، به کاربران در تولید انواع محتوا، یادگیری و آموزش، حل مسائل و رفع اشکالات کمک میکند.