آیا تا به حال به دنیای هوش مصنوعی AI سرک کشیدهاید؟ در شش ماه گذشته، چتباتهایی مانند ChatGPT و تولیدکنندههای تصویر مبتنی بر هوش مصنوعی مانند Midjourney، به سرعت به یک پدیده فرهنگی تبدیل شدهاند.
اما مدلهای هوش مصنوعی یا «یادگیری ماشینی» مدتی است که در حال تکامل هستند.
در این راهنمای ویژه افراد مبتدی، قرار است از دنیای چتباتها فراتر رفته تا گونههای مختلف هوش مصنوعی را کشف کنیم و ببینیم، این موجودات عجیب و غریب دیجیتالی چگونه در زندگی فعلی ما نقش دارند.
هوش مصنوعی چگونه یاد میگیرد؟
کلید اصلی یادگیری ماشینی، فرایندی است به نام آموزش، که در آن به یک برنامه کامپیوتری مقدار زیادی داده – گاهی اوقات با برچسبهایی که درباره ماهیت دادهها توضیح میدهند – و مجموعهای از دستورالعملها ارائه میشود.
دستورالعمل ممکن است چیزی شبیه این باشد: “همه تصاویر حاوی چهرهها را پیدا کن” یا “این صداها را دستهبندی کن”.
سپس برنامه هوش مصنوعی در دادههایی که برای دستیابی به این اهداف به آن داده شده است، الگوهایی را جستجو میکند.
برنامه ممکن است در طول مسیر یادگیری نیاز به هشدار گرفتن داشته باشد – مانند “این تصویر یک چهره نیست” یا “این دو صدا متفاوت هستند” – ، اما نهایتا از برایند دادهها و سرنخهایی که به آن میدهیم، میآموزد و به یک «مدل هوش مصنوعی» تبدیل میشود تا بتواند پس از اتمام مفاد آموزشی، تواناییهای خودش را نشان دهد.
یکی از راههای نگاه کردن به اینکه چگونه این فرایند آموزشی قادر است انواع مختلف هوش مصنوعی را ایجاد کند، فکر کردن به حیوانات مختلف است.
طی میلیونها سال، محیط طبیعی در قالب «تکامل»، منجر به رشد تواناییهای مختلف و خاص در حیوانات شده است. به همین ترتیب میلیونها چرخهای که یک هوش مصنوعی از طریق دادههای آموزشی خود انجام میدهد نیز مانند همان چرخه حیوانات، باعث تکامل آن و منجر به مدلهای تخصصیتر هوش مصنوعی میشود.
حال باید دید چه نمونههایی از نحوه آموزش دنیای هوش مصنوعی برای توسعه مهارتهای مختلف وجود دارد؟
چتبات چیست؟
چتبات را کمی شبیه به یک طوطی در نظر بگیرید. کار چتبات تقلید است و میتواند کلماتی را که شنیده است، با درک پیشزمینه آنها اما بدون درک کامل معنای آنها تکرار کند.
چتباتها هم همین کار را میکنند – البته در سطح پیچیدهتر – و در آستانه تغییر رابطه ما با کلام نوشتاری هستند.
اما این چتباتها از کجا میدانند که باید چگونه بنویسند؟
این چتباتها مبتنی بر نوعی از هوش مصنوعی هستند که به آنها میگوییم «مدلهای زبان بزرگ» (LLM). این مدلها با حجم عظیمی از متون آموزش داده شدهاند.
یک مدل زبان بزرگ قادر است نه تنها کلمات را به صورت جدا، که کل جملات را در نظر بگیرد و استفاده از کلمات و عبارات را در یک متن، با نمونههای دیگر موجود در دادههای آموزشی خود مقایسه کند.
با استفاده از این میلیاردها مقایسه بین کلمات و عبارات، میتوان یک سؤال را خواند و پاسخی را تولید کرد، شبیه به همان سازوکار پیشبینی کننده کلمات هنگام تایپ در گوشی شما، اما در مقیاس وسیع و پیچیدهتر.
نکته شگفتانگیز در مورد مدلهای زبان بزرگ این است که میتوانند قوانین دستور زبان را بیاموزند و خود معنای کلمات را بدون کمک انسان کشف کنند.
چشمانداز چتباتها
«من فکر میکنم در 10 سال آینده چتباتهایی خواهیم داشت که به عنوان یک متخصص، در هر حوزهای که بخواهید برایتان کار کنند. بنابراین میتوانید از یک پزشک متخصص، یک معلم متخصص یا یک وکیل متخصص، هرآنچه که نیاز دارید را بپرسید و از این سیستمها بخواهید کارهای شما را انجام دهند.»
سم آلتمن، مدیرعامل CHatGPT
آیا میتوان با هوش مصنوعی حرف زد؟
اگر از الکسا، سیری یا هر نوع دستیار صوتی هوشمند دیگری مانند ZIGAP استفاده کرده باشید، پس با هوش مصنوعی حرف زدهاید.
خرگوشی را با گوشهای بزرگش تصور کنید که برای ثبت تغییرات کوچک صدا سازگار شده است.
دنیای هوش مصنوعی صداها را هنگام صحبت کردن ضبط میکند، صدای پس زمینه را حذف، گفتار شما را به واحدهای آوایی جدا میکند و سپس آنها را با کتابخانهای از آواهای زبانی تطبیق میدهد.
سپس گفتار شما به متن تبدیل میشود، جایی که میتوان هرگونه خطای شنیداری را قبل از دادن پاسخ تصحیح کرد.
این نوع هوش مصنوعی به “پردازش زبان طبیعی” معروف است.
این همان فناوری است که پشت همه چیز است، از «بله» گفتن شما برای تایید یک تراکنش بانکی با موبایل، تا درخواست از تلفن همراهتان برای اطلاع از وضعیت آب و هوای چند روز آینده شهری که به آن سفر میکنید.
آیا هوش مصنوعی توان درک تصاویر را دارد؟
آیا گالری تصاویر تلفن همراه شما تا به حال بهتان پیشنهاد داده که تصاویر مربوط به غذا، طبیعت یا سلفیها را در فولدرهای مجزا و به همین نام برایتان ذخیره کند؟
این پیشنهاد که در اکثر گوشیهای امروز وجود دارد، ناشی از عملکرد هوش مصنوعی است. بدین معنا که یک الگوریتم هوش مصنوعی الگوهای عکسهای شما را کشف کرده و آنها را برای شما گروهبندی میکند.
این برنامهها با اقیانوسی از تصاویر موجود در اینترنت آموزش داده شدهاند و هر تصویر به سادگی با یک برچسب توضیح داده شده تا دنیای هوش مصنوعی بتواند ماهیت محتوای آن را درک کند.
اگر به یک هوش مصنوعی دستور تشخیص تصویر تصاویر با برچسب “دوچرخه” بدهید، شروع به بررسی ظاهر دوچرخه و تفاوت آن با وسایلی مانند قایق یا ماشین خواهد کرد.
حتی گاهی اوقات میتوان هوش مصنوعی را برای کشف تفاوتهای کوچک در تصاویر مشابه آموزش داد.
فناوری تشخیص چهره اینگونه عمل میکند؛ این فناوری رابطه ظریفی بین ویژگیهای صورت شما پیدا میکند که باعث تمایز چهره شما از چهره میلیاردها نفر انسان دیگر روی زمین است.
همین نوع الگوریتمها با اسکنهای پزشکی برای شناسایی تومورهای تهدیدکننده زندگی آموزش داده شدهاند و میتوانند زمانی که یک پزشک به تصمیمگیری نیاز دارد، هزاران اسکن انجام دهد.
هوش مصنوعی چگونه تصاویر جدید تولید میکند؟
اخیرا مدلهای هوش مصنوعی به شکلی آموزش دیدهاند که میتوانند همانند یک آفتابپرست، الگوها و رنگها را دستکاری کنند.
این هوشهای مصنوعی تولیدکننده تصویر میتوانند الگوهای بصری پیچیدهای را که از میلیونها عکس و طراحی جمعآوری کردهاند، به تصاویر کاملا جدید تبدیل کنند.
میتوانید از دنیای هوش مصنوعی بخواهید که تصویری مستندگونه از چیزی که هرگز اتفاق نیفتاده است تولید کند؛ مثلا انسانی که مشغول راه رفتن روی سطح مریخ است.
یا میتوانید فرایند ایجاد تصاویر را با خلاقیت هدایت کنید: پرتره ای از سرمربی فوتبال انگلیس بسازید که به سبک پیکاسو نقاشی شده است.
جدیدترین هوش مصنوعی فرایند تولید این تصویر جدید را با مجموعهای از پیکسلهای رنگی تصادفی آغاز میکند.
این مدل میتواند از این نقاط تصادفی برای ساخت اشیای مختلف طبق الگوهایی که در طول دوره آموزش آموخته است، استفاده کند.
این الگوها به آرامی با افزودن لایههای بیشتری از نقاط تصادفی، نقاطی که الگو را توسعه میدهند نگه داشته و سایرین را کنار میگذارند و بهبود میدهند تا در نهایت تصویر مورد نظر خلق شود.
به عنوان یک هوش مصنوعی مولد، اگر تمام الگوهای لازم مانند “سطح مریخ”، “فضانورد” و “راه رفتن” را با هم توسعه دهید، یک تصویر جدید خواهید داشت.
از آنجا که تصویر جدید از لایههایی از پیکسلهای تصادفی ساخته شده، حاصل کار ساخت تصویری است که قبلا هرگز وجود نداشته است، اما ساخت چنین تصویری هم همچنان مبتنی بر میلیاردها الگویی از تصاویر آموزشی اصلی است که قبلا توسط انسانها تولید شده است.
به همین دلیل در آینده نزدیک، با چالشهای عمیقی در حوزه کپیرایت مواجه خواهیم بود، چرا که معلوم نیست دنیای هوش مصنوعی برای ساخت تصاویر جدید، از کدامیک از آثار پیشتر تولیدشده الهام گرفته است.
جریان اتومبیلهای خودران مبتنی بر هوش مصنوعی چیست؟
اتومبیلهای خودران برای دههها بخش مهمی از گفتوگو پیرامون هوش مصنوعی بودهاند و داستانهای علمی-تخیلی زیادی بر مبنای این خودروها شکل گرفته است.
دنیای هوش مصنوعی خودران یعنی ارائه توانایی رانندگی خودمختار به یک خودروی مجهز به دوربین، رادار و لیزرهای حسگر.
سنجاقکی را در نظر بگیرید که دید 360 درجه و حسگرهایی روی بالهایش دارد که به او کمک میکند مانور داده و تنظیمات دائمی در حین پرواز انجام دهد.
به روشی مشابه، مدل هوش مصنوعی از دادههای حسگرهای خود برای شناسایی اشیا استفاده میکند و متوجه میشود که آیا آنها در حال حرکت هستند و اگر چنین است، چه نوع جسم متحرکی هستند: یک ماشین دیگر، یک دوچرخه، یک عابر پیاده یا چیز دیگری.
هزارانهزار ساعت آموزش برای درک یک رانندگی خوب و استاندارد، هوش مصنوعی را قادر میسازد تا بتواند در دنیای واقعی برای رانندگی ماشین و جلوگیری از برخورد ،صمیمگیری و اقدام کند.
الگوریتمهای پیشبینی ممکن است سالها برای مقابله با ماهیت عموما غیرقابل پیشبینیِ رانندگانِ انسانی تلاش کرده باشند، اما خودروهای بدون راننده اکنون میلیونها مایل داده را در جادههای واقعی جمعآوری کردهاند. مثلا در سانفرانسیسکو، این ماشینها در ازای پول مسافر جابجا میکنند.
رانندگی خودمختار همچنین یک مثال بسیار کلی از این موضوع است که چگونه فناوریهای جدید باید بر موانعی بیش از موانع فنی غلبه کنند.
قوانین دولتی و مقررات ایمنی، همراه با احساس عمیق اضطراب مسافری که در یک ماشین خودران نشسته و کنترل همه چیز را به آن سپرده، همگی از موانعی هستند که احتمالا در آینده هم باید با آنها دستوپنجه نرم کرد.
چشمانداز اتومبیلهای خودران
«من فکر میکنم چیزی که به آن نیاز داریم، وجود جادههای ایمنتر است. و بحث در مورد آینده واقعا جالب است، اکنون انسانها و رباتها به لحاظ توانایی رانندگی بسیار نزدیک هم هستند. اما در طی چند سال آینده – با توجه به میزان پیشرفتی که این سیستمها داشته اند – فکر میکنم رباتها بسیار بهتر از انسانها عمل خواهند کرد و اساسا بحثی در این زمینه در نخواهد گرفت.»
کایل وگت، مدیرعامل شرکت اتومبیلهای خودران «کروز»
هوش مصنوعی درباره ما چه میداند؟
برخی از انواع هوش مصنوعی به سادگی با اعداد سروکار دارند و آنها را جمعآوری و ترکیب می کنند تا مجموعهای از اطلاعات را ایجاد کنند که خروجی آن میتواند بسیار ارزشمند باشد.
احتمالا در حال حاضر چندین پروفایل از اقدامات مالی و اجتماعی شما وجود دارد، به ویژه اقدامات آنلاین، که میتواند برای پیشبینی رفتار شما مورد استفاده هوش مصنوعی قرار گیرد.
دنیای هوش مصنوعی میتواند رفتارهای خرید، عادات و سلیقههای شما در خرید را ردیابی کند. همچنین میزان موجودی حسابهای بانکی نیز از طریق کارتهای اعتباری قابل پیشبینی است.
نتفلیکس و آمازون در حال پیگیری چند ساعت محتوایی هستند که شب گذشته تماشا کردهاید. حسابهای رسانههای اجتماعی شما میدانند که امروز روی چند ویدیو نظر دادهاید.
و این فقط مربوط به شما نیست، این اعداد برای همه وجود دارد، و به مدلهای هوش مصنوعی اجازه میدهد تا از طریق رفتارها و فعالیتهای شما، ترندهای اجتماعی را بشناسد.
این مدلهای هوش مصنوعی در حال حاضر زندگی شما را شکل میدهند، از کمک به تصمیمگیری در مورد اینکه آیا میتوانید وام بگیرید یا حتی اثرگذاری بر آنچه که میخرید از طریق انتخاب و پخش تبلیغات آنلاین.
دنیای هوش مصنوعی و نیاز به شفافیت
«ما باید زبانی را برای صحبت در مورد مسائل پیچیده علمی و فناوری ایجاد کنیم. و یک راه برای انجام آن این است که بگوییم: لازم نیست تفاوت بین هوش مصنوعی محدود و مولد را بدانید، اما باید بتوانید انتظار داشته باشید که سیستمهای خودکار مورد استفاده در زندگی شما ایمن و موثر هستند؛ اینکه از دادههای شما محافظت میشود؛ و اینکه اگر قرار است سیستم برای شما تصمیمی بگیرید، باید در مورد نحوه استخراج این تصمیم به شما توضیح داده شود. سیستم باید شفاف باشد و درباره موضوع به شما اطلاعات بیشتری دهد.»
آلوندرا نلسون ، مدیر سابق دفتر سیاست علم و فناوری ایالات متحده، که طرحی برای منشور حقوق دنیای هوش مصنوعی در سال 2022 منتشر کرد.
آیا هوش مصنوعی میتواند همه کار انجام دهد؟
آیا میتوان برخی از این مهارتها را در یک مدل هوش مصنوعی ترکیبی ترکیب کرد؟
این دقیقا همان کاری است که یکی از جدیدترین پیشرفتهای هوش مصنوعی انجام میدهد.
این پدیده، دنیای هوش مصنوعی چندوجهی نامیده میشود و به یک مدل اجازه میدهد به انواع مختلف دادهها – مانند تصاویر، متن، صدا یا ویدیو – نگاه و الگوهای جدیدی را بین آنها کشف کند.
این رویکرد چندوجهی یکی از دلایل جهش عظیم در توانایی ChatGPT بود که مدل هوش مصنوعی آن از GPT3.5که فقط بر روی متن آموزش داده میشد، به GPT4 که با تصاویر نیز آموزش داده میشد، بهروز شد.
ایده یک مدل هوش مصنوعی که قادر به پردازش هر نوع داده و در نتیجه انجام هر کاری، از ترجمه بین زبانها تا طراحی داروهای جدید باشد، به عنوان هوش عمومی مصنوعی (AGI) شناخته میشود.
برای برخی، این هدف نهایی تمام تحقیقات دنیای هوش مصنوعی است. برای دیگران، این مسیری است برای رسیدن آن ویرانشهرهای آخرالزمانی علمی-تخیلی که در آن بشر هوشی بسیار فراتر از درک خود را تولید میکند که دیگر قادر به کنترل آن نخواهد بود.
هوش مصنوعی چگونه خودش یاد میگیرد؟
«یادگیری تحت نظارت» یک روش آموزشی فوقالعاده قدرتمند است که با نظارت انسان پیش میرود، اما بسیاری از پیشرفتهای اخیر در دنیای هوش مصنوعی با یادگیری بدون نظارت امکان پذیر شده است.
به عبارت سادهتر، اینجاست که استفاده از الگوریتمهای پیچیده و مجموعه دادههای عظیم به این معناست که هوش مصنوعی بدون هیچ راهنمایی انسانی هم میتواند یاد بگیرد.
ChatGPT ممکن است شناختهشدهترین مثال باشد.
حجم متون در اینترنت و کتابهای دیجیتالی آنقدر زیاد است که ChatGPT طی ماهها توانست یاد بگیرد که چگونه کلمات را به روشی معنادار به تنهایی ترکیب کند و سپس انسانها به تنظیم دقیق پاسخهای آن کمک کنند.
تصور کنید انبوهی از کتابهای خارجیزبان دارید که بعضی از آنها مصور هم هستند.
وقتی به زبان خارجی تسلط ندارید، در نهایت ممکن است متوجه شوید که هر زمان که نقاشی یا عکسی از یک درخت وجود داشت، همان کلمه روی یک صفحه ظاهر میشد و وقتی عکسی از یک خانه وجود داشت کلمه دیگری.
ChatGPT این نوع تحلیل دقیق از رابطه بین کلمات را انجام داد تا یک مدل آماری عظیم بسازد که سپس میتواند برای پیشبینی و تولید جملات جدید از آن استفاده کند.
این توانایی بر مقادیر عظیمی از قدرت محاسباتی متکی است که به هوش مصنوعی اجازه میدهد تا حجم زیادی از کلمات را به خاطر بسپارد – به تنهایی، در گروهها، در جملات و در سراسر صفحات – و سپس بارها و بارها و بارها و بارها و بارها در کسری از ثانیه آنها را بخواند و باهم مقایسه کند.
آیا باید نگران هوش مصنوعی باشیم؟
پیشرفتهای سریع مدلهای یادگیری عمیق در سال گذشته موجی از شور و شوق را برانگیخته است و همچنین منجر به افزایش نگرانی در مورد آینده دنیای هوش مصنوعی شده است.
بحثهای زیادی در مورد نحوه سوگیری در آموزش دادههای جمعآوریشده از اینترنت – مانند سخنان نژادپرستانه، جنسیتی و خشونتآمیز یا دیدگاههای فرهنگی محدود- منجر به تکرار تعصبات انسانی توسط هوش مصنوعی میشود.
نگرانی دیگر این است که دنیای هوش مصنوعی میتواند بدون در نظر گرفتن اصول اخلاقی یا پیامدهای گستردهتر اقداماتش، مسائل را حل کند و مشکلات جدیدی در این فرایند ایجاد کند.
در محافل هوش مصنوعی، پس از یک آزمایش فکری توسط فیلسوف «نیک بوستروم»، این مسئله به عنوان «مسئله تولید حداکثری گیره کاغذ» شناخته شد.
این فیلسوف در این مسئله تصور کرد اگر از یک هوش مصنوعی بخواهیم تا هرچه در توان دارد گیره کاغذ تولید کند، ممکن است تمام منابع طبیعی روی کره زمین را به قصد انجام این ماموریت مصرف کند و حتی حیوانات و انسانها را هم برای فراهم کردن ماده اولیه گیره کاغذ بکشد!
دیگران میگویند که به جای تمرکز بر هوشهای مصنوعی مرگبار آینده، ما باید بیشتر نگران این مشکل فوری باشیم که چگونه مردم میتوانند از ابزارهای هوش مصنوعی موجود، برای افزایش بیاعتمادی به سیاست و بدبینی نسبت به انواع رسانهها استفاده کنند.
بهویژه، چشم جهان به انتخابات ریاست جمهوری 2024 در ایالات متحده است تا ببیند رایدهندگان و احزاب سیاسی چگونه با سطح جدیدی از اطلاعات نادرست پیچیده کنار میآیند.
چه اتفاقی میافتد اگر رسانههای اجتماعی مملو از ویدئوهای جعلی از نامزدهای ریاستجمهوری شوند که با دنیای هوش مصنوعی ساخته و هر کدام برای خشمگین کردن گروه متفاوتی از رایدهندگان طراحی شدهاند؟
در اروپا، اتحادیه اروپا در حال ایجاد یک قانون هوش مصنوعی برای محافظت از حقوق شهروندان خود با تنظیم استقرار هوش مصنوعی است – به عنوان مثال، ممنوعیت استفاده از تشخیص چهره برای ردیابی یا شناسایی افراد در زمان واقعی در فضاهای عمومی.
اینها جزو اولین قوانینی در جهان هستند که دستورالعملهایی را برای استفاده آینده از این فناوریها تعیین میکنند – تعیین مرزهایی برای آنچه شرکتها و دولتها اجازه انجام آن را خواهند داشت یا نمیتوانند انجام دهند. با توجه به رشد قابل توجه قابلیتهای دنیای هوش مصنوعی، انتظار میرود این قوانین بیشتر و بیشتر شوند.