هوش مصنوعی

آیا موتورهای جستجو می‌توانند محتوای هوش مصنوعی را شناسایی کنند؟

سرفصل‌های مقاله

ابزار هوش مصنوعی در سال گذشته به طور چشمگیری بر کار دیجیتال مارکترها، به ویژه آنهایی که در سئو هستند، تأثیر گذاشته است. با توجه به ماهیت زمان‌بر و پرهزینه تولید محتوا، مارکترها به سمت محتوای هوش مصنوعی رفته‌اند که نتایج متفاوتی را به همراه داشته است.

اما یک سوال در این زمینه بارها و بارها مطرح می‌شود “آیا موتورهای جستجو می‌توانند محتوای تولید شده با هوش مصنوعی را شناسایی کنند؟”

این سوال بسیار مهم است زیرا اگر پاسخ “خیر” باشد، بسیاری از سوالات دیگر در مورد اینکه آیا و چگونه باید از هوش مصنوعی در تولید محتوا استفاده شود بی‌معنی می‌شود.

تاریخچه محتوای تولید شده توسط ماشین

محتوای تولید شده توسط ماشین
تاریخچه محتوای تولید شده توسط ماشین

در حالی که محتوای تولید شده توسط ماشین یا به کمک آن رشد بسیار زیادی داشته، اما اینکار کاملاً جدید نبوده و همیشه منفی نیست. برای وب‌سایت‌های خبری، ابتدا انتشار اخبار ضروری است و آنها مدت‌هاست که از داده‌های منابع مختلف مانند بازارهای سهام و لرزه‌ نگارها … برای سرعت بخشیدن به تولید محتوا استفاده می‌کنند.

به عنوان مثال، انتشار یک مقاله تولید شده توسط ماشین که می‌گوید: «زمین‌لرزه‌ای [به بزرگی] در [محل، شهر] در [زمان]/[تاریخ] صبح امروز شناسایی شد، اولین زمین‌لرزه از [تاریخ آخرین رویداد]. اخبار بیشتر را دنبال کنید.»

به‌روزرسانی‌هایی مانند این برای خواننده نهایی که باید این اطلاعات را در اسرع وقت به دست آورد نیز مفید است.

چگونه LLM‌ها می‌توانند ارزش افزوده تولید کنند؟

محبوبیت محتوای هوش مصنوعی که توسط مدل‌های زبان بزرگ (LLM) درست شده، مانند ChatGPT، افزایش یافته است. حالا بدون اینکه به جزئیات فنی بپردازیم، چند نکته مهم که در مورد این ابزارها وجود دارد را بررسی می‌کنیم.

  • متن تولید شده بر اساس توزیع احتمال است : به عنوان مثال، اگر بنویسید: «سئوکار بودن سرگرم کننده است زیرا…»، LLM به تمام نکات دقت می‌کند و سعی دارد کلمه بعدی را بر اساس مجموعه آموزشی خود محاسبه کند.
  • ChatGPT نوعی هوش مصنوعی مولد است : این بدان معنی است که خروجی قابل پیش بینی نیست. یک عنصر تصادفی وجود دارد، و ممکن است به یک درخواست یکسان، متفاوت پاسخ دهد. وقتی به این دو نکته توجه کنید، مشخص می‌شود که ابزارهایی مانند ChatGPT هیچ دانش سنتی ندارند. این کاستی اساس همه خطاها یا به اصطلاح “توهم” است.

خروجی‌های متعدد نشان می‌دهد که چگونه این رویکرد می‌تواند نتایج نادرستی ایجاد کند و باعث شود که ChatGPT به طور مکرر با خود تناقض داشته باشد.

نشریات بزرگی مانند Men’s Health و CNET هم در مقالات خود از محتوای اشتباهی که توسط هوش تولید شده بود، استفاده کردند که این اتفاق نگرانی‌ها در مورد آن را بیشتر می‌کند. البته این فقط مشکل ناشران نبوده، زیرا گوگل هم در کنترل محتوای هوش مصنوعی مشکل داشته است.

تشخیص محتوای هوش مصنوعی

تشخیص محتوای هوش مصنوعی کار آسانی نیست. و با تغییر جزئی در متن تولید شده توسط A.I می‌توان دیگران را گمراه کرد. اینکار زمانی منجر به سردرگمی می‌شود که نتوان درصد متن تولید شده را مشخص کرد، به عنوان مثال، “75٪ هوش مصنوعی / 25٪ انسان”.

بسیاری از مردم این را به اشتباه متوجه می‌شوند که «متن 75 درصد توسط هوش مصنوعی و 25 درصد توسط یک انسان نوشته شده است»، در حالی که به این معنی است که یک هوش مصنوعی 100 درصد این متن را نوشته است. به عنوان مثال، استفاده از یک علامت تعجب دوتایی (!!) یک ویژگی بسیار انسانی است، بنابراین افزودن آن به برخی از متن‌های تولید شده توسط هوش مصنوعی باعث می‌شود که یک محتوای هوش مصنوعی امتیاز «99%+ انسان» را بگیرد.

متأسفانه، این نتیجه‌گیری گمراه‌کننده مبنی بر انسانی بودن، محتوای هوش مصنوعی معمولاً به صاحبان وب‌سایت‌ها احساس امنیت کاذب می‌دهد.

سیاست‌ها و اقدامات گوگل در مورد محتوای هوش مصنوعی

اظهارات گوگل در مورد محتوای هوش مصنوعی به اندازه کافی مبهم بوده است. راهنمای به‌روزرسانی‌شده امسال که در Google Search Central منتشر شد به صراحت می‌گوید:

تمرکز ما بر کیفیت محتواست، نه اینکه چگونه محتوا تولید می‌شود.

واضح است که گوگل بیشتر به خروجی اهمیت می‌دهد تا ابزار رسیدن به آن. مبارزه با دستکاری SERP چیزی است که گوگل سال‌ها در آن تجربه دارد و ادعا می‌کند که پیشرفت‌های سیستم‌ آن‌ها، مانند SpamBrain، تا ۹۹ درصد جستجوها را بدون هرزنامه تبدیل کرده است، که شامل هرزنامه UGC، scraping، cloaking و تمام اشکال مختلف محتوا می‌شود.

بسیاری از مردم تست‌هایی را انجام داده‌اند تا ببینند گوگل چگونه به محتوای هوش مصنوعی واکنش نشان می‌دهد و کیفیت را در کجا مشخص می‌کنند. قبل از راه‌اندازی ChatGPT، شخصی یک وب‌سایت با 10000 صفحه محتوا ایجاد کرد که عمدتاً توسط یک مدل GPT3 بدون نظارت تولید می‌شد و از مردم نیز درباره بازی‌های ویدیویی سؤال می‌کرد.

با کمترین لینک، سایت به سرعت ایندکس شد و به طور پیوسته رشد کرد و هزاران بازدید کننده ماهانه داشت. طی دو به‌روزرسانی سیستم گوگل در سال 2022، به‌روزرسانی محتوای مفید و آپدیت اسپم بعدی، Google به طور ناگهانی و تقریباً به صورت کامل سایت را از بین برد.

AI test website

البته نتیجه گیری اینکه “محتوای هوش مصنوعی کار نمی‌کند” از چنین آزمایشی اشتباه است. با این حال، اینکار نشان داد که در آن زمان خاص، گوگل: محتوای GPT-3 بدون نظارت را به عنوان «کیفیت» طبقه‌بندی نمی‌کرد و می‌تواند چنین نتایجی را با تعداد زیادی سیگنال دیگر شناسایی و حذف کند.

برای دریافت پاسخ درست، به یک سوال بهتر نیاز دارید

بر اساس دستورالعمل‌های گوگل، آنچه ما در مورد سیستم‌های جستجو، آزمایش‌های سئو و عقل سلیم می‌دانیم، این سوال که “آیا موتورهای جستجو می‌توانند محتوای هوش مصنوعی را شناسایی کنند؟” احتمالا سوال اشتباهی است. چون در بهترین حالت، این یک دیدگاه بسیار کوتاه مدت است.

در اکثر موضوعات، LLM‌ها برای تولید مداوم محتوای “با کیفیت بالا” از نظر دقت واقعی و رعایت معیارهای E-E-A-T گوگل، با وجود داشتن دسترسی زنده به وب برای اطلاعات فراتر از داده‌های آموزشی خود، در تلاش هستند. هوش مصنوعی گام‌های مهمی در ایجاد پاسخ‌هایی برای پرسش‌هایی که قبلاً محتوای کمی داشتند، برداشته است. اما از آنجایی که گوگل به دنبال اهداف بلندمدت‌تری با SGE است، این روند ممکن است کمرنگ شود.

نظر شما در مورد محتوای هوش مصنوعی چیست؟ آیا تشخیص کامل آن در آینده ممکن است؟ شما می‌توانید همین حالا از طریق زبان فارسی به موتور‌های هوش مصنوعی مولد مانند ChatGPT و سرویس تبدیل متن به عکس لئوناردو دسترسی پیدا کنید. تنها کافی است اپلیکیشن زی‌گپ را دانلود و به راحتی از آن استفاده کنید. همچنین شما می‌توانید نظرات خود را با ما و سایر کاربران در شبکه‌های اجتماعی ما در اینستاگرام و تلگرام به اشتراک بگذارید.

نوید رضایی
نوید رضایی