چه میشود اگر در نهایت، موشکهای بالستیک قارهپیما یا تغییرات آبوهوایی، نه با پاتوژنهای میکروسکوپی یا یک شهابسنگ بهاندازه کوه، بلکه با … متن کارمان را تمام کنند، چه؟ متن ساده، ساده، بدون تزئین، اما در مقادیر بسیار زیاد که غیرقابل تصور است – یک سونامی از متن به یک آب مروارید خود ماندگار از محتوا که از نظر عملکردی برقراری ارتباط قابل اعتماد را غیرممکن می کند. هر تنظیمات دیجیتال؟
رابطه ما با کلام نوشته شده اساساً در حال تغییر است. به اصطلاح هوش مصنوعی مولد از طریق برنامههایی مانند ChatGPT که از مدلهای زبان بزرگ یا LLM برای پیشبینی آماری حرف یا کلمه بعدی در یک دنباله استفاده میکنند، جملات و پاراگرافهایی را به دست میآورد که محتوای اسنادی را که در آن آموزش دیدهاند تقلید میکنند. . آنها چیزی شبیه تکمیل خودکار را به کل اینترنت آورده اند. در حال حاضر، مردم هنوز در حال تایپ دستورات واقعی برای این برنامهها هستند و به همین ترتیب، مدلها هنوز (بیشتر) به جای کارهای ماشینی خودشان، روی نثر انسانی آموزش میبینند.
اما شرایط ممکن است تغییر کند – همانطور که هفته گذشته یک API برای ChatGPT منتشر شد که به این فناوری اجازه می دهد مستقیماً در برنامه های کاربردی وب مانند رسانه های اجتماعی و خرید آنلاین ادغام شود. اکنون تصور تنظیمی آسان است که در آن ماشینها میتوانند ماشینهای دیگر را وادار کنند تا متنی را بینهایت منتشر کنند، و اینترنت را پر از متن مصنوعی بدون عامل یا هدف انسانی: گوه خاکستری، اما برای کلام مکتوب.
دقیقاً این سناریو قبلاً در مقیاس کوچک انجام شد، زمانی که ژوئن گذشته، یک نسخه بهینهسازی شده از GPT-J، یک مدل منبع باز، در صفحه پیام ناشناس 4chan وصله شد و 15000 پیام کاملاً سمی را در 24 ساعت ارسال کرد. فرض کنید شخصی سیستمی را برای برنامهای مانند ChatGPT راهاندازی میکند تا به طور مکرر از خود سؤال کند و خروجی را به طور خودکار در وبسایتها یا رسانههای اجتماعی منتشر کند. یک جریان تکراری بیپایان از محتوایی که چیزی بیشتر از اینکه مانع از سر راه همه شود، انجام نمیدهد، اما (ناگزیر) دوباره در مجموعههای آموزشی مدلهایی که محتوای جدید خود را در اینترنت منتشر میکنند جذب میشود. چه می شود اگر مقدار زیادی از مردم – خواه به انگیزه تبلیغات پول، یا برنامه های سیاسی یا ایدئولوژیک، یا فقط شیطنت – شروع به انجام این کار کنند، با صدها و سپس هزاران و شاید میلیون ها یا میلیاردها پست هر روز که سیل اینترنت باز را در بر می گیرد و با آنها در می آمیزد. نتایج جستجو، انتشار در پلتفرمهای رسانههای اجتماعی، نفوذ به مدخلهای ویکیپدیا، و مهمتر از همه، فراهم کردن علوفه برای استخراج نسلهای آینده سیستمهای یادگیری ماشینی؟ ناشران بزرگ در حال حاضر در حال آزمایش هستند: سایت خبری فناوری CNET ده ها داستان نوشته شده با کمک هوش مصنوعی را به امید جذب ترافیک منتشر کرده است که بیش از نیمی از آنها در یک نقطه حاوی خطا بودند. ما ممکن است به سرعت خود را با یک متن کاذب مواجه کنیم، جایی که زبان ماشیننویسی به هنجار تبدیل میشود و نثر نوشتهشده توسط انسان استثناست.
مانند قلمهای ارزشمند یک خوشنویس، یک سند انسانی آنلاین میتواند به امری نادر تبدیل شود که باید نگهداری، محافظت و نگهداری شود. در همین حال، زیربنای الگوریتمی جامعه بر پایه دانش متنی کار خواهد کرد که بیش از پیش مصنوعی است و منشأ آن در چرخش بیوقفه مدلهای زبانی است. آن را به عنوان یک رویداد هرزنامه سیارهای در حال انجام در نظر بگیرید، اما بر خلاف هرزنامه – که ما کم و بیش حفاظتهای موثری برای آن داریم – ممکن است ثابت شود که هیچ راه مطمئنی برای پرچمگذاری و فیلتر کردن نسل بعدی متنهای ماشینی وجود ندارد. “هر چیزی را که می خوانید باور نکنید” ممکن است تبدیل به “باور نکن”. هر چیزی شما می خوانید” وقتی آنلاین است.
این یک نتیجه طعنه آمیز برای متن دیجیتالی است که مدت هاست به عنوان یک قالب قدرتمند تلقی می شود. در دهه 1980، هکرها و علاقهمندان از مزیتهای فایل متنی تمجید کردند: یک سند ASCII که به راحتی در اتصالات ضعیف مودم که صحنه صفحه اعلانات Dial-up را به هم میپیوندند، بهراحتی جلو و عقب میرفت. اخیراً، طرفداران به اصطلاح محاسبات حداقلی، متن ساده را به عنوان قالبی با ردپای کربن کم تأیید کرده اند که به راحتی بدون توجه به محدودیت های پلت فرم قابل اشتراک گذاری است.
اما متن ساده نیز سادهترین قالب دیجیتالی برای خودکارسازی است. مردم از دهه 1950 این کار را به شکلی انجام می دهند. امروزه هنجارهای صنعت فرهنگ معاصر به خوبی در مسیر اتوماسیون و بهینه سازی الگوریتمی زبان نوشتاری قرار دارند. مزرعههای محتوایی که نثری با کیفیت پایین برای جذب ابزارهای تبلیغاتی مزاحم تولید میکنند، از این ابزارها استفاده میکنند، اما آنها همچنان به انبوهی از خلاقان کمکار یا بیکار وابسته هستند تا کاراکترها را در کلمات مناسب، کلمات در جملات خوانا، جملات در پاراگرافهای منسجم قرار دهند. هنگامی که خودکارسازی و افزایش آن نیروی کار ممکن شد، چه انگیزه ای برای مهار آن وجود خواهد داشت؟
ویلیام سفایر، که از اولین کسانی بود که ظهور «محتوا» را به عنوان یک مقوله اینترنتی منحصر به فرد در اواخر دهه 1990 تشخیص داد، همچنین شاید اولین کسی بود که به این نکته اشاره کرد که محتوا برای انجام اصول اولیه خود نیازی به هیچ ارتباطی با حقیقت یا دقت ندارد. تابع، که به سادگی وجود دارد. یا همانطور که کیت آیشهورن در کتاب اخیر خود درباره محتوا استدلال کرده است گردش کند. این به این دلیل است که اشتها برای “محتوا” حداقل به همان اندازه ایجاد اهداف جدید برای درآمد تبلیغاتی است که رزق واقعی برای مخاطبان انسانی است. این به معنای برنامههای تاریکتر، مانند نوع جنگ اطلاعاتی است که اکنون در سراسر حوزه ژئوپلیتیک جهانی شاهد آن هستیم. پژوهشگر هوش مصنوعی گری مارکوس سهولت ظاهری را نشان داد که با استفاده از آن مدلهای زبانی میتوانند روایتی نابسامان از 6 ژانویه 2021 ایجاد کنند، که میتواند به عنوان اطلاعات نادرست در مقیاس وسیع مورد استفاده قرار گیرد.
هنوز یک بعد دیگر در اینجا وجود دارد. متن محتوا است، اما نوع خاصی از محتوا است – اگر بخواهید، متا محتوا است. در زیر سطح هر صفحه وب، متنی (دستورالعملهایی با پرانتز یا کد) برای نحوه ظاهر و رفتار آن پیدا خواهید کرد. مرورگرها و سرورها با تبادل متن به یکدیگر متصل می شوند. برنامه نویسی به صورت متن ساده انجام می شود. تصاویر و ویدئو و صدا همگی با متنی به نام فراداده توصیف می شوند – برچسب گذاری شده اند. وب خیلی بیشتر از متن است، اما همه چیز در وب است متن است در برخی از سطوح اساسی
برای مدت طولانی، پارادایم اساسی همان چیزی است که ما آن را “وب خواندن و نوشتن” می نامیم. ما نه تنها محتوا مصرف میکردیم، بلکه میتوانستیم آن را تولید کنیم و از طریق ویرایشها، نظرات و بارگذاریها در ایجاد وب شرکت کنیم. ما اکنون در آستانه چیزی هستیم که بسیار شبیه به “وب نوشتن و نوشتن” است: وب در حال نوشتن و بازنویسی خود، و شاید حتی سیم کشی مجدد خود در این فرآیند (ChatGPT و همنوعانش می توانند به همان راحتی که نثر بنویسند، کد بنویسند.)
ما در اصل با بحرانی از هرزنامه های بی پایان، ادغام ناتوان کننده نویسندگی انسان و ماشین روبرو هستیم. از کتاب فین برانتون در سال 2013، هرزنامه: تاریخچه سایه ای از اینترنتما در مورد روشهای موجود برای انتشار محتوای جعلی در اینترنت، مانند وبسایتهای «دوطرفه» که دارای صفحاتی هستند که برای خوانندگان انسانی طراحی شدهاند و سایرین که برای خزندههای ربات که موتورهای جستجو را پر میکنند، بهینهسازی شدهاند، آشنا میشویم. پیامهای ایمیلی که بهعنوان مجموعهای از آثار ادبی معروف که از مجموعههای آنلاینی مانند پروژه گوتنبرگ جمعآوری شدهاند، تشکیل شدهاند، بهتر است از فیلترها عبور کنید (“litspam”). کل شبکه های وبلاگ ها پر از محتوای مستقل برای هدایت لینک ها و ترافیک (“splogs”). و «روزنامهنگاری الگوریتمی»، که در آن گزارشهای خودکار (در مورد موضوعاتی مانند امتیازات ورزشی، شاخص بورس و لرزشهای لرزهای) از طریق سیمها منتشر میشوند. برانتون همچنین منشأ باتنتهایی را که در چرخه انتخابات ۲۰۱۶ در ایالات متحده و برگزیت در بریتانیا بدنام شدند، توضیح میدهد.
همه این پدیدهها، اگر بگوییم هرزنامههای باغی ویاگرا که قبلاً چنین آزاردهنده بودند، توابعی از متن هستند – بیشتر از آن چیزی که ما میتوانیم تصور کنیم یا فکر کنیم، فقط کوچکترین تکههای آن توسط کره چشم انسان مشاهده شده است. با این حال، سرورها، کابلهای مخابراتی و مراکز داده را مسدود میکند: همانطور که برانتون میگوید: «120 میلیارد پیام در روز در موجی خاکستری از متن در سراسر جهان موج میزند و از فیلترها میگذرد، مثل مه دود».
ما اغلب در مورد اینترنت به عنوان شکوفایی بزرگ بیان و خلاقیت انسان صحبت کرده ایم. چیزی کمتر از یک “وب جهانی” از اتصالات مهیج نیست. اما یک استدلال بسیار قوی وجود دارد که احتمالاً در اواسط دهه 1990، زمانی که منافع شرکت ها شروع به ایجاد جای پای خود کردند، قبلاً در راه تبدیل شدن به چیزی بسیار متفاوت بود. نه فقط به معنای معمول تجاری سازی شده – بافت شبکه به موتوری برای استخراج سرمایه تبدیل شد. هرزنامه، با همه انواع گوناگون و تهدیدآمیزش، به ما می آموزد که وب مدتی است که خودش را نوشته است. اکنون همه منطق های لازم – تجاری، تکنولوژیکی و غیره – ممکن است در نهایت برای یک متن تسریع شده وجود داشته باشد.
«یک نیاز اضطراری برای کسی ایجاد شد که 300 کلمه از آن بنویسد [allegedly] چیزهای خنده دار برای شماره ای از @outsidemagazine که در حال بستن آن هستیم. من آن را روی کلیدهای Chiclet لپتاپم در نیمه اول Super Bowl *در حالی که* یک آبجو مینوشیدم، کوبیدم، الکس هرد، خارج ازمدیر تحریریه، توییت کرد ماه گذشته. “مطمئنا این بهترین ساعت من است.”
این توییت طنزی است که خود را تحقیرآمیز همراه با لحنی متواضعانه، کاملاً غیرقابل توجه و بی ضرر است. اما، هنگامی که داشتم این مقاله را می نوشتم، در فید من ظاهر شد، باعث توقف شد. نوشتن اغلب غیر جذاب است. کار است؛ این کاری است که باید انجام شود، حتی گاهی اوقات در طول یک بازی بزرگ. توییت هرد واقعیت بسیاری از نوشتهها را در حال حاضر به تصویر میکشد، مخصوصاً محتوای نوشتاری برای وب: وظیفه محور، تکمیل شده بر اساس مشخصات، تحت ضربالاجلها و فشار خارجی.
این میانهی عظیم نوشتن روزانه – محتوا – جایی است که هوش مصنوعی مولد در حال حاضر شروع به کار کرده است. اولین شاخص ادغام با نرم افزارهای پردازش کلمه است. ChatGPT در آفیس آزمایش خواهد شد. همچنین ممکن است به زودی در یادداشت های پزشک یا خلاصه وکیل شما باشد. همچنین احتمالاً یک شریک خاموش در چیزی است که قبلاً امروز آنلاین خوانده اید. باورنکردنی است که یک دانشگاه تحقیقاتی بزرگ تأیید کرده است که از ChatGPT برای نوشتن یک پیام ایمیل در سراسر دانشگاه در پاسخ به تیراندازی گسترده در ایالت میشیگان استفاده کرده است. در همین حال، سردبیر یک مجله علمی-تخیلی طولانی مدت دادههایی را منتشر کرد که نشان میدهد در اواخر سال گذشته، همزمان با عرضه ChatGPT، افزایش چشمگیری در ارسالهای اسپم شده وجود داشت. (روزها بعد مجبور شد بستن و آمازون شاهد هجوم عناوینی بوده است که ادعا میکنند ChatGPT «همنویسنده» در پلتفرم Kindle Direct خود است، جایی که صرفهجویی در مقیاس به این معنی است که حتی تعداد انگشت شماری از فروشها باعث کسب درآمد میشوند.
صرف نظر از اینکه یک متن تمام خودکار رخ دهد یا نه، روندها فقط در حال شتاب هستند. از یک داستان ژانر تخیلی گرفته تا گزارش پزشکتان، ممکن است همیشه نتوانید نویسنده بودن انسان را در پس هر آنچه می خوانید فرض کنید. نوشتن، و به طور خاص متن دیجیتال – به عنوان یک مقوله بیان انسانی – از ما بیگانه خواهد شد.
پنجره “Properties” برای سندی که من در آن کار می کنم، در مجموع 941 دقیقه ویرایش و حدود 60 ویرایش را فهرست می کند. یعنی بیش از 15 ساعت. کل پاراگرافها حذف، درج و دوباره حذف شدهاند – همه اینها حتی قبل از اینکه به یک ویرایشگر کپی یا یک حقیقتسنجی برسد.
آیا نگران این هستم که ChatGPT بتواند آن کار را بهتر انجام دهد؟ نه. اما من صبح نگرانم شاید مهم نباشد به عنوان داده های آموزشی برای نسل بعدی هوش مصنوعی مولد، سخنان من در اینجا نمی توانند به خود کمک کنند: آنها نیز سوخت فسیلی برای متنی آینده خواهند بود.
توسط فین برانتون
وقتی کتابی را با استفاده از لینک موجود در این صفحه خریداری می کنید، کمیسیون دریافت می کنیم. ممنون که حمایت میکنید اقیانوس اطلس.